數(shù)據(jù)思維:從數(shù)據(jù)分析到商業(yè)價(jià)值是一份商業(yè)分析和數(shù)據(jù)科學(xué)領(lǐng)域入門級(jí)趣味讀物,本書可以被看作商業(yè)分析(business analytics)領(lǐng)域入門級(jí)通俗且有趣的讀物,深入淺出,雅俗共賞。
文檔說明
主要由五章組成。第一章介紹了熊大樸素的數(shù)據(jù)價(jià)值觀,解讀數(shù)據(jù)與價(jià)值的邏輯關(guān)系;第二章介紹了基本的數(shù)據(jù)可視化方法(統(tǒng)計(jì)圖表)的規(guī)范與有趣應(yīng)用;第三章介紹了回歸分析,通過精彩案例展示了如何將一個(gè)業(yè)務(wù)問題定義成為一個(gè)數(shù)據(jù)可分析問題;第四章介紹了機(jī)器學(xué)習(xí),可以看作是第三章技術(shù)上的一個(gè)重要補(bǔ)充;第五章展示了各種常見的非結(jié)構(gòu)化數(shù)據(jù)分析(文本、圖像)的有趣案例。
學(xué)習(xí)特點(diǎn)
本書的核心觀點(diǎn)是其樸素的數(shù)據(jù)價(jià)值觀,即數(shù)據(jù)產(chǎn)業(yè)實(shí)踐不是單純的數(shù)據(jù)分析與建模,而是要在一個(gè)產(chǎn)業(yè)環(huán)境下,讓數(shù)據(jù)產(chǎn)生價(jià)值。事實(shí)上,從數(shù)據(jù)分析到商業(yè)價(jià)值的實(shí)現(xiàn)至少涉及三個(gè)關(guān)鍵環(huán)節(jié):數(shù)據(jù)業(yè)務(wù)定義(把一個(gè)具體業(yè)務(wù)問題定義成一個(gè)數(shù)據(jù)可分析問題)、數(shù)據(jù)分析與建模(描述統(tǒng)計(jì)、數(shù)據(jù)可視化、回歸分析、機(jī)器學(xué)習(xí))、數(shù)據(jù)業(yè)務(wù)實(shí)施(流程改造、產(chǎn)品設(shè)計(jì)、標(biāo)準(zhǔn)制定、重構(gòu)商業(yè)模式等),第一和第二環(huán)節(jié)屬于數(shù)據(jù)分析,第三環(huán)節(jié)屬于商業(yè)價(jià)值實(shí)現(xiàn)。
首先,數(shù)據(jù)業(yè)務(wù)定義是要把“業(yè)務(wù)問題”定義成“數(shù)據(jù)可分析問題”。只有把業(yè)務(wù)問題準(zhǔn)確定義成一個(gè)數(shù)據(jù)可分析的問題,數(shù)據(jù)分析與建模才能有用武之地。什么樣的問題可以被看作數(shù)據(jù)可分析問題?你需要找到兩種變量:第一種是因變量Y:因?yàn)閯e人的改變而改變的變量,這是業(yè)務(wù)的核心訴求;第二種是自變量X:用來解釋因變量Y的相關(guān)變量,通俗點(diǎn)說,自變量X的改變,影響了因變量Y的變化。X表現(xiàn)了數(shù)據(jù)分析者對(duì)業(yè)務(wù)的洞見。
其次,數(shù)據(jù)分析與建模是根據(jù)已經(jīng)確定的因變量Y和自變量X(數(shù)量可以是多個(gè)),判斷好Y和X的相關(guān)性方向,并評(píng)估好各X變量的權(quán)重,進(jìn)行建模。通過數(shù)據(jù)可視化(柱狀圖、餅圖、直方圖等)、回歸分析(線性回歸、0—1回歸、定序回歸等)、機(jī)器學(xué)習(xí)(決策樹、回歸樹、深度學(xué)習(xí)等)和非結(jié)構(gòu)化數(shù)據(jù)(中文文本、網(wǎng)絡(luò)結(jié)構(gòu)數(shù)據(jù)、圖像數(shù)據(jù)等)等分析工具對(duì)已有的巨量數(shù)據(jù)進(jìn)行處理,提取出業(yè)務(wù)訴求因變量Y的相關(guān)影響因素自變量X,并建立可以對(duì)業(yè)務(wù)起到促進(jìn)作用的模型,指導(dǎo)實(shí)際生產(chǎn)工作。
最后,數(shù)據(jù)業(yè)務(wù)實(shí)施是根據(jù)數(shù)據(jù)分析和建模的結(jié)果進(jìn)行流程再造和產(chǎn)品改進(jìn),實(shí)現(xiàn)數(shù)據(jù)的商業(yè)價(jià)值。即使數(shù)據(jù)分析德再好、模型建立得再漂亮,如果無法落地成為可被執(zhí)行的數(shù)據(jù)產(chǎn)品,那數(shù)據(jù)的商業(yè)價(jià)值還是沒有實(shí)現(xiàn)。商業(yè)價(jià)值三要素:收入、支出、風(fēng)險(xiǎn),在這三個(gè)方面中的任何一個(gè)方面實(shí)現(xiàn)可量化的改進(jìn),即提高收入、減少支出或減小風(fēng)險(xiǎn),那么這個(gè)數(shù)據(jù)的商業(yè)價(jià)值就比較容易說清楚,否則非常困難。