作者:何明科

消費(fèi)品企業(yè)應(yīng)該如何使用內(nèi)部產(chǎn)生以及外部采集的數(shù)據(jù),像互聯(lián)網(wǎng)公司一樣建立用戶畫像與會員體系,以數(shù)據(jù)驅(qū)動的方式進(jìn)行精細(xì)化的生產(chǎn),運(yùn)營和銷售?

傳統(tǒng)的管理咨詢公司,雖然有無數(shù)頂尖的大腦,但是他們的大腦只靠Excel等簡單工具的輔助,這樣的算力,能不能滿足上述的需求?

在2015年上半年,我們團(tuán)隊(duì)有幸為國內(nèi)一家時尚消費(fèi)品行業(yè)的龍頭公司進(jìn)行數(shù)據(jù)平臺的建設(shè),歷時半年,完成了內(nèi)部數(shù)據(jù)的打通和洞察,用戶畫像,會員體系的搭建,以及外部數(shù)據(jù)獲取與跟蹤。在這里和大家分享我自己的一些體會,希望更多的消費(fèi)品企業(yè)可以用數(shù)據(jù)驅(qū)動的方式來進(jìn)行精細(xì)化的運(yùn)作。

其實(shí)作為龍頭消費(fèi)品企業(yè),其數(shù)據(jù)生產(chǎn)能力與中等規(guī)模的互聯(lián)網(wǎng)公司不相上下,支撐日常業(yè)務(wù)的IT系統(tǒng)大大小小共有十余個,比如:

1)分銷系統(tǒng): 支撐全國上千家線下門店每日的銷售配貨,每日訂單量在數(shù)十萬量級;

2)電商訂單系統(tǒng): 負(fù)責(zé)處理十余個主流電商(京東,天貓,唯品會,一號店,聚美,亞馬遜,當(dāng)當(dāng)網(wǎng),有贊等)的訂單管理與客服;

3)倉庫管理系統(tǒng),負(fù)責(zé)全國各大區(qū)域的倉儲物流,數(shù)千個SKU的備貨情況;

4)BI系統(tǒng): 負(fù)責(zé)各主要業(yè)務(wù)系統(tǒng)的數(shù)據(jù)聚合,制成日常統(tǒng)計報表;外加大大小小的財務(wù)系統(tǒng),人力系統(tǒng),績效系統(tǒng),品牌/分公司訂貨系統(tǒng)等,每日產(chǎn)生的數(shù)據(jù)維度以及量級其實(shí)已經(jīng)相當(dāng)龐大。

但和互聯(lián)網(wǎng)公司相比,消費(fèi)品企業(yè)的數(shù)據(jù)消費(fèi),數(shù)據(jù)分析能力存在明顯的短板。越來越多的管理層也十分希望像互聯(lián)網(wǎng)公司一樣管理用戶和數(shù)據(jù),使用數(shù)據(jù)驅(qū)動他們的決策。

面對這樣龐雜而分散的數(shù)據(jù)以及對快速實(shí)時產(chǎn)生數(shù)據(jù)的渴求,不僅傳統(tǒng)企業(yè)的IT及經(jīng)營分析部門束手無策,再高端的管理咨詢公司也只能撓撓頭說“臣妾做不到呀”,實(shí)在是超越了這群聰明人大腦的算力。

接下來會從三個角度分享如何為傳統(tǒng)行業(yè)搭建數(shù)據(jù)平臺,首先介紹大數(shù)據(jù)(數(shù)據(jù)科學(xué))與商業(yè)智能(BI)在消費(fèi)品領(lǐng)域的應(yīng)用,然后詳細(xì)講解用戶畫像與用戶體系搭建,最后分享如何利用外部數(shù)據(jù)(電商,社交媒體)對行業(yè)趨勢與其他企業(yè)的運(yùn)營進(jìn)行監(jiān)控。

在這里面所用到的數(shù)據(jù)相關(guān)的技術(shù),已經(jīng)大大超越管理咨詢顧問的算力。如同封面圖中的《魔戒》水晶球Palantiri,它如同數(shù)據(jù)技術(shù)賦予了人類及精靈看到任何地方的能力。而傳統(tǒng)的人類,無論如何提高人肉的眼力,也只能到目力所及的有限范圍。

1、大數(shù)據(jù)和商業(yè)智能(BI)

我們很少說自己是一家大數(shù)據(jù)公司,因?yàn)榇髷?shù)據(jù)這三個字的意義更多是指一種概念和思維方式,并沒有什么具體的含義,既不是一種工作也不是一種技術(shù),可能勉強(qiáng)算得上是一些門檻稍高的,和數(shù)據(jù)科學(xué)有關(guān)的算法,技術(shù)以及工具的統(tǒng)一稱謂,比如數(shù)據(jù)挖掘(聚類,關(guān)聯(lián)),機(jī)器學(xué)習(xí)(邏輯回歸,神經(jīng)網(wǎng)絡(luò)),比如自然語言處理,比如分布式運(yùn)算(Hadoop, Spark)。但在服務(wù)具體企業(yè)的時候,我們難免會被套上大數(shù)據(jù)的殼子,畢竟大家都在找能做“大數(shù)據(jù)”的公司。相比大數(shù)據(jù),Business Inteligence(BI)的歷史就要久遠(yuǎn)許多,在各大軟件廠商的不斷教育下,大中型公司幾乎都采購了BI軟件。其實(shí)BI也是一個比較寬泛的概念,和大數(shù)據(jù)一樣包含了許許多多的技術(shù)和工具,像是數(shù)據(jù)倉庫,OLAP cubes,Data Mart,Star schema,數(shù)據(jù)挖掘等等。那么他們究竟是不是同一個東西呢?

1.1 商業(yè)智能(BI)

其實(shí)軟件廠商所提供的BI軟件與廣義的BI概念還是有很大程度的區(qū)別。為了追求高度的抽象化與通用性,BI軟件大部分時間所承擔(dān)的責(zé)任是一家公司的各類報表應(yīng)用:將各個IT系統(tǒng)的數(shù)據(jù)聚合至BI,然后進(jìn)行統(tǒng)計匯總,并統(tǒng)一在前端通過BI portal呈現(xiàn)出圖表與數(shù)值,便于業(yè)務(wù)人員了解日常數(shù)據(jù)和運(yùn)營情況。所以除了ETL部分以外,BI軟件絕大多數(shù)的功能都是通用性極強(qiáng)的,跨行業(yè),非定制化。

ETL,是英文 Extract-Transform-Load 的縮寫,用來描述將數(shù)據(jù)從來源端經(jīng)過抽取(extract)、轉(zhuǎn)換(transform)、加載(load)至目的端的過程。其實(shí)傳統(tǒng)的消費(fèi)品企業(yè)面對零散的數(shù)據(jù)庫,特別需要ETL的服務(wù)。

ETL看似低端,其實(shí)當(dāng)今的大數(shù)據(jù)頂尖企業(yè)Palantir,在最初為CIA服務(wù)的時候,也是從ETL開始的,讓美帝特工不用在分散的多個數(shù)據(jù)庫上分別做一次查詢。

這也就決定了BI軟件的sweet spot在于監(jiān)控和繪制通用性的統(tǒng)計報表,比如時間序列統(tǒng)計,分布統(tǒng)計,分段統(tǒng)計等等。圖1展示了這家消費(fèi)品企業(yè)兩年間平均價格變動與總銷量的時間序列,可以看出銷量兩年來穩(wěn)步增長,有小周期性(一二月份賣得少,換季的月份賣得多),而賣出商品的價格兩年保持基本一致,并呈明顯周期性變化(對于時尚消費(fèi)品,冬款的造價自然要高出夏款許多)。圖2展示了集團(tuán)旗下各品牌的銷量分布和占比,可見此集團(tuán)有一個相當(dāng)強(qiáng)悍的主品牌,以及2-3個在垂直領(lǐng)域表現(xiàn)不菲的子品牌,定期輸出銷量分布,可以監(jiān)控各品牌的發(fā)展情況并衡量品牌策略是否成功。

BI軟件的強(qiáng)項(xiàng)是將這些業(yè)務(wù)數(shù)據(jù)匯總起來,無需編程即可繪制出可供長期監(jiān)控的可視化報表,同時實(shí)現(xiàn)隨時更新,而不是傳統(tǒng)管理咨詢的一份靜態(tài)報告。傳統(tǒng)咨詢提供的報告,往往在出爐的第一天就過時了。

1.2 數(shù)據(jù)科學(xué)

反觀數(shù)據(jù)科學(xué),如果站在一個數(shù)據(jù)工程師的立場上,BI軟件做的事情其實(shí)也屬于數(shù)據(jù)分析的范疇,任何數(shù)據(jù)洞察,數(shù)據(jù)挖掘工作都需要涉及到這些通用維度的基本統(tǒng)計。但在這種淺層分析的基礎(chǔ)之上,數(shù)據(jù)科學(xué)家可以通過帶入較強(qiáng)的人為干預(yù)和行業(yè)性輸入,做到許多高于BI的數(shù)據(jù)洞察。而將這些洞察落地,運(yùn)用至具體產(chǎn)品設(shè)計,營銷方案,會員體系和售后服務(wù)中,便可以像互聯(lián)網(wǎng)公司一樣,實(shí)現(xiàn)以數(shù)據(jù)驅(qū)動業(yè)務(wù)。

舉一個實(shí)際的例子,圖3是用戶重復(fù)購買間隔的CDF曲線(Cumulative distribution function)。橫坐標(biāo)代表天數(shù),縱坐標(biāo)代表百分比。數(shù)據(jù)顯示,有37%的用戶在第一次購買后的一個月(30天)內(nèi)會進(jìn)行第二次購買,而45%的用戶在第二次購買后的一個月內(nèi)進(jìn)行了第三次購買,51%的用戶在第三次購買后的一個月內(nèi)進(jìn)行了第四次購買。隨著購買次數(shù)的增加,CDF曲線向左傾斜,也就意味著用戶在建立了品牌認(rèn)知后,購買頻率顯著增高,兩次購買之間的間隔明顯縮短。因此,誘發(fā)新用戶建立品牌意識,進(jìn)行二次購買的窗口為3-4個月的換季檔,而對老客戶的消費(fèi)喚醒窗口期則更短,以1-2個月為最優(yōu)。這是一個很典型的數(shù)據(jù)工程師利用自己的行業(yè)知識和經(jīng)驗(yàn)來實(shí)現(xiàn)數(shù)據(jù)洞察的例子,也是BI軟件無法做到的。首先研究復(fù)購間隔是消費(fèi)品行業(yè)獨(dú)有的場景,更重要的是想要完成這個洞察,其中所涉及的統(tǒng)計工作具有很強(qiáng)的定制性,也較為復(fù)雜,需要編寫統(tǒng)計腳本或是使用多條復(fù)合SQL來實(shí)現(xiàn),數(shù)據(jù)工程師的價值也在此有了體現(xiàn)。

除了復(fù)雜和高定制性的統(tǒng)計邏輯外,對于非結(jié)構(gòu)化數(shù)據(jù)的處理和挖掘也并非BI軟件的強(qiáng)項(xiàng)。對于大型消費(fèi)品公司來說,全電商渠道的運(yùn)營已經(jīng)成了常態(tài),每日來自京東,天貓,唯品會,一號店,聚美這些大型電商平臺的訂單數(shù)高達(dá)數(shù)萬個。而這些訂單中的郵寄地址里包含了巨大的信息量,比如用戶所在的城市,地理位置,甚至是身份,職業(yè),消費(fèi)能力等等。通過程序和地圖API將這些郵寄地址轉(zhuǎn)化為經(jīng)緯度后,可以對用戶群做大量的精細(xì)研究。圖4便是我們利用送貨地址做的用戶群分布的熱力圖,以北京的海淀區(qū)為例,大量的用戶密集集中在中關(guān)村周邊,其次便是各大高校宿舍聚集的區(qū)域,如五道口,知春路等地。紅色標(biāo)簽為品牌線下店鋪位置,可見門店已經(jīng)覆蓋了中關(guān)村,北京大學(xué)和五道口等地,但對于知春路片區(qū),以及用戶相對集中的牡丹園并未開設(shè)分店。相比之下安貞里分店四周并沒有特別多的目標(biāo)用戶群出沒。于是有了圖4的用戶分布及店鋪選址。

熱力圖這樣的算力往往超過了管理咨詢公司的能力范圍,然而對于用戶的選址卻是很有價值。

對于一些并無日常監(jiān)控必要的統(tǒng)計,有時也會貢獻(xiàn)許多有價值的洞察。圖5展示了線上用戶購買時間的分布情況??梢钥吹贸?,周末線上購物的時間十分均勻,除了半夜之外大部分時間段都有網(wǎng)購發(fā)生。相比之下工作日的線上購物時間分布就變得十分有趣,大量的訂單集中產(chǎn)生在早上九點(diǎn)和十點(diǎn)之間,也就是說大量的時尚白領(lǐng)在上班途中,或是步入辦公室后的第一件事便是敗一件自己心儀的寶貝,然后才能心情舒暢地開始一天的工作。那么不管是自營電商促銷,短信推廣,還是各宣傳陣地的推送,工作日早上8點(diǎn)至10點(diǎn)都是一個不錯的窗口。

和圖5類似,圖6將線上用戶的購買數(shù)據(jù)按照一周七天進(jìn)行分布統(tǒng)計,也會出現(xiàn)一些有意思的現(xiàn)象,比如周六周日上網(wǎng)買東西的用戶極少,每周網(wǎng)購的高峰出現(xiàn)在周一和周二?;蛟S上班族們都是通過線上血拼來撫慰自己,治愈周一綜合征的。而越臨近周末,大家在線買東西的熱情也就越低。

像圖5,圖6這樣的數(shù)據(jù)洞察往往也是BI軟件無法捕捉到的。數(shù)據(jù)工程師們可以將這些沒有長期監(jiān)控的意義的指標(biāo)轉(zhuǎn)化成擁有商業(yè)價值的洞察。同時這又是傳統(tǒng)的管理咨詢公司無法做到的,因?yàn)樗麄內(nèi)狈δ芰φ先绱撕A康臄?shù)據(jù)并按天甚至按小時進(jìn)行實(shí)時輸出。

個人認(rèn)為,數(shù)據(jù)科學(xué)(大數(shù)據(jù))和廣義的商業(yè)智能原本沒有本質(zhì)區(qū)別,兩者都涵蓋了非常廣泛的內(nèi)容,并且兩者的核心都是通過數(shù)據(jù)處理和分析的方式,提升業(yè)務(wù)表現(xiàn)。但我們平時所談?wù)摰摹癇I”很多時候其實(shí)指是軟件廠商所提供的BI軟件/套件,用于實(shí)現(xiàn)業(yè)務(wù)報表和統(tǒng)計監(jiān)控的功能。暫且不提廠商們是否有故意偷換概念的嫌疑,BI軟件和數(shù)據(jù)科學(xué)還是有著比較大的差異??梢哉fBI軟件通過高度抽象的方法,提供了一種非常便利的數(shù)據(jù)匯總,統(tǒng)計,可視化的工具,從而完成了數(shù)據(jù)科學(xué)的一部分工作,而許多深層次的,帶有行業(yè)性的,高于BI軟件的分析與洞察,仍然需要數(shù)據(jù)工程師的參與,以及特定數(shù)據(jù)系統(tǒng)的支撐來共同完成。

總結(jié)

與傳統(tǒng)的管理咨詢公司相比,在BI層面,大數(shù)據(jù)的相關(guān)技術(shù)勝在算力:數(shù)據(jù)整合能力、實(shí)時處理能力以及呈現(xiàn)能力。

文章來源36大數(shù)據(jù),www.36d ,微信號dashuju36 ,36大數(shù)據(jù)是一個專注大數(shù)據(jù)創(chuàng)業(yè)、大數(shù)據(jù)技術(shù)與分析、大數(shù)據(jù)商業(yè)與應(yīng)用的網(wǎng)站。分享大數(shù)據(jù)的干貨教程和大數(shù)據(jù)應(yīng)用案例,提供大數(shù)據(jù)分析工具和資料下載,解決大數(shù)據(jù)產(chǎn)業(yè)鏈上的創(chuàng)業(yè)、技術(shù)、分析、商業(yè)、應(yīng)用等問題,為大數(shù)據(jù)產(chǎn)業(yè)鏈上的公司和數(shù)據(jù)行業(yè)從業(yè)人員提供支持與服務(wù)。

End.

1.《如何畫一列數(shù)的cdf曲線》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。

2.《如何畫一列數(shù)的cdf曲線》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進(jìn)行證實(shí),對其原創(chuàng)性、真實(shí)性、完整性、及時性不作任何保證。

3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/keji/3223646.html