2017年12月3日,應(yīng)“水滴互助”的朋友邀請(qǐng),分享我個(gè)人數(shù)據(jù)分析的一些基本方法論。數(shù)據(jù)產(chǎn)品基于降水?dāng)?shù)據(jù)分析的思路,這兩個(gè)領(lǐng)域略有重疊。在這里整理文章,分享給大家。
“為什么-什么-如何”是一個(gè)很好的解釋概念和執(zhí)行的思維模式。這一次,按照這個(gè)框架,“數(shù)據(jù)分析”是拆分的。相信很多朋友都有豐富的分析經(jīng)驗(yàn),所以要從個(gè)人角度梳理一下,以供參考。為了幫助大家更好地理解這篇文章,先貼一張思維導(dǎo)圖:
一. WHY:為什么要做數(shù)據(jù)分析目前大部分關(guān)于數(shù)據(jù)分析的文章都忽略了數(shù)據(jù)分析本身的目的。這將導(dǎo)致我們?cè)趫?zhí)行時(shí)動(dòng)作的變形。只有以終為始,才能保證不跑路。個(gè)人認(rèn)為,數(shù)據(jù)分析就是對(duì)業(yè)務(wù)問題進(jìn)行量化分析,得出結(jié)論。有兩個(gè)關(guān)鍵詞:量化和商業(yè)。
先說量化。量化是為了統(tǒng)一認(rèn)知,保證路徑可以追溯和復(fù)制。只有統(tǒng)一認(rèn)知,不同層次、不同部門的人才能在話語權(quán)平等、方向一致的背景下討論合作,公司內(nèi)部的人才能避免用“我感覺”、“我猜測(cè)”來猜測(cè)當(dāng)前的經(jīng)營狀況。路徑具有可追蹤性和可復(fù)制性,這意味著可以通過量化的結(jié)果找到并復(fù)制許多優(yōu)化方法。同樣是轉(zhuǎn)化率優(yōu)化??梢灶A(yù)測(cè)誰會(huì)得到更好的結(jié)果,使用方案A和方案B會(huì)得到多少更好的結(jié)果..
為了量化,需要做到三點(diǎn):建立量化體系,明確量化的重點(diǎn),保證數(shù)據(jù)的準(zhǔn)確性。
1.1建立量化體系
量化體系的建立主要是基于“指標(biāo)設(shè)計(jì)法”,設(shè)計(jì)業(yè)務(wù)的“核心指標(biāo)+拆解指標(biāo)+業(yè)務(wù)指標(biāo)”,最后放入全公司通用的“指標(biāo)字典”和“維度字典”。這類工作通常由數(shù)據(jù)分析師或數(shù)據(jù)PM來完成。這樣就可以初步建立起一個(gè)全面系統(tǒng)的全公司量化分析框架,保證日常分析可以“層層分解,不重復(fù)不泄露”。
1.1.1指標(biāo)設(shè)計(jì)方法
說到索引設(shè)計(jì)方法,你可能會(huì)覺得你以前聽說過產(chǎn)品設(shè)計(jì)方法、程序開發(fā)方法、索引設(shè)計(jì)方法。事實(shí)上,指數(shù)設(shè)計(jì)是一種以準(zhǔn)確性和可理解性為標(biāo)準(zhǔn),并將統(tǒng)計(jì)和商業(yè)效果相結(jié)合的方法。
準(zhǔn)確是指能準(zhǔn)確達(dá)到測(cè)量目的,通俗易懂是指指標(biāo)算法能直觀地表現(xiàn)好壞,指標(biāo)算法也通俗易懂。兩者之間總有選擇的余地,準(zhǔn)確性第一。比如我們要衡量一個(gè)群體的收入差異,是用方差還是基尼系數(shù)?方差很好理解,但不能說明兩個(gè)極端有多大區(qū)別。基尼系數(shù)算法很難理解,但可以準(zhǔn)確描述這個(gè)問題。
具體到指標(biāo)設(shè)計(jì),我們需要用到一些常用的統(tǒng)計(jì)工具:
以客戶質(zhì)量分析為例:簡介是我們看客戶的平均支付金額或支付中位數(shù)來了解客戶簡介。要想知道這些客戶的質(zhì)量好不好,需要用方差和標(biāo)準(zhǔn)差來描述。如果想了解更多細(xì)節(jié),可以了解每個(gè)區(qū)間的用戶數(shù)來做判斷。
這里有一些提示供你參考:
比率指標(biāo):注重實(shí)效(訂單轉(zhuǎn)化率,看單數(shù)沒用)
關(guān)聯(lián)指標(biāo):既要看新客戶數(shù)量,也要看CAC,保證數(shù)量的前提也要保證質(zhì)量
防止壞指標(biāo):錯(cuò)誤指標(biāo),虛榮心指標(biāo),復(fù)雜指標(biāo)
以下是對(duì)每一個(gè)提示的目標(biāo)的簡要說明。之所以采用比率指數(shù)和伴隨指數(shù),是因?yàn)樗軌蚯逦胤从硺I(yè)務(wù)的“效率”,有效防止因追求單一指數(shù)而導(dǎo)致的動(dòng)作變形。如果這車能跑10萬公里,不代表車有多好。只有“速度=距離/時(shí)間”才能體現(xiàn)這輛車的效率。同時(shí),如果片面追求速度,會(huì)導(dǎo)致車的劍在設(shè)計(jì)上誤入歧途,給駕駛員帶來危險(xiǎn)。因此,需要增加“故障率”或“事故率”等伴隨指標(biāo),以確保安全。
不良指標(biāo)中的“虛榮心指標(biāo)”最早出現(xiàn)在《精益數(shù)據(jù)分析》一書中,作者簡單的將“PV/UV”等指標(biāo)歸為虛榮心指標(biāo)。剛開始我是認(rèn)可的,但后來在實(shí)際申請(qǐng)過程中,發(fā)現(xiàn)這些指標(biāo)對(duì)于監(jiān)控很多業(yè)務(wù)來說是無法避免的。后來我把“虛榮心指數(shù)”修正為“把離業(yè)務(wù)目標(biāo)太遠(yuǎn)的環(huán)節(jié)定義為核心監(jiān)控指標(biāo)”。對(duì)于一個(gè)即時(shí)通訊APP,需要監(jiān)控下載次數(shù)、啟動(dòng)用戶和注冊(cè)用戶,但不能作為核心監(jiān)控指標(biāo)。更合適的是消息數(shù)或者“有過對(duì)話的用戶數(shù)”。復(fù)雜的指標(biāo)往往是各種各樣的“指標(biāo)”,很多指標(biāo)是加減乘除的,這就使得此類指標(biāo)波動(dòng)時(shí)很難分析原因。
擁有定義和解釋指標(biāo)的權(quán)利,是一件很高級(jí)的事情。這就要求設(shè)計(jì)師對(duì)業(yè)務(wù)有很深的理解,有很高的抽象能力。對(duì)于分析師來說,擁有定義指標(biāo)的權(quán)利將突出你在業(yè)務(wù)方面的重要性。當(dāng)然,這并不是為了定義指標(biāo)而鼓勵(lì)大家定義指標(biāo)。找到行業(yè)內(nèi)現(xiàn)有的量化方法,在公司推廣也是一件很棒的事情。
以美容外賣“美容廚師率加權(quán)指導(dǎo)值”為例。為了避免泄露商業(yè)秘密,將原本用來衡量用戶體驗(yàn)的指標(biāo)改為“美女廚師率”,并對(duì)以下背景略加修改,讓大家都明白其中的精神。指標(biāo)的背景是保證用戶的用餐體驗(yàn),美容外賣總部提出每個(gè)城市的商家必須配備一定比例的美容大廚。但城市提出異議:不同城市有不同的商家,大商家廚師多,漂亮廚師率相對(duì)較低,不可能用一個(gè)統(tǒng)一的數(shù)值來比較所有城市。所以總部設(shè)計(jì)了這樣一個(gè)指導(dǎo)值:全國的商家分層,每一層的商家拿到全國平均,然后每個(gè)城市對(duì)照基準(zhǔn)平均值產(chǎn)生自己的基準(zhǔn)值,也就是美女廚師率的加權(quán)指導(dǎo)值。雖然計(jì)算有點(diǎn)復(fù)雜,但在實(shí)際應(yīng)用過程中,BD人只需要知道整體差距和各層業(yè)務(wù)的區(qū)別,就很容易有針對(duì)性的落地和優(yōu)化。
1.1.2建立指標(biāo)體系
按照“指標(biāo)設(shè)計(jì)法”,如何圍繞業(yè)務(wù)建立指標(biāo)體系?核心是根據(jù)業(yè)務(wù)特點(diǎn)確定核心指標(biāo),在核心指標(biāo)的基礎(chǔ)上從不同角度進(jìn)行拆解。然后慢慢補(bǔ)充其他業(yè)務(wù)的指標(biāo)。
拆卸時(shí),需要根據(jù)指標(biāo)而不是尺寸進(jìn)行拆卸。例如,訂單數(shù)量也可以細(xì)分為每個(gè)類別的訂單總數(shù)。這可以通過保持上層和下層的索引名稱不一致來避免。拆卸過程遵循“層層拆卸,無重漏(MECE)”的金字塔方法論。如果業(yè)務(wù)拆解或補(bǔ)充的指標(biāo)太多,可以借鑒數(shù)據(jù)倉庫中“域”的概念來管理這些指標(biāo),比如上圖中的“交易域”、“商品域”、“用戶域”。
在標(biāo)準(zhǔn)的索引系統(tǒng)中,涉及到元數(shù)據(jù)管理領(lǐng)域。包括索引命名的規(guī)范,數(shù)據(jù)存儲(chǔ)和計(jì)算的管理等等。如果有興趣,可以搜索相關(guān)文章或者閱讀阿里巴巴新的《大數(shù)據(jù)實(shí)踐之路》。下面,我們將截取一個(gè)來自云起會(huì)議的PPT關(guān)于指標(biāo)給大家的命名標(biāo)準(zhǔn):
1.1.3構(gòu)建索引維度字典
這里是轉(zhuǎn)讓公司前期的指標(biāo)維度字典(Bus Matrix),一定程度上解決了之前公司指標(biāo)定義不清或不一致的問題?,F(xiàn)在這套東西已經(jīng)產(chǎn)品化了,可以在可視化產(chǎn)品中查看和展示。
對(duì)于暫時(shí)無法生產(chǎn)產(chǎn)品的公司,建議分析師可以通過Google Docs或Wiki統(tǒng)一維護(hù)一些關(guān)鍵常用指標(biāo)。
對(duì)于維度總線矩陣,主要通過維度為數(shù)據(jù)倉庫建模、數(shù)據(jù)產(chǎn)品設(shè)計(jì)和多維交叉分析提供框架和基礎(chǔ)。
1.2明確的量化重點(diǎn)
在每個(gè)階段,應(yīng)該清楚地定義當(dāng)前的業(yè)務(wù)優(yōu)先級(jí)。量化系統(tǒng)需要根據(jù)業(yè)務(wù)階段改變量化的重點(diǎn)和方法。同時(shí)也意味著有更詳細(xì)的指標(biāo)和更大的監(jiān)測(cè)和推廣力度。
比如外賣行業(yè)早期,經(jīng)歷了重視訂單數(shù)量、重視訂單金額、重視新客戶數(shù)量+補(bǔ)貼率、重視新客戶數(shù)量+資金利用效率(交易完成進(jìn)度/費(fèi)用完成進(jìn)度)的過程。我們可以看到,隨著戰(zhàn)爭階段的升級(jí)和變化,我們開始考慮新客戶的數(shù)量,同時(shí)控制補(bǔ)貼,由于戰(zhàn)爭趨于正常,我們開始控制整體補(bǔ)貼額度,通過爭取效率來擊敗對(duì)手。在每一個(gè)階段,都需要根據(jù)不同的戰(zhàn)場(chǎng)情況來判斷當(dāng)前的焦點(diǎn),從而建立一個(gè)圍繞焦點(diǎn)無死角的360度分析監(jiān)控系統(tǒng)。
1.3保證數(shù)據(jù)的準(zhǔn)確性
在數(shù)據(jù)準(zhǔn)確性這個(gè)話題上,數(shù)據(jù)產(chǎn)品已經(jīng)有了成熟的數(shù)據(jù)質(zhì)量管理方法,涉及到數(shù)據(jù)源的監(jiān)控、指標(biāo)計(jì)算和數(shù)據(jù)展現(xiàn)。本文主要從分析師的角度闡述了保證準(zhǔn)確性的方法,不會(huì)重復(fù)數(shù)據(jù)產(chǎn)品。
采用可信來源:多個(gè)來源的交叉驗(yàn)證,在采用新來源時(shí)要格外小心
確定處理方法:索引定義和處理算法
雙重檢查:量值、計(jì)算邏輯和商業(yè)常識(shí)
本文重點(diǎn)介紹了雙重檢查的技巧,它可以使許多經(jīng)理或投資者在不了解業(yè)務(wù)的情況下,判斷數(shù)據(jù)是否有問題。
震級(jí)檢查:每個(gè)數(shù)據(jù)都有其大致的范圍,如DAU、WAU和MAU。
計(jì)算邏輯檢查:一般對(duì)于積分偏分,比如市場(chǎng)占有率,必須滿足以下要求:1。最大值不能超過1;2、各部分之和應(yīng)為1;3.兩個(gè)數(shù)相加后,總和應(yīng)該在中間范圍。
業(yè)務(wù)知識(shí)檢查:根據(jù)其他常用數(shù)字計(jì)算業(yè)務(wù)范圍。如果有人告訴你某個(gè)社交APP的DAU超過1億,你大概知道你是不是在吹牛,因?yàn)橹挥猩贁?shù)的APP一天活1億以上。對(duì)于DAU/MAU,所有行業(yè)都有響應(yīng)范圍值,淘寶為34.6%,天貓為15.5%,JD.COM為15.8%。
1.4從業(yè)務(wù)方面來看
除了“量化”,另一個(gè)關(guān)鍵詞是“業(yè)務(wù)”。只有解決業(yè)務(wù)問題,分析才能創(chuàng)造價(jià)值。價(jià)值包括個(gè)人價(jià)值和公司價(jià)值。對(duì)于公司來說,你提高了收入水平或者降低了經(jīng)營成本;對(duì)于個(gè)人來說,你知道如何利用數(shù)據(jù)解決業(yè)務(wù)問題,這對(duì)個(gè)人的能力成長和職業(yè)生涯有很大的幫助。
總結(jié)一下,如何站在業(yè)務(wù)方的角度去思考,就是八個(gè)字:“為他們的擔(dān)心擔(dān)心,給他們想要的”。這不僅適用于分析師的職位,對(duì)于供應(yīng)商來說,在以供需為主要關(guān)系的所有互動(dòng)過程中,準(zhǔn)確理解彼此的需求是最重要的。比如PM是給用戶的,分析師是給業(yè)務(wù)方的,下屬是給上級(jí)的。
在具體的落地過程中,主要是在以下幾個(gè)環(huán)節(jié)
充分溝通
簡潔的結(jié)論
為登陸提供信息和建議
尋求反饋
在溝通中,確定業(yè)務(wù)方要分析什么,提出更合理更專業(yè)的計(jì)量分析方法,同時(shí)做好節(jié)點(diǎn)同步,避免一路走黑。在分析業(yè)務(wù)需求時(shí),它類似于很多產(chǎn)品需求分析方法論,所以需要明確所需數(shù)據(jù)背后的含義。比如業(yè)務(wù)方說要看“頁面停留時(shí)間”,但他實(shí)際想要的可能是衡量用戶質(zhì)量,所以“留存率”和“目標(biāo)轉(zhuǎn)化率”是更合適的指標(biāo)。
在闡述分析結(jié)果時(shí),要記住結(jié)論要先來,層層解釋,然后提供論據(jù)。關(guān)于論點(diǎn),圖片>:表格>:單詞。因?yàn)闃I(yè)務(wù)方或者管理層的時(shí)間有限,一大塊郵件就扔了,沒人管你分析了什么。需要在郵件前面用1-3句話給出結(jié)論,讓需求方不用看后續(xù)內(nèi)容就能知道你報(bào)告80%的內(nèi)容。
關(guān)于“提供信息量及落地建議”,首先要明白信息量是什么意思:提供對(duì)方不知道的信息。明天太陽從東方升起,不是信息,是在西方。在分析的過程中,一定要站在專業(yè)的角度,從已知邊界向未知邊界進(jìn)軍,爭取一個(gè)新的、堅(jiān)實(shí)的論據(jù),并根據(jù)分析內(nèi)容給出可以落地的建議。舉個(gè)簡單的例子:
尋求反饋是很多分析過程中缺失的一步,數(shù)據(jù)分析后沒有持續(xù)的跟進(jìn)。那你不知道你做的對(duì)不對(duì)。反饋就像一面鏡子,允許你及時(shí)調(diào)整和優(yōu)化你的方法。
二. WHAT:什么是數(shù)據(jù)分析數(shù)據(jù)分析的本質(zhì)是把握“變”和“不變”。
“變化”是數(shù)據(jù)分析的基礎(chǔ)。如果一個(gè)企業(yè)每天訂單1萬單或者每天以10%的速度穩(wěn)定增長,就不需要分析了。要想把握“變”,首先要形成“不變”的意識(shí)。
積累“不變性”,就是發(fā)展“數(shù)據(jù)常識(shí)”的過程。“不變性”是基于對(duì)歷史數(shù)據(jù)的不斷觀察和積累。一般來說會(huì)是一個(gè)區(qū)間。范圍越精確,對(duì)變化越敏感。有三種個(gè)人習(xí)慣可以幫助養(yǎng)成“不變”:
養(yǎng)成習(xí)慣,每天第一時(shí)間查看數(shù)據(jù):實(shí)時(shí)&:每日周報(bào)
記住每個(gè)指標(biāo)的大數(shù),反復(fù)計(jì)算
記錄關(guān)鍵數(shù)據(jù)(列表&:報(bào)告)
大多數(shù)指標(biāo)不需要記住所有的數(shù)字。簡單記住大數(shù)字,10000以下只有10000位數(shù),有些數(shù)字只需要記住百分比。指標(biāo)之間的計(jì)算可以幫助你整理出每個(gè)指標(biāo)的數(shù)量級(jí)關(guān)系和邏輯脈絡(luò),在出現(xiàn)波動(dòng)的時(shí)候更加敏感。記錄關(guān)鍵數(shù)據(jù)是將工作和生活中遇到的有趣的列表或數(shù)據(jù)報(bào)告保存在一個(gè)統(tǒng)一的地方,以便于參考和分析。
在“不變”的基礎(chǔ)上,可以逐步培養(yǎng)指標(biāo)敏感度,即實(shí)現(xiàn)指標(biāo)偏離的能力。這主要是通過周悅的各種日常監(jiān)控和同比監(jiān)控以及日常好奇心來維持的。
下面是一個(gè)管理林元帥的野史:林彪帶兵,每次戰(zhàn)斗都要記清楚俘虜和殲滅敵人的數(shù)量和種類,這是一個(gè)習(xí)慣。1948年,在遼沈戰(zhàn)役尋找對(duì)方指揮官的過程中,發(fā)現(xiàn)一次遭遇戰(zhàn)的戰(zhàn)報(bào)數(shù)據(jù)略有變化。他意識(shí)到偏離了過去“不變”的基礎(chǔ):繳獲的短槍和長槍的比例,繳獲和摧毀的汽車和大車,繳獲和殺死的官兵比其他戰(zhàn)斗中的稍高。根據(jù)這個(gè)偏離指數(shù),他迅速圈定了對(duì)方指揮所的位置,一舉打下了對(duì)方的大本營。
從QuestMobile年春季列表中,讓我們簡單看看“指標(biāo)偏差”是如何應(yīng)用于日常分析的:
在這里,讓我與你分享如何看待這個(gè)列表:
看整體排名:想不到哪個(gè)應(yīng)用在前面
看行業(yè)排名:看行業(yè)排名及其變化
看看增長率:哪些應(yīng)用增長更快
看看其他指標(biāo),如使用時(shí)間
這里我試著拋出幾個(gè)問題:
新浪新聞甚至比騰訊新聞還高?今天的頭條比一點(diǎn)信息都低?
第二槍比阿托快?
百度地圖在榜單上高于高德。為什么于永福敢宣稱去年活躍終端數(shù)量第一?
QQ的時(shí)長已經(jīng)連續(xù)住了兩個(gè)季度零個(gè)月。有什么意義嗎?
按增長速度排序,王者榮耀最快,其次是今日頭條,亞圖更快,高德地圖。既然高德還是一個(gè)快速成長的APP?
數(shù)據(jù)分析的定義和國外商業(yè)分析書的定義用作腳注:
三. HOW:怎么進(jìn)行數(shù)據(jù)分析任何數(shù)據(jù)分析都是“細(xì)分、比較、溯源”的連續(xù)交集。細(xì)分和比較最常見的維度是時(shí)間。我們用時(shí)間進(jìn)行周月同比。發(fā)現(xiàn)數(shù)據(jù)異常后,我們對(duì)維度或流程進(jìn)行細(xì)分,一步一步拆解,找到問題所在。如果發(fā)現(xiàn)某個(gè)維度的問題,需要追溯到業(yè)務(wù)方或者真實(shí)方,確認(rèn)問題來源。如果經(jīng)過反復(fù)細(xì)分和比較,問題仍然沒有得到確認(rèn),則需要追溯到業(yè)務(wù)日志或用戶訪談,進(jìn)一步了解情況。
3.1細(xì)分
以下內(nèi)容在之前關(guān)于大數(shù)據(jù)和用戶的研究中略有提及,這里做一個(gè)總結(jié)。就細(xì)分方法而言,主要有三種方式
交叉:按照一定的維度對(duì)指標(biāo)進(jìn)行劃分和交叉分析
縱向切割:以時(shí)間變化為軸,將指標(biāo)分為上游和下游
內(nèi)切:從目標(biāo)內(nèi)部按照一定的模型進(jìn)行分割
交叉,以轉(zhuǎn)身為例,對(duì)維度和指標(biāo)進(jìn)行分類交叉。當(dāng)某類指標(biāo)出現(xiàn)問題時(shí),我們就知道要分析哪個(gè)維度了。在橫切分析中,經(jīng)常需要跨多個(gè)維度。這在數(shù)據(jù)分析方面叫做跨多維分析。這也是剛才提到的“維度總線矩陣”中看到的各個(gè)維度的交集。
縱向切割,如果有目的有路徑,就用漏斗分析。如果沒有目的或路徑,則使用軌跡分析。如果沒有目的和路徑,就使用日志分析。
漏斗分析可分為長漏斗和短漏斗。長漏斗的特點(diǎn)是環(huán)節(jié)多,時(shí)間周期長。常用的長漏斗有渠道歸因模型、AARRR、用戶生命周期漏斗等。短漏斗目的明確,時(shí)間短,如訂單轉(zhuǎn)換漏斗、注冊(cè)漏斗等。在軌跡分析中,桑基圖是常用的方法。常見于各頁面的流通關(guān)系,電子商務(wù)中各類目的轉(zhuǎn)移關(guān)系等。日志分析,通過直接瀏覽用戶的前后日志,分析用戶的每一個(gè)動(dòng)作。
各種手段的細(xì)分經(jīng)常交叉使用。例如,在縱向切割訂單漏斗后,可以橫切它以查看哪個(gè)維度的轉(zhuǎn)化率導(dǎo)致了問題。
在內(nèi)部,分析主要基于市場(chǎng)上現(xiàn)有的常見分析模型,如RFM模型、群組模型和細(xì)分模型。RFM,即最新的購買時(shí)間、頻率和金額,綜合決定了用戶的忠誠度和粘性。隊(duì)列,或同期群分析,通過分析不同時(shí)期進(jìn)入平臺(tái)的新用戶,區(qū)分不同新用戶的質(zhì)量,如保留率或目標(biāo)轉(zhuǎn)化率。細(xì)分通過幾個(gè)條件對(duì)用戶進(jìn)行分層,然后對(duì)不同的用戶進(jìn)行分層分析和操作,比如用戶活動(dòng)分層等等。
3.2比較
比較主要分為以下幾類:
交叉比較:根據(jù)細(xì)分中的交叉維度進(jìn)行比較,如城市和類別
縱切對(duì)比:與細(xì)分中的縱切維護(hù)進(jìn)行對(duì)比,如漏斗不同階段的轉(zhuǎn)化率
目標(biāo)對(duì)比:目標(biāo)管理中常見的,比如完成率等。
時(shí)間對(duì)比:一天天,周月同比;7天移動(dòng)平均線比較,7天極端比較
時(shí)間對(duì)比嚴(yán)格來說是橫切對(duì)比。但是因?yàn)闀r(shí)間維度在數(shù)據(jù)分析和產(chǎn)品中極其重要,所以要簡單提一下。在橫向比較中,有一種眾所周知的數(shù)據(jù)應(yīng)用方法,即“排名列表”。通過這種簡單粗暴的方式,我們可以驅(qū)使人們達(dá)到目的,或者占據(jù)人們的認(rèn)知。前者有銷售完成清單。后者有一個(gè)最暢銷的類別列表。
3.3可追溯性
經(jīng)過反復(fù)細(xì)分比較,基本可以確認(rèn)問題。此時(shí),需要與業(yè)務(wù)方確認(rèn)數(shù)據(jù)是否由于一些業(yè)務(wù)動(dòng)作而異常,包括新版本的推出或活動(dòng)策略的優(yōu)化。
如果還是沒有頭緒,只能從最細(xì)的粒度開始,比如
用戶日志分析
用戶訪談
了解外部環(huán)境,如外部活動(dòng)、政策和經(jīng)濟(jì)條件的變化等
3.4衍生模型
在“細(xì)分比較”的基礎(chǔ)上,可以推導(dǎo)出很多模型。這些模型的意義在于,它們可以幫助你快速判斷一件事情的關(guān)鍵要素,不要去關(guān)注它們。這里有幾個(gè)供參考:
為什么-怎么-什么
5W1H
5為什么
4P模式(產(chǎn)品、價(jià)格、渠道、宣傳)
SWOT模型(優(yōu)勢(shì)、劣勢(shì)、機(jī)會(huì)、威脅)
PEST模型(政治、經(jīng)濟(jì)、社會(huì)、科技)
波士頓矩陣
例如,最近,JD.COM和美國的交貨時(shí)間可能會(huì)延長。鑒于與物流相關(guān)的客戶投訴的增加,可以使用PEST模型來分析是否存在政治問題。當(dāng)你對(duì)競(jìng)爭產(chǎn)品進(jìn)行比較分析時(shí),SWOT或4P模型可以為你提供不同的角度。
四. 數(shù)據(jù)分析如何落地以上言論都是偏于“道姬叔”的“術(shù)”部分,但以下是總結(jié)以上內(nèi)容并結(jié)合實(shí)際工作的“術(shù)”部分。
4.1數(shù)據(jù)分析流程和場(chǎng)景
根據(jù)不同的過程和場(chǎng)景,會(huì)有不同的注意點(diǎn)和“藝術(shù)”的應(yīng)用
4.2數(shù)據(jù)分析中常見的謬誤
控制變量謬誤:A/B測(cè)試時(shí)變量控制不好,導(dǎo)致測(cè)試結(jié)果沒有反映實(shí)驗(yàn)結(jié)果?;蛘咴趯?duì)比數(shù)據(jù)時(shí),兩個(gè)指標(biāo)沒有可比性。
樣本謬誤:在抽樣分析中,選取的樣本不夠隨機(jī)或代表性不足。比如說,互聯(lián)網(wǎng)圈的人會(huì)發(fā)現(xiàn)身邊的人幾乎不用“今日頭條”。為什么這個(gè)APP還能有這么多瀏覽量?有一個(gè)類似的概念叫做幸存者偏差。
定義謬誤:在閱讀一些報(bào)告或披露數(shù)據(jù)時(shí),人們往往會(huì)感到困惑?!熬W(wǎng)站訪問量過億”指的是用戶數(shù)或者訪問量?
比率謬誤:比率或比例指標(biāo)的謬誤可以單獨(dú)提出來。一是每次談到這類指標(biāo),都需要明確分子和分母是什么。另一方面,在討論變化的百分比時(shí),有必要注意基數(shù)。即使有的人工資只漲10%,也可能是150萬…
因果關(guān)聯(lián)謬誤:關(guān)聯(lián)會(huì)被誤認(rèn)為因果,中介變量會(huì)被忽略。比如,發(fā)現(xiàn)冰淇淋銷量與江河淹死兒童數(shù)量有顯著相關(guān)性,于是下令削減冰淇淋銷量。其實(shí)可能只是因?yàn)閮烧叨及l(fā)生在炎熱的夏天。天氣熱的時(shí)候,買冰淇淋的人越多,去河里游泳的人就越多。
辛普森悖論:簡單來說,兩種不同的分組數(shù)據(jù)相加,在分組比較中占優(yōu)勢(shì)的一方,將是在整體評(píng)價(jià)中失勢(shì)的一方。
最后總結(jié)幾句,也是本文的核心思想:
數(shù)據(jù)準(zhǔn)確性是第一要?jiǎng)?wù)
從業(yè)務(wù)的角度考慮:擔(dān)心他們的想法,給他們他們想要的
定義“改變”和“不改變”
細(xì)分、比較和可追溯性
結(jié)束。
精選干貨
1.《個(gè)人數(shù)據(jù)分析 萬字干貨 | 數(shù)據(jù)分析的基本方法論,收藏了慢慢看!》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識(shí),僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān),侵刪請(qǐng)聯(lián)系頁腳下方聯(lián)系方式。
2.《個(gè)人數(shù)據(jù)分析 萬字干貨 | 數(shù)據(jù)分析的基本方法論,收藏了慢慢看!》僅供讀者參考,本網(wǎng)站未對(duì)該內(nèi)容進(jìn)行證實(shí),對(duì)其原創(chuàng)性、真實(shí)性、完整性、及時(shí)性不作任何保證。
3.文章轉(zhuǎn)載時(shí)請(qǐng)保留本站內(nèi)容來源地址,http://f99ss.com/junshi/1182836.html