編輯指南:“分析一下,為什么今天一一突然掉了下來?”這是數(shù)據(jù)分析面試的高頻提問,考察了應(yīng)聘者的分析問題、驗證推測、結(jié)果呈現(xiàn)等一系列能力。

本篇作者就對此問題,結(jié)合自己的思考理解,給我們總結(jié)了如何看數(shù)據(jù)、做拆分和做假設(shè),一起來看一下。

一、框架

分析流程總體可以歸納為三步:看數(shù)據(jù)、做拆分、做假設(shè)。

1. “看數(shù)據(jù)”,看數(shù)據(jù)本身及其變化是否存在問題

由于指標(biāo)的波動可以分為正常的和異常的,按照持續(xù)時間又可以分為暫時性波動、周期性波動和持續(xù)性波動,所以要先明確這個波動是不是真的是異常的,可以和產(chǎn)品、運營、研發(fā)、運維等多方確認(rèn)數(shù)據(jù)的真實性,然后觀察數(shù)據(jù)波動持續(xù)了多久,判斷波動程度是否是在合理的范圍之內(nèi),比起昨天和上周,同比環(huán)比分別變化了多少等等。

這一步可能發(fā)現(xiàn)的原因大致有:服務(wù)器異常、后臺統(tǒng)計出錯、報表數(shù)據(jù)異常、指標(biāo)計算口徑不一致等,也可能是外部的惡意行為造成的,需要根據(jù)后續(xù)步驟再仔細(xì)排查。

2.“做拆分”,將指標(biāo)和業(yè)務(wù)流程多維度拆解,縮小排查范圍

這一步要注意“辛普森悖論”,即在某些情況下,分析數(shù)據(jù)整體和分析數(shù)據(jù)的各個部分會得到相反的結(jié)論。

1)從指標(biāo)上拆:一個指標(biāo)一般可以由其他指標(biāo)計算得到,指標(biāo)的波動是若干個因素共同作用的結(jié)果。要想縮小問題的排查范圍,可以在原始指標(biāo)下盡量細(xì)分,不斷地由粗到細(xì)拆解,找出可能影響指標(biāo)波動的所有因素,得到一個類似樹的結(jié)構(gòu)。比如“DAU=新用戶+老用戶留存+流失用戶回流”,新用戶有來源渠道,老用戶有留存渠道,流失用戶有自然回流和干預(yù)回流,而用戶共同的因素又有軟件版本、地區(qū)、設(shè)備、活躍時間段等等。

另外,拆分不只是用加法,還需要針對具體指標(biāo)做拆分,比如一些復(fù)合指標(biāo):“GMV=新用戶x轉(zhuǎn)化率x新用戶客單價+老用戶x轉(zhuǎn)化率x老用戶客單價”。

2)從業(yè)務(wù)流程上拆:一個用戶從注冊到進入首頁再到流失或留存的整個過程,其中的任意一步都有可能會是指標(biāo)下降的“罪魁禍?zhǔn)住?。比如說,當(dāng)一個新用戶第一次進入首頁時,發(fā)現(xiàn)首頁推薦的內(nèi)容并非他所喜歡的甚至是反感的,反手來一個卸載,這種因為推薦內(nèi)容質(zhì)量而導(dǎo)致的用戶流失,鍋就甩在推薦系統(tǒng)工程師的冷啟動沒做好上了。

不止是這些“表面上”的因素,還有很多其他因素可以加入進來,它們大體上可以歸納為內(nèi)因和外因兩類,內(nèi)因往往和用戶、產(chǎn)品、運營和內(nèi)容質(zhì)量相關(guān),外因則可能和政治、經(jīng)濟、法律、競品的出現(xiàn)甚至疫情的爆發(fā)有關(guān),外因可以從宏觀上做PEST分析。

往往在分析之前需要先判斷指標(biāo)波動的情況,一般來說,短期變化找內(nèi)因,長期異動找外因。比如向外考慮國家是否有重大政策發(fā)布,向內(nèi)考慮是否產(chǎn)品本身有問題,是否用戶需求發(fā)生了轉(zhuǎn)移,在數(shù)據(jù)上則需要關(guān)注數(shù)據(jù)指標(biāo)的起點、拐點和終點。

舉個最近的例子就是,最近在線學(xué)科教育產(chǎn)品的日活為什么下降了?因素就很有可能是最近國家發(fā)布了雙減政策,自國家發(fā)布消息的那一天起,指標(biāo)數(shù)據(jù)開始下跌。

除了使用拆分的方法外,還可以結(jié)合相關(guān)性分析的方法,思考目標(biāo)指標(biāo)與另外一個因素是否相關(guān)聯(lián)。

第二步可以總結(jié)成幾個問句來輔助思考:指標(biāo)構(gòu)成是什么?業(yè)務(wù)流程是什么?是否有外部因素的影響?相關(guān)因素有哪些?有注意辛普森悖論嗎?

3.“做假設(shè)”,假設(shè)某因素就是原因,做實驗去驗證假設(shè)

第三步與第二步是緊密結(jié)合的,往往是先從理論上和經(jīng)驗上去分析,得到各種假設(shè),再通過實驗驗證提出的假設(shè),相當(dāng)于前面提到的“樹”,給它的各條分支路徑做剪枝操作,一定要具體問題具體分析,具體措施就是做AB實驗。

由于真實場景下存在許多的變量,可能是產(chǎn)品迭代、運營策略改變,或者線上有另一個AB實驗在做,都會導(dǎo)致最終結(jié)果存在差異,所以不同情況下的驗證會有不同的解決方案。

要驗證一些可復(fù)現(xiàn)的問題或可實施的想法時,如果時間充裕就可以通過AB實驗來做,其他情況則可以通過業(yè)務(wù)經(jīng)驗快速縮小驗證范圍,用業(yè)務(wù)指標(biāo)拆分或相關(guān)分析來輔助排查問題,最終鎖定一個或多個有意義的結(jié)果。

需要注意的是,對于部分能穩(wěn)定重現(xiàn)的問題來說是可以用AB實驗來驗證的,還有很多問題是不能穩(wěn)定重現(xiàn)的,就需要另外思考解決方案了,例如某天發(fā)現(xiàn)有大量新增的用戶,但是都是腳本模擬的假用戶,這時就需要根據(jù)當(dāng)天的用戶行為記錄,如ip地址與設(shè)備標(biāo)識等已經(jīng)產(chǎn)生的現(xiàn)有日志進行深入挖掘了。

二、總結(jié)

最后,把前述梳理的思維框架總結(jié)成一個思維導(dǎo)圖,當(dāng)遇到要分析指標(biāo)數(shù)據(jù)變動的問題時可以作為一個參考。

參考

數(shù)據(jù)指標(biāo)出現(xiàn)異常波動時,你該如何進行異常分析呢?

猴子《數(shù)據(jù)分析思維:分析方法和業(yè)務(wù)知識》。

本文由 @方塘 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自Unsplash,基于CC0協(xié)議

1.《qq群服務(wù)器錯誤是怎么回事?。课襾砀嬖V你答案當(dāng)面試官問“分析一下為什么XX指標(biāo)下降了?”》援引自互聯(lián)網(wǎng),旨在傳遞更多網(wǎng)絡(luò)信息知識,僅代表作者本人觀點,與本網(wǎng)站無關(guān),侵刪請聯(lián)系頁腳下方聯(lián)系方式。

2.《qq群服務(wù)器錯誤是怎么回事啊?我來告訴你答案當(dāng)面試官問“分析一下為什么XX指標(biāo)下降了?”》僅供讀者參考,本網(wǎng)站未對該內(nèi)容進行證實,對其原創(chuàng)性、真實性、完整性、及時性不作任何保證。

3.文章轉(zhuǎn)載時請保留本站內(nèi)容來源地址,http://f99ss.com/gl/2985533.html