編輯導演:很多同學都在問:“數據分析從0到1的文章看多了,咋樣才能從1到10,從普通到優秀呀!”這篇文章作者系統地講述了6個階梯,助你成為優秀數據分析師!
很多同學都在問:”數據分析從0到1的文章看多了,咋樣才能從1到10,從普通到優秀呀!”今天系統地解答一下。“優秀”是一個形容詞,隻有清晰了參照物,才能知道到底什麼是“普通”,什麼是“優秀”。今天就從“普通”講起,想通往“優秀”,需要邁過6個階梯。
一、搞數據數據分析最怕啥?沒思路?沒模型?沒圖表?
都不是!
數據分析最怕:沒數據!無論是做啥分析,搞數據,始終是第一位的工作。盡可能多地搞數據,是第一位要求。不然一切免談。
隻不過,同數倉開發不同,數據分析關注的數據,是面向業務主題的。數據服務的産品、運營、銷售、營銷、售後部門,到底有什麼數據,需要什麼數據,是數據分析師必須梳理清楚的。
具體來說,包括:指标/維度兩部分。如何衡量是否清晰?可以問自己,以下九個問題是否清楚。
- 我服務的部門是……
- 該部門屬于利潤中心/成本中心
- 該部門的KPI指标是……
- 該部門的主要流程是……
- 該部門流程中,已采集數據是……
- 該部門現有過程指标是……
- 該部門組織架構是……
- 該部門服務對象分類是……
- 該部門常用分類維度是……
其中:
- 1、2、3是用來明确主要KPI指标的,這是數據分析的源頭和關鍵
- 4、5、6是用來搭建過程指标體系的,解釋KPI指标如何達成
- 7、8、9是用來篩選關鍵分類維度的,當KPI指标波動,從這些維度做拆解
很多同學習慣于在現有寬表上跑數,向上不清楚業務流程、業務目标,向下不清楚數據來源、數據采集,每天忙着按需求單跑數,連跑的數是啥意思都不懂。這樣就限制死了自己的發展空間,無法進一步提升能力了。
二、定基線
做到第一階,至少能看懂自己跑的數據了,知道每個數據是用在哪個部門,哪項工作。下一步最關鍵的是……?
有的同學可能不假思索地說:建模!還沒到這一步哈。下一步關鍵的是:定基線。知道自己看的數據,常規形态是啥樣的。知道什麼算正常,什麼算不正常。
這一步非常重要!因為數據本身沒有含義,數據 标準才有含義。而并非所有指标,業務方都會給出标準的。很可能,隻有銷售數據才有具體到每天的考核标準,其他數據得憑經驗、憑常識、憑分析定出基線(如下圖)。
很多同學無法解讀數據,做的分析不被業務認可,都是因為沒有跨過這一台階。最常見的,看到指标跌了,盲目做了一堆交叉,然後業務方輕飄飄地:“這是正常波動”。
然而第二天又有同樣幅度波動,業務方卻急着煙熏火燎:“這麼大波動你都看不到嗎!”……被這麼折騰幾次,就會信心全無,懷疑人生。所以想進步,就不能被業務方牽着鼻子走,得自己有定基線能力。
三、拆因素跨過第二階後,數據分析師已經對業務常見走勢,有充足的了解。并且,自己有能力做判斷,就能識别出異常狀态。并非所有的異常都不可控,有相當多的異常是可觀測因素導緻的,比如宏觀環境,比如營銷動作、推廣計劃。此時,要先有能力先把這些明顯可識别的“白犀牛”整明白,再來談其他“黑天鵝”問題。
看到這裡,肯定有同學會說:“老師,這個簡單,我的PEST,SWOT,4P已經按捺不住了,來吧!”然鵝,沒卵用。你看那麼多PEST的文章,有一篇教過你怎麼量化P、E、S、T四個指标不???
所以這一台階,叫“拆因素”,即把這些影響業務的因素,拆解到可以量化的,能用一個或幾個數據指标表現,并能與内部數據結合分析的程度。拆因素可能有若幹數據形态,比如:
- 1、0、1形态:有XX因素、沒有XX因素
- 2、分類形态:同一事件,ABC三種狀态
- 3、連續形态:能用一個連續型指标,代表該因素
具體怎麼拆,是需要大量分析工作做基礎的,最後能沉澱下來的,就是最有價值的經驗。
四、測細節
跨過第三階段後,數據分析師能對明顯的,重大的影響因素做出判斷。想要進一步提升,就得深入到細節中,了解活動到底怎麼做的,産品到底怎麼設計的,用戶到底需求什麼。這些已經觸及業務的核心,因此很難短時間内搞清楚,需要長期積累。
想做這一步,有2個關鍵工作要做。
1. 打标簽
越是觸及業務核心,連續型指标能描述的情況就越少,越需要打标簽。類似用戶情緒、喜好、産品功能點、營銷邏輯,都是靠标簽來描述和量化的。準确地打标簽,将業務量化,做出清晰的分類,是高級數據分析師的技能。不是說把數據庫裡的,現有的維度表拖出來就完事。
2. 做實驗
可能有同學會說:ABtest我現在也經常幹,為啥感覺不到進步呢。注意,現在的ABtest,很多是産品驅動的,不是數據驅動的。鬼知道産品經理從哪裡搞了2個版本,扔過來就測,然後讓數據分析師解釋差異。這是非常本末倒置的,隻會讓人陷在瑣碎的數據裡。
一個正式的實驗,是:
- 有清晰的改進目标
- 有清晰的改進邏輯
- 有關鍵改善過程指标
- 有環境控制變量
- 有組間差異預判
謀定而後動。這樣才能在解讀實驗數據的時候剔除各種雜糅因素,得到正确結論。當然,想做到這一步,需要業務的配合和參與。如果業務真的很喜歡自說自話,就靠數據分析師個人能力,至少推動剔除一些明顯容易雜糅的因素。
五、理邏輯邁過第四個台階,數據分析師本人已經可以實現:描述問題-發現問題-解釋問題-檢驗效果的閉環了。單純站在數據角度,已經是個完整的能力閉環。
但僅有數據能力閉環是不夠的,因為在企業裡,相當多的問題不是來自技術,而是來自業務。更有甚者,是來自業務方的屁股決定腦袋,來自業務方急功近利、大幹快上,來自業務方事前拍腦袋,事後拍大腿。
因此想要讓數據更好地展現價值,就得有能力應對現實問題。在千頭萬緒中,梳理清楚問題邏輯,找到正确的答案,或者至少給自己找到脫身的辦法(如下圖)。
這時候“理邏輯”,重點是把口語表達的,不可量化的業務邏輯,轉化成數據可驗證的邏輯,并且選擇合适的數據方法得出結論。除了數據能力,還需要數據分析師有業務洞察,有一些職場溝通技巧,才能完成任務。
六、組模型有了以上五個階段的積累以後,你已經能完全在一個行業裡混得如魚得水了,不但能做好基礎數據服務,也能協助業務做出業績,更能以客觀中立的态度赢得老闆的信任。 此時,可以更進一步,提煉一些屬于自己的模型出來:
如果用少數關鍵指标就能概括這個行業的問題,可以捏個業務模型
如果某個業務場景,用特征 算法能得到很準确的預測結果,就固定成該行業算法模型。 搞完了,記得也取四個英文字母做名字以體現檔次。
做這一步,不僅是為了沉澱經驗,提升逼格,更是為了遷移知識,擴展使用範圍服務的。很難保證人一輩子都不換行,掌握了優秀分析能力的人,幹一行就是一行專家。而遷移知識,靠的是模型的總結與經驗積累,兩者缺一不可。
七、小結縱觀整個成長階梯,核心就是:數據分析師要能剝絲抽繭的解決複雜企業問題,這樣培養能力,才是我們自己安身立命的法寶。
很多在校的,剛畢業的同學們,還習慣于沉浸在書本中,總覺得越難的知識越牛逼,一本統計學有19章,那第19章肯定比18章牛逼……這樣單純堆疊知識點,可以無窮無盡卷下去,但是對于提升實際能力幫助甚小,非常不推薦哈。真有興趣搞這些,推薦去純科研。
特别是,數據分析本身就是一個面向不确定性,用數據方法解決企業經營不确定性的工種。把數據采集上來,服務好管理層,推動業務實現業績,至少就有一個公司數據部門總監位置在召喚,合理而不為呢。與大家共勉!
作者:接地氣的陳老師來源:公衆号:接地氣學堂
本文由 @接地氣的陳老師 原創發布于人人都是産品經理。未經許可,禁止轉載。
題圖來自 Unsplash,基于CC0協議。
,