編輯導語:随着大數據時代的不斷升級,數據在我們的生活工作中顯得尤為重要,其實在很早之前人類就用數據來進行記錄,随着社會的發展,網絡時代更需要數據的記錄以及支撐。本篇文章中作者從三方面詳細的講述了關于數據的“坑”,一起來看一下吧。
開篇直接看案例:現有兩個廣告素材A和B,要測一下它們誰更能吸引用戶轉化,評比的指标是轉化率。(轉化率=轉化數/曝光數)
為保證實驗公平,它們都設置了相同的預算額度,并且都在中午12點開始投放,然後到了晚上12點同時關閉。
這樣跑了半天,兩組廣告也都基本花完了預算,結果發現:
- A一共曝光6500次,轉化了70個用戶,轉化率是1.077%;
- B一共曝光6200次,也轉化70個用戶,轉化率是1.129%;
看到結果後,廣告投放師小李就認為:B素材的轉化率更高。
這時,營銷總監老王卻說:到目前為止,我更願意相信A要高一些。
小李一臉懵逼,問:為啥啊?
老王嘬了一口星巴克,解釋道:即使是相同的廣告,在不同的時段也會有不同的轉化率。一般來說,下午的轉化率是低于晚上的,因為大部分人白天都有事情,不太容易被轉化,而到了晚上,大家都有空了,所以更容易被轉化。
小李又問:你說的對,但跟這次投放實驗有啥關系呢?
老王繼續說:我剛從後台看了素材的來量情況——A素材下午轉化50個,曝光5000次,晚上轉化20個,曝光1500次;B素材下午轉化20個,曝光2200次,晚上轉化50個,曝光4000次。
其實不管是下午還是晚上,A的轉化率都是更高的。而你之所以認為B更高,主要是因為B在晚上才跑出了量——它捏的“軟柿子”比較多,你就誤以為它更厲害…
看到這裡,可能你還有點懵:是啊,如果拆開來看,确實A更高,但合并看總數的話,又是B更高…
那這到底該怎麼看呢?
一、坑1:辛普森悖論上文的現象,就是典型的“辛普森悖論”(Simpson’s Paradox)——在某個條件下的兩組數據,分别讨論時都會滿足某種性質,可一旦合并考慮,卻可能導緻相反的結論。
這也是在其他領域的工作中經常會遇到,并且經常會坑人的一個現象。
幾乎每一家公司,上司都會讓下屬把業務層面的各種數據進行彙總,然後呈報給自己,并自以為了解了“總體”的情況。
不過,谷歌的一位數據大牛曾說過:“彙總的數據往往就是一坨屎,沒有任何意義。”
為什麼這樣說?
抛開專業的數學分析,如果用最通俗的語言來解釋,我認為就是:20頭豬就是20頭豬,50顆樹就是50顆樹,但如果你硬要把它們加起來(20 50=70),這個70是毫無意義的——它能代表什麼呢?什麼都代表不了。
彙總的數據,除了象征性的彙報工作,往往并無其他意義。為什麼說是“象征性”的?
因為如果彙報工作是為了指導決策,那很可能就把人帶進了坑裡。
就像上文廣告素材的案例,如果營銷總監想偷懶,隻看最後的結果,那他很可能就誤判了廣告素材的優劣。更嚴重的,甚至會導緻後續投放的素材都沿着“壞素材”的方向去優化。
還好他有一定數據分析的基礎,避免了這個坑。
所以在真實的情況中,如果一定要就此蓋棺定論,确實是A要高一些。(當然更科學的做法是繼續實驗,并通過加大預算/嚴控時段,來減少偶然性,以及不同性質的數據占比的差距)
除了廣告投放,辛普森悖論還經常出現在各種各樣的數據統計活動之中——需要算比率的統計基本都會出現,比如:
那麼,如何才能避免彙總數據可能帶來的坑呢?
關鍵記住8個字:不同性質,拆開來算。
二、坑2:誤把相關當因果“啤酒與尿布”的故事大家應該都聽過——通過相關性分析,商家發現啤酒的銷量與尿布的銷量高度正相關。于是他們在陳列上,把啤酒和尿布離得更近,以此來提高銷量。
當然,這完全是個不切實際的、杜撰的故事。(杜撰者是Teradata公司的一位經理——估計是營銷經理,為了說服商家購買他家的數據服務,編的軟文)而這裡想說的重點是:相關性分析。
如今,不管是傳統行業還是互聯網行業,數據已成為企業内部最重要的資産之一。
而各家公司的數據分析師,幾乎每天都會做的一件事就是:分析各個因素之間的相關性,并以此來找到增長方法。
比如遊戲公司發現:用戶玩遊戲時間越長,留存往往越好,所以就重點提升新用戶的遊戲時長,以此大幅提升留存。
再比如便利店通過監測發現:人們逆時針環顧店内的時間占比越大,人均消費就越高,所以在裝修和陳列上,就盡量引導人們逆時針行走。(因為右撇子的人更多,而一般逆時針環店能讓更多商品出現在人右側,這樣拿東西更方便,也就拿得更多了)
不可否認的是:通過相關性分析,确實能找到很多有效的增長方法。不過,過于迷信相關性,有時卻會帶來相反的結果。
比如某社交APP想提高留存。
他們發現:用戶發消息的條數,與留存的相關性系數是最高的。
不僅如此,他們還發現:消息條數超過500的用戶群體,與沒有超過500的用戶群體,留存情況出現了斷崖式的差異。(這裡的“500”,通常被稱為“魔法數字”)
于是,為提高留存,團隊就提出:假如我們設法提升新用戶發消息的條數,盡量使之超過500,就可以明顯提高留存了。
再于是,他們就通過設置“階段性有獎任務”(發消息到一定條數,就會觸發獲獎提示,并告知下一個有獎任務),将所有新用戶的消息條數都給拉了上去,并基本超過500。
然而,最後的結果卻是:雖然整體的短期留存上去了,但整體的長期留存反而下降了。
為什麼會這樣?明明消息條數和留存的相關性是最高的呀…
其實,這就是典型的誤把相關當因果,甚至是因果倒置——不是因為條數多,所以才留存好,而更多是因為留存好,所以才條數多。
上述的方案,雖然短期能通過利益提高留存,但對真正願意使用産品的用戶來說,獲獎提示可能是一種打擾。
另一方面,利益的刺激會帶動更多非目标用戶(羊毛黨)下載和使用APP,拉低用戶質量,所以長期留存就降了。
而最終關于留存的優化方案,其實是在廣告方面:因為該APP是重點參考Instagram來做的,特點在于圖像相關的功能。
但此前的廣告隻是模糊的說了“好玩有趣”,沒有突出具體的“功能和使用場景”,所以造成用戶預期與産品不符,留存就不高的情況。
有趣的是:在之前數據分析的結果中,廣告與留存的相關系數并不算很高。
三、坑3:隻信看得見的數據如果說上述兩個坑,分别是因為對數據和業務不夠理解才掉進去的,那第3個坑,可能就是越理解數據和業務,就越容易掉進去。在以往的文章中我也說過:數據最大的問題,是它隻能顯示有數據的信息,而不能顯示沒有數據的信息。
克萊因·克裡斯坦森将這兩種信息分别稱作:積極數據&消極數據。
積極數據是指有結構、可量化的數據。比如:銷量,銷售額,留存率,轉化率,複購率,利潤率,付費率,性能指标,市場規模等等…(能規範的被整理到Excel裡的數據都是積極數據)
而消極數據呢,就是指那些沒有清晰的結構,也很難被發現和量化的數據。比如用戶使用産品背後的動機,情感,觀念,習慣,以及這些因素跟随時代的變化等等。
從業務誕生的那天開始,企業就會掌握越來越多的積極數據:
- 哪些産品賣得最多?
- 哪些産品利潤最高?
- 複購率如何?
- 顧客年齡如何分布?
- 市占率是多少
- ……
而随着積極數據的增多,它對企業内部的影響也會越大:
- 銷售部會根據不同産品的銷量和利潤,去影響生産規劃
- 品牌部會根據品類在網絡的關鍵熱詞,去調整産品賣點
- 投放部會根據老用戶的屬性,精準投放新用戶
- 客服部也會根據用戶反饋,給産品提優化建議
好像一切都會正向發展,并慢慢沉澱為“經驗”。
不過,一些“經驗之外”的東西,也在醞釀和發生着。以電商為例,當阿裡和京東根據自己的增長經驗,擴充更高客單價的品類,搶奪更高淨值的人群,設立專門的打折促銷日,并戰略性放棄低端市場的時候,拼多多卻突然冒了出來,并且隻用幾年就變成用戶量全國第一。
阿裡和京東其實都沒有錯,但拼多多是憑什麼?那些低線的用戶,為什麼不用淘寶,卻要用拼多多?
因為更便宜。
為什麼拼多多更便宜?因為它有很多作坊貨、山寨貨。
那為什麼這些作坊貨、山寨貨要去拼多多賣?
一方面是其他平台不讓賣,另一方面,拼多多的拼團模式能讓他們利薄多銷——跟在線下參加趕集一樣。
是的,對于低線的用戶(包括商家)來說,拼多多才是首個把他們線下購物的場景搬到線上來的APP——不管是組團購物、砍價還是買賣山寨便宜貨,本來就是他們線下的日常。
至于淘寶和京東,對他們來說則更像城裡的商場——貴,去的次數也不多。(而且對他們來說,但凡貴的東西,要看到實物才踏實)
這跟“積極數據”和“消極數據”有啥關系呢?先說“消極數據”。
為什麼拼多多能看準這個市場機會?還發明“社交電商”這個新物種?
其實,對于低線用戶來說,購物本身就是社交——大家一起上街買東西;遇到熟悉的商販砍砍價,你買一斤花生,他送你兩顆棗;你幫隔壁大嬸帶點蔥,隔壁大嬸幫你帶點鹽。既有商品交易,也有情感往來——這就是拼多多洞察到的,關于用戶購物的消極數據。
所以,什麼“幫砍拼送”,什麼“社交電商”,本來就來源于生活,來源于對那些消極數據(動機,情感,觀念,習慣等)的洞察。
拼多多隻不過是把它們搬到了手機上,讓它更容易發生而已。
至于阿裡和京東,毋庸置疑,他們的核心團隊一定是既懂電商業務,又精于數據分析。不過,這麼專業的團隊,為什麼沒有在拼多多之前把握市場機會?
這裡的原因是多方面的。
企業要增長,團隊要成長,自然更願意把注意力放在利益更大的地方——更高淨值人群,更高客單價産品,更高頻的産品等等。(包括現在的拼多多也一樣)
另一方面,如泉湧噴的積極數據,也很自然的将内部注意力集中于産品和指标:
- 如何提升物流效率?
- 如何提高廣告收入?
- 如何提高用戶活躍?
- ……
就這樣,在利益和數據的驅動下,他們會越來越了解自己的用戶,并提供越來越好的産品和服務。
但與此同時,他們也會越來越了解誰不是自己的用戶——“那些低線的人,就不是典型的電商人群,我沒什麼精力去關注他們。”
不過,正是因為這種因數據導緻的、慢慢被固化的偏見,所以才導緻市場被分化,被占領,甚至被颠覆。
本文由 @小雲兄 原創發布于人人都是産品經理,未經作者許可,禁止轉載。
題圖來自Unsplash,基于CC0協議。
,