數據給你一雙看透本質的眼睛,這裡是《數據分析思維課》。
數據分析思維課不僅是講理論,我們還要實踐。所以這節課我們來把前兩節課講過的 18 個技巧再進行一下實操,我們回到前面課程裡的實例,看看這些技巧在真正實踐當中是怎樣使用的。
實踐 1:平均值
首先回到我們的平均值這節課,你能看到課程裡面有這樣的一張圖,這張圖由若幹個柱狀圖和一條平均線組成,其中柱狀圖的平均線是由 Excel 自動計算出來的。那麼我們怎樣用 Excel 來實現呢?你可以看一下我視頻當中的操作方法。
視頻演示:
你要注意,在畫這個圖時要注意以下幾個重點:
- 所有的柱狀圖的間距都是要調整的,否則每個柱狀圖都會變成豆芽菜的形狀,非常難看;
- 數據标注時一定要做顔色位置調整;
- 平均線其實 Excel 是無法自動計算出來的,所以我們需要用組合圖的方式把平均線通過折線圖加入進來。
實踐 2:直方圖與幂分布
我們接下來看第 2 個實踐案例:畫直方圖。你可以看到第 5 節課的數據圖形是下面這個樣子的。
這兩張圖其實都是由柱狀圖組成的。第一個直方圖是我們使用的是事後統計出來的數據,所以不能用 Excel 自帶的直方圖進行繪制。
第二個圖是網上的大量數據先通過 Excel 的數據透視圖,再選擇相應的指标維度并進行排序,最後找到相關的趨勢線就完成了。我在視頻裡的操作其實是非常快的,這是因為這些技巧我已經非常熟悉了,當然,你不妨參照我的視頻一步一步做一遍,你也一定可以和我一樣熟悉這些技巧。
視頻教學:
- 其中重點有這樣兩個:
- 直方圖的圖距進行了調整,才可以調成我們圖中的這個樣子;
數據透視圖要選好計算指标,同時在圖中可以利用排序和調整圖形屬性來變成直方圖。
實踐 3:數據分布
緊接着我們來看一個比較複雜的例子:第 6 節課數據分布裡面的正态分布曲線。 Excel 不能自動生成正态曲線,它需要通過組合圖的方式把計算出來的直方圖和模拟出來的正态曲線,放在一個圖裡面進行比對,才可以完成下圖當中這個樣子。
你可以看我在視頻裡面給你做的演示:
重點有這樣幾個:
- 使用前面的複雜公式統一填寫模式;
- 使用拖拽自動生成序号和 copy 的模式;
- 使用 Tab 鍵自動填充公式關鍵字;
- 使用複雜的 FREQUENCY 和标準差、正态分布函數。
你看我在視頻當中操作的過程也是非常快的,你以後在做相關數據分析的時候,也要以這樣的速度來處理,這樣你的手速才會跟上你的思路,更快更好地做好數據分析。
實踐 4:散點圖和相關性
我們在第 7 節課的時候講過,Excel 不僅可以非常方便地畫出散點圖,還可以在 Excel 裡面給出相應的趨勢線預測。
在下面的視頻演示中,我會給你講一講上面這個散點圖是怎麼在 Excel 裡繪制出來的,同時我還會和你分享如何去選擇一個比較好的趨勢線來說明這些散點的大方向和趨勢。你看完這個視頻就會發現,Excel 在做小數據分析的時候真的非常方便,從趨勢線的模型選擇到散點圖的調整其實都已經幫你設置好了。
視頻教學:
重點有這麼幾個:
- 散點圖 X、Y 變量設置;
- 趨勢線的選擇;
- 最後公式的比較。
實踐 5:标準差
在第 8 節課裡,我們講了标準差和标準誤差這兩個概念。标準差還可以叫做标準偏差,它可以在 Excel 裡快速計算出來。
在 Excel 裡計算标準差時,有兩個函數都可以計算出标準差。
- 一種是我們認為給出的标準差就是總體的标準差,這個時候我們就用 STDEVP 函數;
- 另一種是用于計算樣本估算的整體的标準差,也就是我默認去拿出來的樣本是抽樣出來的一些數據,并不是我們拿到的整體的所有的人的樣本量,也就是用 STDEV 函數。
是不是感覺有點繞?我給你舉個例子。如果我們全組就 5 個人,我把所有人都計算進來,計算标準差,這個時候我們就可以用給定樣本的總體标準差 STDEVP 計算公式;如果這一組是 500 人,我們隻抽調了 5 個人來看看這 500 人之間的标準差可能是什麼樣子,我們就會使用估算的整體樣本标準差 STDEV 進行計算。
具體方法你可以參考一下這個視頻:
在這個例子裡我們的重點是區分來自抽樣數據還是全部數據,選擇不同的标準差公式。
通過跟着視頻做這些之前課程的案例你能感覺到,雖然我們在前面講了很多的基礎理論和知識點,但這還是不夠的。到真正上手實踐的時候,你還要區分出來具體的業務場景是什麼,然後使用合适的相關的公式才能得到正确的數據,這就是數據分析思維的嚴謹性所在。
小結
這節課主要是用 Excel 來實踐一下我們之前課程裡的例子,也是二次磨合鍛煉一下前面兩節課的一些技巧。其實數據分析并不難,但如果你想要快速做數據探查,給出各種各樣的數據分析結果,前面介紹的這些技巧你一定要掌握好。否則可能兩三分鐘演示出來的一個實例,你自己沒有很好掌握的情況下,花半個小時都做不出來。
我們對工具的熟練可以讓你的手速跟上你的“腦速”,這也就是為什麼我沒有用其他的工具,一定要給你講解 Excel 的原因。我們使用大數據算法的時候,往往會把注意力都放到編程當中而忽視了數據本身。我們在做管理決策的時候,往往不是在大數據裡面做決策,而是在我們的小數據裡。
這個時候我們要是有一個得心應手的數據分析工具,就可以幫助我們在工作和生活當中得到更好的分析數據結論,更好地貫徹我們的數據思維。影響我們最終決策的,往往是凝聚高信息熵的小數據,而 Excel 正是處理這方面數據的神器。同樣,你可以點擊這裡(提取碼 hnwf)獲取我們這節課的 Excel 文件,方便你進一步學習。
數據給你一雙看透本質的眼睛,我希望你學完這門課之後,不僅能成長為數據分析的理論高手,更要成為數據分析的實踐能手。
思考
我給你介紹這些案例的實踐方法隻是若幹種實踐方法之一,你還有沒有更聰明的做法?分享出來我們一起提高。
關注緻用教育,我們共同成長
,