老吳評析:無論是商業分析、學術研究還是實證研究,問卷數據分析的質量直接決定報告輸出的質量;在數據分析中,除了要緊扣研究目的、忠于研究設計和研究假設之外,還完成數據清洗、數據重整、數據檢驗、分析挖掘等一系列标準動作,本文對問卷數據分析的流程進行系統梳理,對處于分析能力進階的小夥伴提供了較為系統的指引。
問卷調查是一種重要且常用的調查方式,不僅省時省力,而且具備短平快的優勢,無論是日常生活中還是學術研究中都備受青睐。
那麼在采用問卷調查快速獲取統計數據時,為了确保數據的準确性和有效性,保證數據的質量,應該如何做好數據分析呢?下面就來詳細聊聊!
一、數據清洗
在做數據分析前,先檢查數據是否完整、可信,因此先從數據清洗入手。
1、檢查數據是否完整,是否有異常值
針對選擇題、排序題這類封閉題型的答案進行查看題目的總量,缺失值,是否有異常值。
2、檢查邏輯是否合理性,是否有前後矛盾
利用前後題目邏輯關系進行測謊題,篩選出前後矛盾的答案。
二、樣本加權
由于問卷調研大多是抽樣調研,因此想要通過樣本去推測整體的情況,除了考慮最小樣本量,還需要考慮樣本的代表性。
三、數據分析
1、描述統計,看整體分布情況
統計各選項的數量、頻率是最常用到的分析,然後通過圖表展現出來,可以非常直觀的看出整體分布情況。
2、差異分析,找影響因素
通過差異分析,可以探索出更多的信息。差異分析有三個步驟:
1)找到兩個可能有關系的因素。
2)将兩個因素交叉統計結果,根據結果在這兩個因素間做假設。
3)根據這兩個因素的數據類型,選擇合适的統計方法,從而驗證假設。
3、相關分析,找影響因素,以及影響程度
1)比如一份問卷調查,想要了解單個因素與忠誠度之間的關系,那麼就需要用到相關分析。
通常來說,相關系數介于-1~1之間,絕對值越大關系越密切,符号代表相關的方向。絕對值大于0.4則可以認為這兩個數據之間有比較強烈的關系了。所以絕對值越大,說明這個因素的影響程度越大。
需要注意的是,相關分析隻能解釋兩個變量之間有無關系,不能得到因果結論。
2)如果想要了解多個影響因素合并一起對忠誠度的影響,則可以使用多元回歸法。
比如一份問卷調研中,在探索用戶遇到使用問題的次數與忠誠度的關系時,用戶遇到的問題有4種,分别是定位問題、地點問題、路線問題、性能問題。則可以以NPS值為因變量,将這四個問題一起作為因變量,求一個多元回歸方程。
不過多元回歸方程的建立,對數據的要求比較高,實際調研中使用的非常少,一般相關系數基本夠用了。
在做調研時,不是拿到數據了才去想怎麼分析,而是在編制問卷時就要考慮清楚要怎麼去分析數據。
,