數據分析SQL面試筆試題系列第6篇來啦!
數據分析面試會重點考查候選人兩方面的能力,一個是基礎的數據工具能力,最常考的就是SQL,這部分前面我們已經有4篇連載文章全面剖析了大廠的常考筆試題型,沒看的同學不要錯過了,可以戳:
考查的另一方面就是業務思維能力了,這一塊主要是設定一些常見的業務場景,需要你給出對應的分析思路和方法,這一塊對于沒有數據分析經驗的小夥伴們來說就很不友好了,很多面試的朋友碰到這類題都會很慌,無從下手,因為沒做過,也不知道怎麼分析啊!!!
不過不用怕,我收集了近幾年一些大廠的面試筆試題,有筆試題也有業務題,通過這些題目的詳細講解,你應該就能掌握這類題目的解答思路了,話不多說,今天我們先來扒一扒字節跳動的面試題目吧!
一共有3道題目如下:
SQL筆試題:計算視頻好評率
業務題1:使用ABTest對新算法效果進行評估
業務題2:如何評估一場活動的效果?
02計算西瓜視頻内容好評率
1)需求
西瓜視頻近期開展了”2020百大人氣創作者”優質内容扶持項目,鼓勵用戶産出優質的視頻内容。現需要統計2020年11月01日至2020年11月30日期間創作的視頻中,“科技”大類下“數碼測評"子類的視頻好評率(好評率=好評數/視頻觀看次數),寫出sql語句進行查詢。
用戶觀看視頻後的評價詳情表:content_action_info
id(視頻id,主鍵)
create_time (創建時間,格式‘2020-11-01’)
user_id(觀看者id)
content_id (視頻id,外鍵)
content_action (視頻評價,包括’點贊‘,’差評‘,‘無評價’)
視頻詳情表:dim_content
content_id (外鍵)
creator_id(創作者id)
content_category (商品類目)
content_sub_category (品牌名稱)
2)解題思路
題目很簡單,我們隻需要明确好評率的計算公式,然後先定特定的大類和子類即可。
1.好評率=好評數/視頻觀看次數。
2.要求計算“科技”大類下“數碼測評"子類的視頻好評率,則要使用where條件篩選指定大類和子類的數據。
3.因為限定條件要指定視頻内容的類别,所以要兩個表做關聯。
代碼如下:
select
count(1) as all_action
sum(case when content_action='點贊' then 1 else 0 end) as like_action
sum(case when content_action='點贊' then 1 else 0 end)/count(1) as like_rate
from content_action_info as a
join dim_content as b
on a.content_id=b.content_id
where b.content_category='科技'
and b.content_sub_category='數碼測評'
anda.create_timebetween'2020-11-01'and'2020-11-30';
1)需求
某個購物APP最近優化了“猜你喜歡”模塊的推薦算法,希望進一步提升推薦的精準度,進而提升銷售額。現在需要通過AB Test(50%用戶保留原先推薦算法的為控制組,50%用戶使用新的推薦算法為實驗組)來對新的推薦效果進行評估。假設你是此次實驗的數據分析師,請問你會如何評估控制組和實驗組的表現?請按重要性列出最重要的三個指标并給出你的分析過程。
2)解題思路
指标:推薦商品的銷售額、推薦商品點擊率、推薦商品的轉化率
分析過程:
1.設原假設為使用新的推薦算法後上述指标降低或不變,備擇假設為使用新的推薦算法後上述指标增加。
2.選擇顯著性水平臨界值為5%,并根據指标的預期提升确定樣本量和試驗周期。
3.樣本合理分流,AB測試上線,采集數據。
4.使用T檢驗,計算P值,進行效果驗證。
5.分析結論,如果P值小于5%,那麼原假設不成立,備擇假設成立,即使用新算法後指标提升。
反之無法推翻原假設,不能證明使用新算法後指标提升.
針對AB Test的拓展閱讀,包括如何确定試驗樣本量和分流,可以翻看曆史文章:【長文幹貨】AB測試:原理流程、實際案例及面試指南。
04 如何評估一場活動的效果1)需求
某APP近期上線了一個拉新活動,并在各個渠道進行了推廣投放,活動結束後,作為數據分析師,你如何評估這場活動的效果?
2)解題思路
如果要對一個活動效果進行分析,無非是要回答以下3個問題:
- 1、活動效果怎麼樣?要不要繼續做?
- 2、如果可以繼續做,活動的做的好的方面是哪些?問題或者瓶頸環節在哪?
- 3、針對問題環節的改進方案是什麼?
具體展開來講,可以從以下幾個方面
1、活動關鍵指标達成分析
活動關鍵核心指标達成情況,比如拉新多少用戶,達成多少GMV?ROI如何?
2、活動關鍵流程漏鬥分析
活動的關鍵流程是什麼?以及各個流程的漏鬥分析,定位問題發生的環節。
3、活動的渠道、用戶分析
活動在哪些渠道推送?活動推送給哪些用戶?用戶畫像是啥樣的?各渠道用戶的質量/ROI如何?
4、活動策略、節奏分析
活動玩法的裂變效果如何?利益點是否有吸引力?活動整個過程節奏把控如何,前期預熱、中期爆發和尾期是否過短/過長,運營應該在何時進行适當幹預。
以上就是數分面試寶典系列—SQL高頻筆試題第6篇文章的内容,部分曆史文章請回翻公衆号,更多數據分析面試筆試的文章持續更新中,敬請期待,如果覺得不錯,也歡迎分享、點贊和收藏哈~
,