在統計學中,标準分數是原始分數(即觀察值或數據點)的值高于或低于正在觀察或測量的平均值的标準偏差數。高于平均值的原始分數具有正标準分數,而低于平均值的原始分數具有負标準分數。
标準分數的計算方法是從單個原始分數中減去總體平均值,然後将差值除以總體标準差。将原始分數轉換為标準分數的過程稱為标準化或标準化。
結合偏差是變量的觀察值與其他值之間差異的度量,通常是該變量的平均值。偏差的符号(正或負)報告差異的方向(當觀察值超過參考值時偏差為正),值的大小表示差異的大小。
标準計分和離差應用方法标準化和标準計分
标準計分又稱作标準分數。一份學生的成績表單,琉衣的英語90分和由美的90分同樣都是90分,有沒有辦法比較其對應成績的含金量呢?
通過計算每科的平均分數,英語=81.3,古文=74.3。看看她們各自超越平均分的一個情況就一目了然了。
但是如果平均分數相同的情況下、分數也相同的情況下應該如何衡量?
可以計算标準差,曆史=22.7,生物=18.3。标準差越小反應該組數據離散程度越小,反之亦然。離散程度的高低決定了該組數據的重要性。離散程度低的數組比離散程度高的數據更加重要,說通俗一些就是離散度低的數組即生物成績比較值錢。
如果進行标準化處理就會變得非常簡單了,也就是制作 标準分數。
- 也稱标準化值,是對某一個值在一組數據中相對位置的度量。
- 可用于判斷一組數據是否有離群點(outlier),用于對變量的标準化處理。
Zi=x1−x¯S
标準計分每數據均值标準差标準計分=每數據−均值标準差
根據上面的案例計算标準分數。分值高的則反應對應的數據比較值錢。
琉衣曆史标準分數 = (73-53)/ 22.7 = 0.88 由美生物标準分數 = (73-53)/ 18.3 = 1.09
在這裡插入圖片描述
标準計分特征對于均值樣本來說,總體區間和單位不同的場景都是可以使用标準計分進行比較。
- 無論作為變量的滿分為幾分,其标準計分的平均數勢必為0,而其标準差勢必為1。例如考試滿分100分和150分也是可以進行比較。
- 無論作為變量的單位是什麼,其标準計分的平均數勢必為0,而其标準差勢必為1。例如足球裡射門次數和入球次數相同的情況也是可以進行比較
離差是應用标準計分所得的數值。
- 無論作為變量的滿分為幾分,其離差的平均數勢必為50,而其标準差勢必為10。
- 無論作為變量的單位是什麼,其标準計分的平均數勢必為50,而其标準差勢必為10。
離差 = 标準計分*10 50
對于上面琉衣的曆史成績和由美的生物成績進行對比。
琉衣曆史标準分數 = (73-53)/ 22.7 = 0.88 琉衣曆史離差 = 0.88 * 10 50 = 58.8
由美生物标準分數 = (73-53)/ 18.3 = 1.09 由美生物離差 = 1.09 * 10 50 = 60.9
這個和标準計分反應的結果是一樣的。
《三國志》武将屬性能力應用遊戲中的原始數據是這樣的,目标計算各個屬性 TOP 1 中的人物,誰的能力更加出色。
篩選出來個各項數據TOP 1的武将
統率:司馬懿
武力:呂布
智力:諸葛亮
政治:荀彧
魅力:劉備
計算每個項目對應的均值和标準差
單項數據計算結果和排名
,