直方圖(histogram)
直方圖是從總體中随機抽取樣本,将從樣本數據加以整理,用于了解數據的分布情況,使我們比較容易直接看到數據的位置狀況、離散程度和分布形狀的一種常用工具。它是用一系列寬度相等、高度不等的長方形來表示數據,其寬度代表組距,高度代表指定組距内的數據數(頻數)。(直方圖适用于連續性數據)
我們要如何解讀直方圖?第一步應先大緻了解一下直方圖有哪些作用:
直方圖的作用
- 直觀地顯示質量特性的分布狀态,對于數據的分布的形狀、中心位置和分散程度一目了然;
- 關注數據和規格的關系,通過測定值與規格值比較,判斷出不良是平均不良還是異常的不良,便于人們确定在何處進行質量改進;
(在此對平均不良和異常不良作個解釋:平均不良通常代表的是系統的問題,是整個過程的不良;異常不良卻代表了個别的離散的不良,屬于個别問題。)
- 比較改善前後的直方圖,可了解平均值、分散、分布形狀的變化,改善的效果如何。
解讀直方圖
首先我們要了解直方圖的形狀,通過直方圖的形狀了解過程是否異常。
一.直方圖的形狀:
1.常态型:中間高、兩邊低、有集中邊勢,顯示過程正常。
2. 離島型:在右端或左端形成小島。說明一定有異常原因存在,如數據收集方法錯誤、數據來源不同或新手作業違背操作規程等特殊原因,需迅速追尋原因,采取必要措拖。
3. 雙峰型:有兩個高峰出現。兩台不同的機器或兩種不同原料間存在差異時,或者作業者不同時也可發生此類直方圖。例如,病曆質控的2位質控員對檢查标準掌握有差異時,又或者同一位質控員應用兩種評估标準檢測的結果。出現這類情況時,應将數據層别處理後再制作直方圖。
4. 鋸齒型:圖形的柱形高低不一,呈現缺齒的形狀。這種情況大多因為制作直方圖的方法錯誤(如:數據分組問題、計算組距問題、計算界限問題等)或數據收集方法不正确(如:不同設備數據、不同人收集的數據、不同時段數據造成)産生。
5.偏态形:高處偏向一邊,另一邊低,拖長尾巴。可分偏右型,偏左型。這種偏态分布理論上是規格值無法取得某一數值以下所緻,在質量特性上并沒有問題,但我們需要留意拖長的尾端在技術上是否可接受,同時應考量制程能力,如過程能力不夠時需進行改善。
6.高原形:直方圖的柱子高低近似,柱子間高度相差甚微,看起來有點像高原一樣,則稱為高原形。當數據來自幾種平均值差異不大的産品,而這些産品有混在一起時,制作出來的直方圖往往就是高原形,應層别之後再作直方圖比較。
二.與規格比較:過程是否異常除了查看直方圖的形狀,還要結合産品的規格一起來評估。
在這裡先解釋一下什麼是規格,規格通常是根據客戶要求來定的(産品的規格),然後在實際工作中,收集數據計算出控制限。如果客戶沒有給出,就以行業标準為準。
規格又分為雙側規格(同時有上下限的要求)和單側規格(隻有上限或下限的要求,如時間數據、分值數據等)
直方圖與規格比較時又分為符合規格和不符合規格兩類:
(一)符合規格:
1.理想型:規格值的平均值與産品的分布平均值重合,而且直方圖的下限與上限均在規格值的上下限範圍之内,直方圖的下限與規格值的下限、直方圖的上限與規格值的上限之間的距離為4個标準差左右,這樣的直方圖時最理想的直方圖。
2.一側無餘裕:産品的分布均在規格值範圍内,但是偏向上限或者下限分布,造成單側擁塞,另一邊餘裕很多。若過程再變大(或變小)很可能會有不良發生, 必需設法使制品中心值與規格中心值吻合。
3.兩側無餘裕:産品分布的下限與規格下限重合,分布上界限與規格上限重合,即分布與規格恰好相等。雖沒有不良發生,但過程稍有變動,就有不良品發生的風險。最好是平均值保持原狀,但變異方面采取縮小的對策。
4.餘裕太多:也就是過度集中,該類産品分布的範圍較小,而規格值的範圍太大,也就是說制程的能力遠遠大于規格的要求。看上去非常好的圖型,但如果此種情形是因增加成本而得到, 并非好的現象, 故可考慮縮小規格界限或放松質量變異, 以降低成本、減少浪費。
(二)不符合規格:
1.平均值偏左(或偏右):也叫單邊不良形,表示平均位置有偏差,應考慮過程的能力不足,需尋找系統原因,糾正平均值位置,提高品質水平。
2. 分散度過大:也可稱為雙邊不良形。産品的最大值與最小值均超過規格值, 有不良品發生表示标準太大, 制程能力不足。應針對變動的人員、方法等方向去追查, 要設法使産品的變異縮小; 如果是規格訂得太嚴, 應放寬規格。
3.離島現象:有“離島”産品出現,且發生不良現象,說明過程有異常原因存在,應調查離島的原因,判明離群原因(通常為特異原因)并予以去除。
直方圖的制作
制作直方圖的步驟:
第1步:整理數據表,用随機抽樣的方法抽取數據,一般要求數據在50個以上。
【例】某醫院門診部對内科病人候診時間進行抽樣調查,測量了2月份60位病人的等候時間,經整理如表1
第2步:計算全距(R):也叫極差,是所有數據中最大值與最小值的差。
R=Xmax - Xmin =96 - 1 = 95
第3步:确定組數(k)。組數不可過多過少,過少,會掩蓋數據的分布規律;組數過多,使數據過于零亂分散,也不能顯示出質量分布狀況。組數的确定可有兩種方法:
方法1:可參考表2的經驗數值
方法2:很多情況下,分組數約等于樣本容量的平方根是比較合适的:表1中有60個數據點,應分組數為:k = √60 ≈8
第4步:決定組距(d)。組距是組與組之間的間隔,也即一個組的範圍。因為各組距應相等,于是有:
組距(d)= 全距(R)÷組數(k)= 95÷8=11.875≈12
(為便于計算平均數與标準差,組距常取為5的倍數或10的倍數,或2的倍數)
第5步:決定各組的上下組界。每組的最大值為上限,最小值為下限,上、下限統稱組限
最小一組的上組界=下組界(最小值-測定值最小位數/2) 組距 = 0.5 12 =12.5
……
依此類推,計算至最大一組之組界
第6步:制作頻率表
第7步:畫直方圖(簡單直方圖)
以橫坐标表示各組的中點或組限,縱坐标表示頻數,畫出直方圖
組邊限值
組中值
第8步:加入必要的元素:樣本大小、均值、标準差、規格均值、規格上下限
注:此圖因為時間數據,隻有上限要求,因此隻有一條規格線
解釋結果:樣本均值為 30.52,略高于目标值30,但已經很接近了。分布呈右偏斜,說明尚有部份候診時間偏長,且有5例候診時間過長,超過規格上限60分鐘。對此我們可針對超出規格上限的不良事件找尋原因,糾正缺陷,去除不良影響,以改善整體的分布形态,提高過程能力。
軟件繪制直方圖步驟
目前我們可用來繪制直方圖的軟件有EXCEL和MINITAB。由于使用EXCEL制作直方圖過程較複雜,需占用較多時間去完成。而MINITAB軟件在制圖方面,操作簡單,容易掌握,花費時間少。因此,這裡隻介紹使用MINITAB軟件制作直方圖的過程。
第1步:打開MINITAB軟件,在新建工作表裡導入一組數據(可從EXCEL表中複制數據,粘貼到工作表中)。
第2步:菜單欄中選擇“圖形”,在圖形下拉欄點“直方圖”
第3步:點擊“直方圖”後将跳出下面的對話框,因我們隻需繪制簡單的直方圖,所以選擇“簡單”圖形,點“确定”鍵。
第4步:進入下面的對話框時,将鼠标移至左邊方框内雙擊選擇“候診時間”,此時“候診時間”的數據列已選中進入“圖形變量”框内。
第5步:點“确定”鍵進入下一步,直方圖的初型已完成。
在此需要強調一下,因為軟件設定的分組規則與人工計算的方法不一樣,經過反複驗證發現MINITAB的分組規則是樣本容量在100以下均為11組,樣本容量大于100的分組是20組。所以根據實際情況,我們可區間的參數進行調整。
第6步:調查區間數。
⑴ 單擊柱狀區域,令每個柱子的邊角位出現白色小方格
⑵ 鼠标點右鍵在出現的菜單框内選擇“編輯條形”,便出現以下對話框:
⑶ 點擊“區間”可見:這裡可以看到區間數為11,下一步我們要将區間數改為8。
⑷ 點中“區間數”前面的選項框,“區間數”右邊的數字框底色變白,裡面的數字可調整。将11改為8,按“确認”鍵。
⑸ 已成功改為8組區間的直方圖:
因為我們取的是時間數據,不會存在0以下的數值,我們看到軟件直動生成的組中值是0,區間下限是-7.5,所以接下來我們還要對區間的上下限設定進行修改。
第7步:調整組限。
⑴ 重複第6步的(1)—(3),進入以下界面:
⑵ 将區間類型的“中點”改為“割點”,确定後可見下圖。如果有需要我們還可對“中點/割點位置”内的數值進行修改。
⑶ 已成功修改了組限的直方圖:
第8步:在圖形中加樣本數、均值、标準差
⑴ 将鼠标移至圖形中央,點右鍵,在菜單框内選擇“添加”→“分布拟合值”
⑵ 在下面的對話框中選“确定”
⑶ 圖形中增加一條正态分布的概率密度曲線,右側标有樣本數、均值和标準差。
第9步:插入規格均值和規格上下限
⑴ 将鼠标移至圖形中央,點右鍵,在菜單框内選擇“添加”→“參考線”
⑵ 規格均值線和上下限線是由X軸插入,所以要将光标移到“在數據值處顯示參考線”。
⑶ 如果要設定的目标平均值是30分鐘,目标上限是不超過60分鐘,就在“在數據值處顯示參考線”下端的框内鍵入數值“30”确定後再重複第9步的⑴重新進入上面的對話框,再次在“在數據值處顯示參考線”下端的框内鍵入數值“60”,便可得到下圖:
⑷ 為了清晰定義插入的兩條參考線,還需對“30”和“60”的數值标簽進行編輯。選中數值“30”,點右鍵,選“編輯X線條标簽”。
⑸ 在“文本(T)”下框中鍵入“規格均值=30”。規格上限的标簽設定同此步驟
⑹ 以下便是完整的直方圖:
文章轉自網絡,如有侵權請聯系删除。
,