問題:大量數據中有一些數據是文本格式,導緻數據彙總不準确。
分析:在工作中對數據進行統計分析時會出現這種情況。在工作中經常會采用Excel進行數據統計分析,會對數據的一列進行求和,但是總是會出現,求和數和人工算出的數據不一樣,是什麼原因呢?
結論:是由于表格在制作和寫入的過程中,數據不純導緻的,而數據求和隻是針對“數字”(常規等可以加減的數據都可以)格式,當數據以文本形式顯示時,就不是“數字”形式,而是文本形式了,就不能進行求和計算。
舉例說明:如下圖所示的情況,在Excel中求和算出來的金額是8800,但是實際的金額應該是11000,導緻出現偏差的原因就是發放金額中有4個人的發放金額是文本格式,不能進行加減計算。
圖一
下面講解如何解決:
首先,将這一列數據選中,選中“數據”--“分列”,會彈出如下文本框,
圖二
彈出文本框之後,根據自己的需要進行選擇,對于數據這種情況,沒有需要分割的,就直接點擊下一步,一直到結束。操作完成之後,就會全部是常規格式,常規格式就是默認格式,就會變成數據格式。如下圖:
圖三
這樣,再次對發放金額欄進行求和,就會是正确的數據了。每次對這種大批量的數據進行操作時,就會正确的進行統計分析了。
是不是覺得超簡單呢
那分列還能實現哪些常用的功能呢?
小編就工作中經常遇見的一種情況和大家分享!
用法一:可以快速截取數據中的某一段,或将一個超長文本變成幾段比較短的需要的形式。
在工作中會遇到一種情況,就是需要提取一列中的數據中的前幾位,比如在下面(圖四)中省份一列,我們想要單獨提取省份而不需要其他市、區等信息,可以用公式實現,但是如何才能更簡便呢?
圖四
下面通過分列功能來實現:
圖五
選中需要分列的字後面,點擊下一步。
圖六
選擇你需要的文本格式,
圖七
然後選中剩下的文本再進行編輯,
圖八
分成幾段就依次對數據進行操作,如果不需要,就可以如圖八所示,選擇不導入此列。到此完成操作。
用法二,對身份證号碼進行操作,把日期摘出來進行其他操作。
圖九
身份證号碼的第7位開始後面依次代表年月和日,倒數第二位代表性别。有時候需要通過身份證信息來提取信息,增加數據準确性和純度。也可以采用分列法快速實現。
圖十
将日期欄選出來,以日期格式,點擊完成。如果要展為日期的格式,隻需對其數字格式進行編輯就行了。
圖十一
圖十二
采用同樣的方法可以将代表性别的數據篩選出來。
注意事項:
(1)在進行分列的操作中,原始數據欄要注意保存,分列出來的數據要占用當前一欄。
(2)如果一個字符串要分列出來多個字符串,那麼也要相應的插入要分列成幾欄的空白列,以保證後面的數據不被占用而丢失原始數據。
(3)隻需要對要處理的數據選中操作即可,不必對表頭等其它信息進行選中,一是分列不支持對合并的單元格進行操作,二是表頭如果被選中也會進行操作,增加時間成本。
是不是超簡單呢?每天一個操作小技巧,加班不存在,關注不迷路。
,