Excel 如何數(shù)據(jù)清洗
[日期:2025-02-24] | 作者:衛(wèi)星醬 次瀏覽 | [字體:大 中 小] |
Excel 如何數(shù)據(jù)清洗
秋葉Excel 2025/2/8 13:09:13 責編:夢澤評論:0
原文標題:《Excel 里把人“逼瘋”的雜亂數(shù)據(jù),原來 1 分鐘就能整理好!》
鏘鏘!大家好哇~ 我是最近在研究數(shù)據(jù)分析的衛(wèi)星醬~
數(shù)據(jù)分析中有個很重要的預(yù)處理步驟,叫做「數(shù)據(jù)清洗」。
簡單來說就是把數(shù)據(jù)中「臟臟的 」部分 —— 缺失的、重復(fù)的、錯誤的等等,給它清除掉,剩下「干凈的」數(shù)據(jù)。
光講概念也太難理解了,衛(wèi)某今天就直接用實例,給大家看看數(shù)據(jù)清洗,到底是怎么個事兒~
1、缺失數(shù)據(jù)
如果某處缺了一兩個數(shù)據(jù),最簡單的方法就是 —— 扔了它。
別笑!
這的確是正規(guī)的數(shù)據(jù)清洗手段,在表格不大、不完整數(shù)據(jù)較少的情況下,完全可以這樣做。
「比如 2002 年「產(chǎn)品 C」的產(chǎn)量缺失了,那就偷偷把 2002 年從統(tǒng)計表里刪掉,只分析后面的~」
Excel 如何數(shù)據(jù)清洗
但這樣可能將潛在信息刪除,也可能導(dǎo)致數(shù)據(jù)分析出現(xiàn)較大偏差。
所以,如果數(shù)據(jù)很多、空缺也多,刪除過多條目會使得結(jié)果產(chǎn)生較大偏差時,我們還是得把空缺補上。
? 空值變 0 值
【Ctrl+G】定位,【定位條件】,選擇【空值】,【確定】,最后輸入 0。
Excel 如何數(shù)據(jù)清洗
? 統(tǒng)計學方法
但很多時候不能這樣粗暴地填充。
實際應(yīng)用常選擇統(tǒng)計學方法,比如平均值,來填充缺失的數(shù)據(jù)。
Excel 如何數(shù)據(jù)清洗
當然,根據(jù)數(shù)據(jù)實際類型,也可能使用中間值、最大值、最小值或者其他更復(fù)雜的函數(shù)值。
像這個預(yù)測函數(shù),就怪好用的。
Excel 如何數(shù)據(jù)清洗
2、重復(fù)數(shù)據(jù)
至于重復(fù)數(shù)據(jù),在之前的「數(shù)據(jù)核對」篇中已經(jīng)講過了,這里就不再贅述。
點此回顧「數(shù)據(jù)核對」
很多時候,我們在基礎(chǔ)的 Excel 應(yīng)用中就完成了「數(shù)據(jù)清洗」的步驟。
數(shù)據(jù)分析的門檻,真的沒我們想象的那么高~
3、錯誤數(shù)據(jù)
函數(shù)錯誤值,比如#DIV / 0!、#N / A! 之類,只要在公式外套上 IFERROR 就行:
Excel 如何數(shù)據(jù)清洗
另一種錯誤數(shù)據(jù),就沒那么好對付了……
「比如等級只有「A / B / C」三種,有個單元格卻出現(xiàn)了「D」的;或者要求填寫「√」,偏偏有人寫「?」的……」
這種除了在一開始設(shè)置數(shù)據(jù)驗證,就只有用查找、計數(shù)、條件格式等偏門方法了
這種錯誤數(shù)據(jù)「D」,可以用【查找】或【篩選】直接定位它。
Excel 如何數(shù)據(jù)清洗
而「感覺上不對」的數(shù)據(jù),就比較難找到了:
Excel 如何數(shù)據(jù)清洗
▲ 誤差過大,不是測量誤差可以解釋的
這時我們就只能因地制宜,想辦法定位它,例如用 IF 函數(shù)篩選大于 36.13 的數(shù)據(jù)。
找到之后按照「缺失數(shù)據(jù)」的辦法處理它就是了。
4、寫在最后
好啦,今天從數(shù)據(jù)類型的角度給大家簡單講了下數(shù)據(jù)清洗的做法~
小伙伴們還知道哪些屬于數(shù)據(jù)清洗的 Excel 操作呢?
本文來自微信公眾號:秋葉 Excel(ID:excel100),作者:衛(wèi)星醬