目录/Contents3.1 数据清洗3.2 数据的来源第三章 数据的处理3.3 数据的修整3.1 数据清洗数据清洗就是将格式错误的数据进行处理纠正,将错误的数据纠正或删除,将缺失的数据补充完整,将重复多余的数据删除。3.1.1 数据一致性处理通过统计调查收集上来的数据,经常会出现同一字段的数据格式不一致的问题,如图3-1 所示。这会直接影响后续的数据分析,所以必须对数据的格式做出一致性处理。图3-1 数据格式不一致的资料1.1 数字通信系统的基本概念 下面就以图3-1 所示的数据为例,将“身高”这个字段中的数据去掉字符“cm”。打开Excel 文件“数据处理.xlsx”,找到“数据清洗”工作表。(1 )把鼠标指针移到字母C 上,当指针变成 时,单击选择C 列,如图3-2 所示。(2 )选择“查找和选择”|“替换”命令,如图3-3 所示。4 图3-2 选择C 列图3-3 选择“替换”命令(3 )在“查找和替换”对话框的“查找内容”中输入“cm”,设置“替换为”为空,单击“全部替换”按钮完成替换,如图3-4 所示。替换后的结果如图3-5 所示。图3-4 输入查找内容和替换内容图3-5 替