第第 4 章章 三心二意三心二意数据处理数据处理主要内容:主要内容:4.1、何为数据处理、何为数据处理 4.2、数据清洗、数据清洗 4.3、数据加工、数据加工 4.4、数据抽样、数据抽样 4.5、本章小结、本章小结4.1.1 数据处理原则数据处理原则“三心二意三心二意”“三心二意三心二意”处理数据处理数据信心信心信心是指未看见任何未来信心是指未看见任何未来时,你依然怀抱希望,坚时,你依然怀抱希望,坚持下去。持下去。细心细心 1%的错误的错误=100%的失败的失败平常心平常心诚意诚意合意合意第一,老板永远是对的第二,如果老板错了,请参 考第一条。平淡、平等、平静地对平淡、平等、平静地对待问题待问题 诚心诚意,诚心诚意,诚实、尊重事实。诚实、尊重事实。4.1.2 数据处理的内容数据处理的内容数据清洗数据清洗数据加工数据加工数数据据处处理理的的内内容容重复数据的处理重复数据的处理检查数据逻辑错误检查数据逻辑错误缺失数据的处理缺失数据的处理数据抽取数据抽取数据计算数据计算数据分组数据分组数据转换数据转换多多一一分分则则肥肥,少少一一分分则则瘦瘦。函数法函数法:用函数识别重复数据。用函数识别重复