01 02 数据处理 探索性数据分析 目录 CONTENTS 基于Excel的数据分析方法 03 挖掘预测01 数据处理 1、清洗 2、关联 3、统计 4、时间序列清洗 数据分析的第一步是提高数据质量,统一数据标准,否则直接影响数据分析结论。针对拼写错误,数据 异常点,数据缺失,无用信息等做初步处理 ,主要是文本、格式以及脏数据的清洗和转换。很多数据并不 是直接拿来就能用的,需要经过数据分析人员的清理。数据越多,这个步骤花费的时间越长。 e.g. 拼写错误: 数据异常: 格式不统一: 空格,导致匹配出错 月发送量1000亿,高得不要不要的清洗 1、清除字符串两边的空格 Trim(text) 2、字符串合并 Concatenate(text1, text2 ) 常见的合并单元格中内容,还有方式是&,“A”&“B”AB。当需要合并的内容过多时,concatenate的效率更快。 3、替换 Replace ( old_text , start_num, num_chars, new_test ) 常见的把手机号码后四位屏蔽掉,=Replace(“18818849894”,8,4,“*”),返