1、Nankai University1第三章 数据的图表展示示例:统计研究表明,多种原因会使寿命减少v文字描述未结婚的男性会使寿命减少 3500天,未结婚的女性则减少 1600天;吸烟的男性会使寿命减少 2250天,女性则减少 800天;饮酒会使寿命减少 130天;超重 30%会使寿命减少 1300天,超重 20%则减少 900天;滥用药物会使寿命减少 90天 Nankai University2v表格描述Nankai University3原因 寿命减少的天数未结婚(男性) 3500吸烟(男性) 2250未结婚(女性) 160030%超重 130020%超重 900吸烟(女性) 800饮酒 1
2、30滥用药物 90v图形描述Nankai University4Contents数据的预处理1品质数据的整理与描述2数值型数据的整理与描述3Nankai University51.数据的预处理Nankai University6v数据审核v数据筛选v数据排序v数据透视表数据审核v间接来源数据的审核审核数据的适用性审核数据的时效性v直接来源数据的审核审核数据的完整性审核数据的准确性Nankai University7数据筛选v数据筛选时根据需要找出符合特定条件的某类数据。v用 Excel进行数据筛选。选择 【 数据 】 菜单, 【 筛选 】 命令v数据筛选示例:例 3.1v例 3.1 表中是 8
3、名学生 4门课程的考试成绩数据(单位:分)。试分别找出统计学成绩大于 80分的学生;英语成绩最高的前三名学生;四门课程成绩都大于 70分的学生。Nankai University8数据排序v数据排序可帮助研究者通过浏览数据发现一些明显的特征或趋势,找到解决问题的线索。v排序还有助于对数据检查纠错,以及为重新归类或分组等提供方便。v排序后的数据也称为顺序统计量。v无论是属性型数据还是数值型数据,排序均可借助于Excel很容易的完成。Nankai University9数据透视表v为了从复杂的数据中提取有用的信息,可以利用 Excel提供的 【 数据透视表 】 工具。v利用数据透视表,可以对数据表的重要信息按使用者的习惯或分析要求进行汇总和作图,形成一个符合需要的交叉表(列联表)。v列联表 (contingency table): 由两个或两个以上变量交叉分类的频数分布表称为列联表。二维的列联表(两个变量交叉分类)也称为 交叉表 (cross table)。v利用数据透视表时,原始数据表中的首行必须有列标题。v示例 3.2Nankai University10