第1章 绪论* 数据挖掘导论 2 为什么挖掘数据?(商业) n 大量数据被收集,存储在数据库数据 仓库中 n 电商购买行为数据 n 网络日志数据 n 生产、制造、库存、销售数据 n 银行卡/信用卡交易数据 n 计算机越来越便宜,功能越来越 强大,逐渐替代人 n 华尔街用自动软件代替股票交易 员 n 竞争压力越来越大 n 以便提供更好的客户服务* 数据挖掘导论 3 为什么挖掘数据?(科学) n 数据以极快的速度收集和存储 (GB/hour) n 卫星数据 n 基因数据 n 天气数据 n 传统的技术难以处理这些原始数据 n 数据挖掘可能帮助科学家 n 对数据进行深入、形象的理解 n 对数据进行深入分析,洞悉数据背后隐藏的 东西* 数据挖掘导论 4 为什么要对大数据进行“挖掘” n 常常有些信息“ 隐 藏” 在数据中, 并非显 而易见 的 n 人分析需要数周 数月, 才能发现 有用的信息 n 许 多数据根本未曾分析过 The Data Gap* 数据挖掘导论 5 什么是数据挖掘 n 许多不同定义 n 本书定义 n 自动或半自动地对对大数据进行勘察或分析,以发现有用的模式 n Explorat