4.3 溢出存储器n 应该考虑五年后如下因素:n 有更多的技术管理大量数据n 硬件费用下降n 功能更强大的软件工具n 最终用户更加专业化4.3 溢出存储器n 历史数据与细节数据造成了数据的显著增长n 根据数据使用频率,可将数据分为二类:n 经常使用的数据n 不经常使用的数据(睡眠数据)n 解决方案:n 睡眠数据转移至海量备用存储器或近线存储器n 常用的溢出存储器可分为:n 低性能的磁盘存储器n 近线存储器n 串行磁带n 4.4 确定粒度级别n 一方面,合理推测粒度级别n 确定粒度还需要通过一定量的反复分析,根据用户反馈不断改进n 另一方面,预测不同体系结构的需求n 数据仓库中的数据需要处于最低的公共细节水平4.5 反馈技巧n 提高数据粒度的方法:n 数据进入数据仓库时,进行汇总n 数据进入数据仓库时,求平均值n 数据集的最大/ 最小值放入数据仓库n 只放入显然需要的数据n 用条件逻辑选择需要的数据n 系统需求了解到50% 左右时即可以开始建造数据仓库n 当正常的业务事务记录准备放入数据仓库时,高粒度级别的数据可能需要分解到低粒度级别。n 而对于一些低粒度级的数据,如生产过程控制、网络环