数据湖演进之路,用户画像需要从数据仓库的角度来看,才能获得完整的视图。数据集成真正从大数据的角度来看,才能明白其中的挑战。一个运行了20多年的数据架构,必然有其合理性。也正是因为年代久远,存量过多,才导致举步维艰。在Cloud和5G时代,超密度网络集成和大数据洞察需求给保险行业带来新的挑战,从数据仓库到数据湖,不仅仅架构的变革,更是思维方式的升级。,数据仓库历史沿革,1970年,关系数据库的研究原型SystemR和INGRES开始出现,这两个系统的设计目标都是面向on-linetransactionprocessing(OLTP)的应用。关系数据库的真正可用产品直到1980年才出现,分别是DB2和INGRES。其他的数据库,包括Sybase,Oracle,和Informix都遵从了相同的数据库基本模型。关系数据库的特点是按照行存储关系表,使用B树或衍生的树结构作为索引和基于代价的优化器,提供ACID的属性保证。到1990年,一个新的趋势开始出现:企业为了商业智能的目的,需要把多个操作数据库中数据收集到一个数据仓库中。尽管投资巨大且功能有限,投资数据仓库的企业还是获得了不错的投资回报率。