数据挖掘及其在生物学中的应用 100812052 郭志文主要内容导言1概念2数据挖掘的步骤3数据挖掘的常用方法4数据挖掘的十大算法5相关数据库资源6生物学应用7生物学前景 数据库越来越大数据库越来越大有价值的有价值的 知识知识生命科学近年来获得突破性进展,随着基因组研究的进展与现代生物技术的发展,积累了大量的各种生物数据,提供了揭开生命奥秘的数据基础。强有力的数据处理分析工具成为现代生物科学研究发展的关键。我们数据丰富但信息贫乏 数据挖掘技术是解决上述问题强有力的工具。数据挖掘是近年来新兴的一种科学计算技术与数据分析方法,它能够有效地从大量数据中提取潜在的信息与知识。各国研究者们也相继提出并验证了多种有效的数据挖掘算法。数据挖掘在科学发现、商业零售及信用管理等领域得到了越来越广泛的应用。在生物信息领域,计算机工作者与生物学家合作,研究提出了一系列的挖掘算法和挖掘模式,并应用于生物数据,取得了传统生物计算技术无可比拟的效果。1 概 念数据挖掘(DataMining):从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识