DNA序列分类摘要本文以题目的有关数据为资料,对如何对DNA序列分类进行研究,针对各个问题,我们分别建立了欧氏距离分类模型、马氏距离分类模型、Fisher分类模型多个数学模型,经过严密的理论论证,精确的计算,很好的解决了DNA序列归类的问题。针对问题一,我们首先根据的相关知识/理论,建立了欧式距离模型模型。为了解决DNA序列分类,我们运用统计、最优化、特征值提取等数学方法,从已知样本序列中提炼出能较好代表两类特征的关键字符串,我们可以得到量化的分类标准,对所给的DNA序列进行分类。在问题二中,我们同样采用了问题一中的三种模型,进行检验。在求解的过程中,我们在数据的处理上不可避免的存在不少误差,我们通过探讨研究,给出了误差分析,分析了其中的误差产生的来源,尽量避免由于误差所造成求解的错误,进而得出了一个较好的方案。我们还对模型进行改进,通过多个模型的比较,使得模型更加合理,更加切合实际。从而较好的解决了对各种DNA序列的分类。关键词:序列分类;特征分析;分类模型;最优分类18一、问题的重述背景知识1、DNA序列的概况从2000年6月,人类