生物信息学中的算法问题主要内容n 生物信息学中的算法问题n 我们的工作 (ICT & IBP & BGI)一、生物学 vs 信息科学生物信息学的研究目标n 特点:天然的形式化n 碱基: A,C,T,G四种n 常见氨基酸: 20种n 目标:n 以 DNA序列作为源头n 揭示 “基因组信息结构的复杂性及遗传语言的根本规律 ”;n 之后进行蛋白质结构和功能预测。生物信息学的两个挑战n 高性能计算:n 海量的数据n 每 14个月翻一番n 算法:n 海量的数据使得原有算法不适用n 新需求生物信息学的研究流程n 第一步:生物学问题的提出n 生物学为主n 第二步:数学建模、算法设计n 信息科学为主n 第三步:结果解释、实验验证n 生物学生物信息学脉络生物信息学问题概览( 1)n 基因组时期: 序列结构功能n DNA测序和拼接n 比对n 进化树n 蛋白质质谱鉴定n 序列注释:基因预测、细胞定位n 结构预测: RNA结构预测、蛋白质折叠n 。生物信息学问题概览( 2)n 后基因组时期: 相互作用网络功能n 生物芯片 ( DNA芯片、蛋白质芯片)n 相互作用网络n 调控网络n E-Celln 药物设计n 。1. 大规模测序和拼接生物学问题:n 从 DNA片段恢复原始序列