精选优质文档-倾情为你奉上生物信息学是一门交叉学科, 包含了生物信息的获取、加工、存储、分配、分析、解释等在内的所有方面, 它综合运用数学、计算机科学和生物学等的各种工具来阐明和理解大量数据所包含的生物学意义。生物信息学宗旨在揭示基因组信息结构的复杂性及遗传语言的根本规律。从生物分子获得和挖掘深层次生物学知识。人类基因组计划(HGP):获得遗传图、物理图、序列图、转录图;终极目标:阐明人类基因组全部DNA序列;识别基因;建立储存这些信息的数据库;开发数据分析工具;研究HGP实施所带来的伦理、法律和社会问题。其中我国承担了人类3号染色体短臂。记录:一个数据库记录一般由两部分组成:原始序列数据和描述这些数据生物学信息的注释。冗余:在一个数据库存在着多个相同的项,如两个或者更多的记录中有一个相同序列Fasta格式开始于一个标识符:,然后是一行描述。GenBank格式:每个基因描述可有多个描述行,包含一行以LOUCUS开头描述行,基因序列以ORIGN开头,以/结尾。EMBL:入口标识符ID,序列开始标识符SQ,结束是/。数据库的特点:数据库是