1、生物信息学数据库,序列数据库 结构数据库生物信息学数据库的种类 图谱数据库 突变数据库 文献数据库 专业杂志生物信息学数据库的查找方法 专门数据库目录的网站 著名的生物信息学中心参见教材p227-p242,NCBI数据库组织,一、NCBI中的生物信息数据库,1)、PubMed: 生物医学文献数据库2)、Nucleotide:核酸序列数据库3)、Protein sequence database: 蛋白质序列数据库4)、Senome: 大分子三维结构数据库5)、Genome: 完整的基因组数据6)、PopSet: 人口研究数据集7)、OMIM: 人类孟德尔遗传数据库,8)、Taxonomy: G
2、enbank中的物种分类学数据库9)、Structure:分子结构数据库10)、SNP:单核苷酸多肽性数据库11)、Books: 在线生物医学图书,所有数据库,例: 在Nucleotide核酸数据库中检索牛冠状病毒的序列信息。 牛冠状病毒 bovine coronavirus,Nucleotide核苷酸数据库,bovine coronavirus,本库利用,本库工具,其它资源,核苷酸数据库序列来源于GenBank中的RefSeq,TPA和PDB。基因组,基因和转录本序列数据为生物医学研究和发现的基础。,牛冠状病毒全基因组,结果分类,按数量多少列出的生物类别,序列存储号,存储号、定义、入口、版本
3、、来源等详细描述,不同库的显示格式,FASTA格式显示全序列,Graphics格式,Display Setting 显示格式,Send to保存格式,二、序列相似性搜索工具,是用来查找序列之间的同源序列的工具,可以明确序列之间相似性的大小。BLAST:美国NCBI(国家生物技术信息中心)支持。 FASTA:是英国EBI(生物信息研究所)负责维护。,BLAST:碱基局部对准检索工具 Basic Locul Alignment Search Tool 可进行核苷酸序列、蛋白质序列方面的同源性分析,能在8秒内在整个DNA数据库中进行序列比较。,入口,不同项目的检索,最近检索结果,检索策略保存,帮助,
4、检索物种分类,在核苷酸数据库中检索核苷序列,在蛋白质数据库中检索蛋白质序列,用翻译的核苷酸序列在蛋白质数据库中检索,用蛋白质序列在翻译的核苷酸数据库中检索,用翻译过来的核苷在核苷翻译库中检索,用法学习,检索方法,例:对“人胰岛素cDNA序列”进行相似性分析步骤:先检索出cDNA核苷酸序列用FASTA格式显示将FASTA格式全选后粘贴于BLAST检索框中选择分析用的数据库点击BLAST进行比较,序列存贮号,描述说明,序列,检索框:用来粘贴FASTA格式,可限定对比起始位置,长度,人类基因库,老鼠基因库,其他数据库,粘贴FASTA格式,比较结果页面,彩色积分图,序列相似描述,存贮号,检索范围,积分
5、,描述,E值统计,链接,序列对准描述,相似率为100%,三、基因组数据库,1、Genome:可获得800多种生物体的基因组数据,部分已完成测序。2、人类基因组资源:human genome resources 整合了多种相关的分子生物学数据库和公共分析软件,为科研人员提供了自动化的实验数据获得、加工和整理途径,为基因区域的预测和基因功能预测提供了一系列便捷的方法。,入口1入口2,检索框空白,使用帮助,扩展资源,本库工具,其他资源,常用资源,注释和分析,四、OMIM孟德尔人类遗传学数据库,OMIM:Online Mendelian Inheritance in Man此库是关于人类基因和遗传性疾
6、病的数据库,适合关注遗传疾病的医生和科研人员,检索框空白,不填入任何内容,diabetes,顺序号中第1位数字表示所涉及基因的遗传类型:1:常染色体显性(1994.5.15前创建)2:常染色体隐性(1994.5.15前创建)3:X连锁基因座或表现型4:Y连锁基因座或表现型5:线粒体基因座或表现型6:常染色体基因座或表现型(1994.5.15后创建的条目),题名 顺序号 等位基因的变化,原文 参考文献 临床症状,基因图异常 投稿者,顺序号前缀的含义,结果记录只包含,条目创建时间,条目最后修正时间,此页为早期页面,但较好地解释了各种前缀的含义等,结果原文,基因图位置,五、Taxonomy-分类学,
7、即生物学门类数据库,可以按生物学门类进行检索或浏览其核苷酸序列、蛋白质序列、结构等。,Taxonomy入库二,Taxonomy入口一,本库工具,其他资源,使用帮助,检索方法,1、分类浏览 Taxonomy browser 最高级类目名称,Browser 浏览,常用分子生物研究,检索区,分类,古生物,细菌,真核生物,类病毒,病毒,未分类物种,其他,系统默认3级分类级别,点击进入,显示该物种在这些数据库中的文献量,存储序号,类别,基因码,同义词,类别,在Taxonomy数据库中的文献,作者链接,点击进入pubmed,检索方法,2、关键词查询,输入生物体名称或生物门类,如hepatitis b vi
8、rus或 proifera,完整名称通配符模糊检索 口语中的名称分类序号,检索方法,3、直接用生物体名称列表查询,点击下列名称,直接检索具体生物体的树状结构,六、Structure,也称大分子三维数据库(MMDB),包含来自X线晶体学和三维结构的实验数据。MMDB的数据从蛋白质数据库PDB(Protein Data Bank)获得。对结构的阐述较PDB详细,更多的是比较结构的相似性及亲缘关系。,Structure,本库工具,其他资源,使用帮助等,Cn3d阅读器,Install安装方法一,Windows安装方法二,Tutorial学习指南,Download Cn3d方法三,下半页,点击下载、安装,检索方法,1、关键词检索 直接输入检索的蛋白质名称,然后GO2、登记号检索 前提是已经知道PDB或MMDB的登记号,例:检索PTEN的结构图,名称,3D结构图,点击直接下载,在MMDB、PDB中的登记号,PDB:Protein Data Bank蛋白质数据库MMDB:Molecular Modelling Database大分子三维结构数据库,PTEN,名称,浏览或保存3D结构图,分子图,来源,在图上双击,下边显示对应的内容,NCBI数据库组织,是世界上著名的生物医学数据库组织,希望同学们以后多利用多挖掘它的资源。,