1、实用生物信息技术课程第 3 次作业1UniProt 数据库高级检索及数据条目注释信息姓名_ 学号_ 组号_ 日期_年_月_日1. UniProt 蛋白质序列数据库1) 参阅 Swiss-Prot 和 TrEMBL 统计报表(Release Statistics) ,列表说明这两个子库的总数据量,以及不同蛋白质证据(Protein Existence)的数据条目数。2) 列表说明以下已基本完成基因组测序的重要模式生物和你研究课题相关的物种数据条目数总数 N、已审阅序列条目数 Nr、具有蛋白质证据的序列条目数 Np、在参考序列数据库 RefSeq 中具有 mRNA 序列的序列条目数 Nm、在蛋白质
2、结构数据库 PDB 中具有结构的序列条目数 Ns。物种 拉丁文学名 英文名 N Nr Np Nm Ns人小鼠斑马鱼黑腹果蝇秀丽线虫酿酒酵母大肠杆菌 K12拟南芥课题相关物种2. 人珠蛋白家族检索1) 写出从 UniProt 数据库中检索已审阅的人珠蛋白( globin)家族 12 个亚基的步骤。2) 列表说明这 12 个珠蛋白的登录号、蛋白质名称、和序列长度。3) 与血红蛋白 alpha 亚基差异最大的序列是哪个?相同位点百分比?4) 与血红蛋白 beta 亚基差异最小的序列是哪个?差异位点共多少个?3. 列表说明从 UniProt 数据库中检索以下序列条目的步骤和结果:1) 所有拟南芥序列2
3、) 已审阅拟南芥序列3) 已审阅拟南芥序列中具有蛋白质证据的序列4) 已审阅拟南芥序列中具有蛋白质证据、且具有跨膜螺旋的序列5) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽的序列6) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋和信号肽、并具有二硫键的序列7) 已审阅拟南芥序列中具有蛋白质证据、具有跨膜螺旋、信号肽、二硫键,且已经测定三维结构的序列4. 利用高级检索功能,从 UniProt 数据库中检索你课题相关或最感兴趣的蛋白质,阅读其注释信息和相关文献,并通过数据库交叉链接,总结该蛋白质的研究进展。5. 序列条目注释信息1) 以人血红蛋白 alpha 亚基为例,说明该序列条目的注释信息包括哪几个主要类别。2) 以人血红蛋白 alpha 亚基为例,说明该序列条目中和序列及序列上不同位点相关的信息主要包括哪些。3) 以人血红蛋白 alpha 亚基为例,说明该序列条目中和结构相关的信息主要包括哪实用生物信息技术课程第 3 次作业2些。4) 以人血红蛋白 alpha 亚基为例,说明数据库交叉链接(Cross Reference)主要包括哪些数据库。