1、GenBank数据库检索及其应用Entrez检索功能,重庆医科大学图书馆李 轶,简介,GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。,GenBank数据库的数据来源有三种:1、直接来源于测序工作者提交的序列;2、与其它数据机构协作交换的数据;3、美国专利局提供的专利数据。,NCBI网站网址:http:/www.ncbi.nlm.nih.gov,GenBank和PubMed(序列数据)检索的比较:,1、GenBank的检索结果是序列及其注释信息; PubMed的检索结果是与序列数据相关的文献信息。2、GenBank数据更新早于PubMed,GenBank数
2、据库的检全率高于PubMed。3、 GenBank可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于PubMed。,检索界面,简介,基本检索输入框,基本检索界面:,执行检索按钮,基本检索输入框,基本检索界面:,rasGENE,点击进入跨库检索,跨库检索界面:,rasGENE,执行检索按钮,跨库检索界面:,点击进入GenBank数据库,GenBank数据库界面:,GenBank数据库界面:,点击进入核苷酸序列数据库检索界面,GenBank数据库界面:,特征栏提供辅助检索功能,核苷酸序列数据库检索界面:,核苷酸序列数据库检索界面:,
3、简介,检索界面,基本检索功能,(一)名称、作者姓名、截词检索、布尔逻辑运算,(二)特殊标志符检索,(五)范围检索,(三)序列长度检索,(四)分子重量检索,简介,检索界面,基本检索功能,(一)名称、作者姓名、截词检索、布尔逻辑运算,检索限定词:,1、基因名称的检索限定词:GENE2、生物体名称的检索限定词:ORGN3、作者姓名的检索限定词:AUTH,简介,检索界面,基本检索功能,(一)名称、作者姓名、截词检索、布尔逻辑运算,(二)特殊标志符检索,特殊标志符的格式(核酸序列) :,2、GenBank/EMBL/DDBJ序列接受号: (1)1个字母+5个阿拉伯数字 e.g.:U12345 (2)2个
4、字母+6个阿拉伯数字 e.g.:AY123456,Af123456,1、序列辨认号(GI):一串阿拉伯数字 e.g.:6995995,(1)mRNA 记录(NM_*): e.g.:NM_000492(2)基因组DNA重叠群(NT_*): e.g.:NT_000347(3)完整的基因组或染色体(NC_*): e.g.:NC_000907(4)基因组的局部区域(NG_*): e.g.:NG_000019(5)从人类基因组序列注释、加工得到的序列模型记录(XM,XP,or XR_*): e.g.:XM_000483,特殊标志符的格式(核酸序列):,3、RefSeq(Reference Sequenc
5、e)序列接受号:,特殊标志符的格式(核酸序列):,4 、 PDB序列接受号:个阿拉伯数字个字母 e.g.:TUP,序列接受号的检索限定词为 ACCNorACCESSION,AF123456ACCN,简介,检索界面,基本检索功能,(一)名称、作者姓名、截词检索、布尔逻辑运算,(二)特殊标志符检索,(三)序列长度检索,1510SLEN,序列长度的检索限定词:SLEN,简介,检索界面,基本检索功能,(一)名称、作者姓名、截词检索、布尔逻辑运算,(二)特殊标志符检索,(三)序列长度检索,(四)分子重量检索,2009MOLWT,分子重量的检索限定词:MOLWT,简介,检索界面,基本检索功能,(一)名称、
6、作者姓名、截词检索、布尔逻辑运算,(二)特殊标志符检索,(五)范围检索,(三)序列长度检索,(四)分子重量检索,范围检索:中间用冒号连接,1、序列接受号范围检索: AF114696:AF114714ACCN2、序列长度范围检索: 3000:4000SLEN3、分子重量范围检索: 2002:2009MOLWT4、日期范围检索: 2005/01:2006/09/26MDATorPDAT,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管理(History),剪贴板管理(Clipboard),详细匹配过程(Details)
7、,限制检索,预检索/索引检索,检索史管理,剪贴板管理,详细匹配过程,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),限制检索界面:,限制检索界面:,核苷酸序列数据库分为三个子数据库:,EST :表达序列标记数据库GSS :基因组测序序列数据库CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列,核苷酸序列数据库检索界面:,核苷酸序列数据库检索界面:,限制检索界面:,限制检索界面:,检索结果显示界面:,限制检索范围,限制检索(Limits):,限制检索范围,ras,排除某种类型的序列,限制分子类型,限制分子类型,限制基因位点,限制基因位点,限制序列
8、片段的显示,限制序列片段的显示,限制数据来源,限制数据来源,限制数据修订日期,限制数据修订日期,简介,检索入口,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),预检索/索引检索界面:,hepatitis b,索引检索输入框,索引检索按钮,索引检索按钮,序列特性关键词索引,rasGENE,序列特性关键词索引,简介,检索界面,基本检索功能,特征栏辅助检索,限制检索(Limits),预检索/索引检索(Preview/Index),检索史管理(History),剪贴板管理(Clipboard),详细匹配过程(Details),penicillin
9、-binding,mycobacterium tuberculosis,#8 AND #4,penicillin-binding AND mycobacterium tuberculosisORGN,简介,检索入口,基本检索功能,特征栏辅助检索,检索结果的显示,检索结果显示界面:,选择检索结果的显示格式,选择检索结果的显示格式,选择检索结果的显示格式,摘要格式:,联接,Genbank 格式:,Genbank 格式:,Genbank 格式:,Genbank 格式:,Genbank 格式:,Genbank 格式:,Genbank 格式:,Genbank 格式:,GenBank记录中特性表中的主要关键词:,GenBank记录中特性表中的限定词:,FASTA格式:,图解显示:,图解显示:,多态性碱基,序列修订记录:,序列修订记录:,序列修订记录:,序列修订记录:,谢 谢!,SCI收录期刊的论文写作技巧及投稿指南主讲人:钟 萍,获取药学信息的途径与方法主讲人:肖廷超,请大家继续关注下周四的读者培训讲座:,