1、本科毕业论文系列开题报告生物技术大黄鱼肌动蛋白基因克隆与序列分析一、选题的背景与意义大黄鱼LARIMICHTHYSCROCEA属石首鱼科,黄鱼属,也称黄鱼、大鲜、大黄花等,为暖温性近海中下层群体性洄游鱼类。其肉质细腻,味道鲜美,营养丰富,肌肉蛋白质中富含多种氨基酸,是当今人类较为理想的动物蛋白源。此外,大黄鱼还有很高的药用价值,其耳石有清热去瘀、通淋利尿的作用,膘有润肺健脾、补气止血作用,胆有清热解毒功能。但是近年来由于捕捞强度过大,野生大黄鱼已经很难捕获。随着大黄鱼人工育苗技术的成熟和完善,海水网箱养殖大黄鱼技术迅速发展。由于多年的全人工累代繁育与养殖,造成了大黄鱼种质严重退化。一些问题例如
2、性早熟、品质退化、生长速率变慢等制约了大黄鱼养殖的健康发展,因此加强大黄鱼基础生物学方面的研究已迫在眉睫。肌动蛋白ACTIN是细胞骨架的重要组成部分,肌肉细胞的一个重要的收缩蛋白,参与细胞发育进程的多个方面,包括细胞运动、新陈代谢、有丝分裂、肌肉收缩等,家族根据氨基酸序列的不同可分为6种类型,包括2种细胞质ACTIN(型和型),2种横纹肌型ACTIN,即骨骼肌ACTIN、心脏ACTIN和2种平滑肌ACTIN,即血管平滑肌型、型内脏平滑肌型。而大黄鱼肌肉中的是属于横纹肌肌动蛋白,也称骨骼肌肌动蛋白,肌动蛋白普遍存在于真核生物中,肌动蛋白是一种具有2个亚基的蛋白质,是其主要作用是将肌动蛋白微丝锚定
3、在肌节Z线上,所以表达的增加无疑能提高运动的强度,该基因是一种在进化中高度保守的蛋白质,所以肌动蛋白基因可以很好的被克隆。自SATRAUD于1942年就从家兔中分离到了骨骼肌的肌动蛋白以来,目前对肌动蛋白基因研究很多。本实验是以宁波水产大世界大黄鱼的肌肉为材料,并对其肌动蛋白基因进行克隆并对其基因序列进行生物信息学方面的分析可得到肌动蛋白基因相关的一些功能结构,近年来,人们发现肌动蛋白在鱼类肌肉中有重要的作用。因此,研究大黄鱼的肌动蛋白基因,有可能为大黄鱼的育种开辟一条新的途径,并利用大黄鱼作为模型动物研究人类的疾病和其他领域的应用提供了一定的理论基础。二、研究的基本内容与拟解决的主要问题研究
4、的基本内容;1、CDNA文库构建;2、EST测序;3、获得肌动蛋白基因全长;4、肌动蛋白基因序列与其他鱼类同源性比较;5、氨基酸结构;6、利用CLUSTALX及MEGA软件构建系统进化树;拟解决的主要问题1、肌动蛋白结构;2、与其他鱼类蛋白质结构比较有什么特点;三、研究的方法与技术路线四、研究的总体安排与进度201011201101查询与论文有关的资料、撰写试验计划、熟悉基本的实验操作;201101201104肌动蛋白基因克隆;对肌动蛋白基因进行生物学分析;201105整理数据,撰写论文及准备答辩;大黄鱼肌肉总RNA提取MRNACDNA合成CDNA与载体连接重组体转化宿主细胞构建全长CDNA文
5、库EST测序获得肌动蛋白基因片段经BLAST在GENBANK上查询确定基因肌动蛋白基因全长分析引物设计相似性氨基酸结构进化树五、主要参考文献1贺淹才肌动蛋白和肌动蛋白基因的研究进展J生命的化学,2002,2232482502胡文革,陈创夫,王远志等准噶尔雅罗鱼肌动蛋白因启动子克隆及序列分析J动物学杂志,2010,45118263MONSERRATL,HERMIDAPRIETOM,FERNANDEZX,ETALMUTATIONINTHEALPHACARDIACACTINGENEASSOCIATEDWITHAPICALHYPERTROPHICCARDIOMYOPATHY,LEFTVENTRICUL
6、ARNONCOMPACTION,ANDSEPTALDEFECTSJEURHEARTJ,2007,2816195319614GERALDKCELLBIOLOGY,2NDEDITIONMMCGRAWHILLBOOKCOMPANY,19845李明云,张海琪,钟爱华大黄鱼基因组DNA的提取及其RAPD分析条件的探索J科技通报,2002,1853683736李明云,陈炯,张祖兴等大黄鱼PSEUDOSCIAENACROCEA转铁蛋白TF基因克隆及序列分析J海洋与沼泽,2007,3865635687唐伟,谭海东,张素芳等斯达氏油脂酵母肌动蛋白基因克隆及序列分析J生物技术通报,2009,2802838李兴平,
7、唐国勇等运动对骨骼肌肌动蛋白的影响研究评述J吉首人学学报2007,2861131159纪玲,杨林,武延格等应用免疫组织化学S100和肌动蛋白抗原鉴定组织工程软骨J中国组织工程研究与临床康复,2007,28611311510BOOKWALTERCS,TRYBUSKMFUNCTIONALCONSEQUENCESOFAMUTATIONINANEXPRESSEDHUMANALPHACARDIACACTINATASITEIMPLICATEDINFAMILIALHYPERTROPHICCARDIOMYOPATHYJBIOLCHEM,2006,28124167771678411于新凯,田野,左群等下坡跑训练
8、对大鼠腓肠肌和比目鱼肌肌动蛋白基因表达的影响J上海体育学院学报,2002,2611475112刘芳,陈树宝,刘晓青等心脏肌动蛋白基因在胚胎心脏发育中的时空表达J中华儿科杂志,2005,431077277613ABDELWAHIDE,PELLINIEMILJ,SZUCSIKJC,ETALCELLULARDISORGANIZATIONANDEXTENSIVEAPOPTOSISINTHEDEVELOPINGHEARTOFMICETHATLACKCARDIACMUSCLEALPHAACTINAPPARENTCAUSEOFPERINATALDEATHJPEDIATRRES,2004,5521972041
9、4FLORIANB,HARALDB,WATSONL,ETALCARDIACALPHAACTININSMOOTHMUSCLECELLSDETECTIONINUMBILICALCORDVESSELSANDINATHEROSCLEROTICLESIONSJBASICRESCARDIOL,2000,9610611315姜红堃心脏肌动蛋白基因与心脏疾病的相关研究进展J中国实用儿科杂志,2010,25430931116OLSONTM,DOANTP,KISHIMOTONY,ETALINHERITEDANDDENOVOMUTATIONSINTHECARDIACACTINGENECAUSEHYPERTROPHI
10、CCARDIOMYOPATHYJJMOLCELLCARDIOL,2000,3291687169417MATSSONH,EASONJ,BOOKWALTERCS,ETALALPHACARDIACACTINMUTATIONSPRODUCEATRIALSPETALDEFECTSJHUMMOLGENET,2008,17225626518PORTERAC,SVENSSONSP,STAMERWD,ETALALPHA2ADRENERGICRECEPTORSSTIMULATEACTINORGANIZATIONINDEVELOPINGFETALRATCARDIACMYOCYTESJLIFESCI,2003,721
11、314551466毕业论文文献综述生物技术肌动蛋白基因研究现状摘要肌动蛋白ACTIN是所有真核生物细胞内的重要结构蛋白,有6种亚类,心脏ACTIN、骨骼肌ACTIN、平滑肌ACTIN是其中的三种,在机体内执行着不同的功能,本文通过阅读大量相关文献综述了它们各自的功缺失、突变后会引起的某些疾病以及一些疾病发生与该种基因表达的影响,所以我们可以通过克隆其基因并进行序列的分析,并研究清楚肌动蛋白基因有利于其他各领域对该基因的应用。关键字肌动蛋白;心脏ACTIN基因;骨骼肌ACTIN基因;平滑肌ACTIN基因;研究现状0前言肌动蛋白ACTIN基因大量存在于几乎所有物种的有核细胞中,是一种高度保守蛋白,
12、与一些管家蛋白的基因一样,在物种内持续恒量表达,因而在很多量化的实验技术如实时定量PCR、NORTHERN杂交、免疫蛋白印迹中被当作内参照。它是肌肉细胞的一个重要的收缩蛋白,也是细胞骨架的主要组成部分,参与细胞发育进程的多个方面,包括细胞运动、新陈代谢、有丝分裂、肌肉收缩等,在脊椎动物中,ACTIN家族根据氨基酸序列的不同可分为6种类型包括2种细胞质ACTIN(型和型),2种横纹肌型ACTIN,即骨骼肌ACTIN、心脏ACTIN和2种平滑肌ACTIN,即血管平滑肌型、型内脏平滑肌型。近来的研究表明,尽管这些亚型在氨基酸序列上同源性非常高(90),但是不同的ACTIN基因在功能上是不可互换的1。
13、肌动蛋白是一种具有2个亚基的蛋白质,其主要作用显然是将肌动蛋白微丝锚定在肌节Z线上,以下是对心脏ACTIN基因、骨骼肌ACTIN基因、平滑肌ACTIN基因这三种分别进行阐述。1心脏ACTIN基因与相关疾病及其研究机理心脏肌动蛋白基因CARDIACALPHAACTIN,CAA近年逐渐被认识的在心脏发育过程中起重要作用的一个基因。有研究发现,其突变可导致多种心脏结构及功能异常。心脏肌动蛋白CARDIACALPHAACTIN,CAA基因是心脏特异表达基因,心脏神经嵴剔除可导致心脏圆锥动脉干发育畸形,有多种基因参与调节,CAA基因就是其中之一1。ABDELWAHID等2建立CAA基因缺失小鼠模型,其研
14、究发现,胚胎小鼠缺乏心脏肌动蛋白基因可导致心肌细胞结构紊乱和过度凋亡,造成发育迟缓和围产期死亡。56的CAA基因纯合子缺失小鼠不能存活到出生,剩下的大多在出生后2周内死亡。FLORIAN等3的研究发现,心脏肌动蛋白基因在人类心肌组织表达,但在健康成人主动脉、冠状动脉、脾小梁、结肠、胃及骨骼肌等部位不表达,而在脐带血管、冠状动脉粥样硬化斑块和外周血管粥样硬化斑块等处CAA基因有表达。由此说明CAA基因可能是一种发育基因,在新生血管组织中表达,而在成熟器官中,CAA基因仅限于心肌组织表达,在其他血管和肌肉组织无表达。当机体出现病理性的血管或肌组织增生时,诱导基因再度表达。11心脏肌动蛋白基因与心脏
15、疾病CAA基因异常可导致心脏发育迟滞、结构及功能异常,从而形成房间隔缺损ASD、室间隔缺损VSD、原发性心肌病等先天性心脏异常。111心脏间隔缺损心脏间隔缺损是常见的先天性心脏缺陷,其在活产儿发病率为(57)/1000。在对家族性显性遗传的房间隔缺损ATRIALSEPTALDEFECT,ASD家系的研究中,已经确认了5种ASD相关基因,分别是NKX25、TBX5、GATA4、MYH6、ACTC14。OLSON等5研究发现,7例CAAE101K突变携带者中有1例患ASD。而MONSERRAT等6在9例此类突变携带者中发现8例患ASD,1例患室间隔缺损(VENTRICULARSEPTALDEFEC
16、T,VSD),进一步证实CAA基因与心脏间隔发育密切相关。尚有些研究与CAA基因异常导致间隔缺损机制有关。MATSSON等6对包含20个成员的2个常染色体显性遗传ASD家系进行CAA基因突变筛查,发现突变区域为M123V。相关的功能研究表明,M123V突变型CAA尽管仍能保持肌动球蛋白动力特性,但与肌球蛋白的结合力下降。在对408例散发的先天性心脏病患者突变筛查中,发现1例ASD患者的CAA基因存在17BP的缺失。进一步研究显示,CAA基因敲除的鸡胚出现心脏环化延迟、房间隔缺损,说明CAA基因参与心脏发育,其突变或表达下降会导致ASD的发生。QI等研究发现,SMAD4基因缺失胎鼠,早在E95D
17、即出现CAA基因表达下调,同时伴心肌细胞增殖下降,胎鼠出现室间隔缺损、致密层变薄、肌小梁紊乱,E125155D期间胎鼠死亡率显著升高。从而认为,CAA在产生及维持细胞形态和极化、在桥粒处的细胞间黏附、细胞内的迁移过程均发挥重要作用,表达异常将影响这些功能的执行,进而导致上述心脏形态异常4。112扩张型及肥厚型心肌病CAA基因是第一个被确定同时与扩张型心肌病DILATEDCARDIOMYOPATHY,DCM及肥厚型心肌病HYPERTROPHICCARDIOMYOPATHY,HCM相关的基因6。扩张型心肌病是最常见的心肌病,主要为常染色体显性遗传。基因异常是家族性DCM的主要原因之一。到目前为止,
18、在DCM家系中采用候选基因筛查和连锁分析策略已经定位了常染色体上的24个基因,X染色体上的2个基因,线粒体上的1个基因与该病相关,并已从中成功鉴定出22个致病基因7。这些基因主要编码细胞骨架、肌小节及肌纤维膜蛋白。其中CAA是最常见的常染色体显性遗传DCM的致病基因。已发现2种CAA点突变与DCM相关8。MIRZA等9研究认为,CAA突变可导致其编码蛋白结构异常,进而引起心肌细胞收缩力量的传递异常,从而导致DCM的发生。OLSON等发现,发生于心脏肌动蛋白单体第1和第3亚区的突变可造成肌动蛋白丝固定末端结构及功能异常,从而使力量传递不充分,当心肌工作需要增强时,心肌细胞处于极度应激状态,此情况
19、的长期持续发生即可导致心肌细胞死亡,从而发生扩张型心肌病。此外DEBOLD等研究认为,CAA基因突变导致扩张型心肌病可能与其编码蛋白的分子力减弱有关4。HCM是一种常染色体显性遗传病,多种基因异常均可导致HCM的发生,目前已发现11种编码肌节蛋白基因的200余种错义突变与HCM相关,其中与CAA相关的点突变有8种,分别为E99K、P164A、Y166C、A230V、A295SM305L、A331P、E101K。DEBOLD等研究认为,某些ACTC突变可使其编码蛋白的分子力增强,从而出现肥厚型心肌病。2影响骨骼肌ACTIN基因表达的研究骨骼肌肌动蛋白是SATRAUD在1942年首次发现是从家兔骨
20、骼肌中分离的10,肌动蛋白约占骨路肌纤维蛋白的20、占骨骼肌总蛋白含量的12。肌肉的力量主要决定于肌纤维蛋白的数量和体积,故肌动蛋白表达的增加无疑能提到运动的强度,ACTIN是肌纤维的重要组成部分,所以近几年不断涌现出有关不同运动或不同负荷对骨骼肌肌动蛋白表达影响的研究11。PAUL等在研究2周踏板跑台100MIN/D以后大鼠股四头肌肌动蛋白MRNA的变化,发现跑完后快肌中MRNA升高了6212。PHILIPB等在对大鼠后肢悬垂、固定或去神经后发现其比目鱼肌肌动蛋白MRNA分别下降60、53和66,腓肠肌中也存在类似的情况13。这说明负重、神经及运动对肌肉中肌动蛋白均能产生重要影响,同时认为负
21、重的丧失是诱导后肢肌动蛋白MRNA下降的关键因素。THEODORE等14通过对2组大鼠进行为期16周的对抗性训练,其中的一组施以逐渐增加的重力负荷,另一组没有此负荷,结果发现16周后前者的腓肠肌明显增大而后者未发生改变,这说明骨骼肌蛋白的表达可能对负荷的变化更为敏感。他们还发现肌肉体积的增加并不一定与刺激的强度和频率成正比,适当的频率和负荷要比高频率产生更明显的刺激效果。这说明适当运动强度和时间对调节肌肉蛋白的合成具有积极意义。冯连世等15观察了模拟2000M海拔高度训练1周后大鼠骨骼肌ACTIN基因表达的情况,发现其表达程度明显增强;中药对骨骼肌ACTIN表达也有影响,如我国赵中应等16研究
22、了理气扶正中药消除运动性疲劳过程中骨骼肌ACTIN基因的表达,发现在运动后的恢复期运动用药组大鼠股四头肌中骨骼肌型ACTINMRNA比运动组高26950。现在也有很多关于用药物去影响骨骼肌ACTIN的表达,总之,弄清骨骼肌ACTIN及表达对运动加强及运动后恢复都会起到积极的作用。3平滑肌ACTIN基因的表达与相关疾病平滑肌肌动蛋白SMOOTHMUSCLEACTIN,SMA是细胞来源于平滑肌组织的标志,在不同表型的平滑肌细胞中具有不同的表达比例。根据其表达比例的不同,主要被分为两种表型收缩型、增殖型。正常情况下,主要分布于血管平滑肌、肌纤维母细胞、肌上皮细胞等。有关SMA在各种疾病上的研究都很热
23、。盆底由多层肌肉、筋膜和韧带组成,盆底肌是支撑子宫、膀胱、直肠的重要结构,盆底膨出PELVICORGANPROLAPSE,POP是常见的中老年女性疾病,严重影响女性的健康和生活质量,90的POP发病是由于盆底结构松弛所致;江絮萍等17通过对POP患者20例及无POP的直肠癌患者30例行盆底肌活检,光镜及电子显微镜观察盆底肌形态免疫组探讨盆底肌肌动蛋白含量及其与POP发病的关系,POP组肌动蛋白含量较对照组少,差别有统计学意义P90),分子量也基本相同,但是不同的ACTIN基因在功能上是不可互换的。肌动蛋白是一种具有2个亚基的蛋白质,其主要作用显然是将肌动蛋白微丝锚定在肌节Z线上2。20世纪70
24、年代以来,由于过度捕捞导致野生大黄鱼数量急剧减少,种质资源的遗传组成趋向同质化,遗传多样性水平降低,引起某些基因丢失而导致其优良经济性状衰退3。本实验用到的大黄鱼肌肉中的肌动蛋白属于骨骼肌肌动蛋白,近年来,人们发现肌动蛋白在鱼类肌肉中有重要的作用,骨骼肌肌动蛋白是构成骨骼肌肌纤维细丝的主要成分,参与肌肉所有的收缩活动,从而完成机体的多种机械运动。骨骼肌肌动蛋白是SATRAUD在1942年首次发现是从家兔骨骼肌中分离的4,肌动蛋白约占骨骼肌纤维蛋白的20、占骨骼肌总蛋白含量12。肌肉的力量主要决定于肌纤维蛋白的数量和体积,故肌动蛋白表达的增加无疑能提高运动的强度。目前已经克隆的肌动蛋白只有人类、
25、牛及少数啮齿动物等,且已有学者通过对骨骼肌肌动蛋白序列各方面的研究实验,知道机体的生长发育可调节骨骼肌肌动蛋白的表达5。所以从更多的生物中克隆得到该基因的序列,然后进行研究,这样就能了解其更多特性与功能。从1985年大黄鱼人工育苗和繁殖成功后大黄鱼养殖业得到迅速发展,特别是闽东地区,大黄鱼鱼网箱养殖已成为当地经济支柱之一6。而近几年发现,养殖大黄鱼普遍存在性早熟、生长缓慢、病害频繁发生等现象。因此,从分子水平上研究大黄鱼,一方面为大黄鱼的资源保护和种质改良提供了参考资料外,同样也为大黄鱼作为模型动物研究人类的类似疾病和其他生物的关于该基因方面的机理奠定理论基础。本实验是通过EST测序,然后与网
26、上的已有的EST序列进行比较,得到肌动蛋白片段后,经BLAST在GENBANK(HTTP/WWWNCBINLMNIHGOV/DBEST)上查询确定是该基因后设计引物获得的大黄鱼的骨骼肌肌动蛋白基因全长序列。对于EST(EXPRESSEDSEQUENCETAG)即为表达序列标签,是1991年VENTER等7在提出大规模CDNA测序研究战略时建立的技术。EST是长度为300500BP的部分CDNA,为了弄清EST之间的关系,美国国立生物技术信息中心(NCBI)根据EST相似性比较进行聚类分析,形成了数据库UNIGENE。EST技术是将MRNA反转录成CDNA并克隆到载体构建成CDNA文库后,大规模
27、随机挑选CDNA克隆,对其5或3端进行一步法测序,所获序列与基因数据库已知序列比较,从而获得对生物体生长发育、繁殖分化、遗传变异、衰老死亡等一系列生命过程认识的技术8。VANDELOO等9第一次成功地应用EST方法分离到蓖麻油酸生物合成的关键酶基因。该技术的提出对新基因的发现、人类基因转录图的制作、全长基因的克隆、基因表达谱的研究等有重要的作用。1材料与方法11材料111实验材料实验材料为大黄鱼骨骼肌CDNA文库。112实验试剂1质粒提取溶液I50MMOL/L葡萄糖,25MMOL/LTRISCLPH80,10MMOL/LEDTAPH80,高压下蒸气灭菌15MIN,贮存于40;2质粒提取溶液II
28、02MO1/LNAOH临用前用10MOL/L贮存液现稀释,1SDS;3质粒提取溶液III60M15MOL/L乙酸钾,5ML冰乙酸,285M1水,钾离子终浓度为3MO1/L,乙酸根终浓度为5MOL/L;4异丙醇购于宁波奥博科学仪器有限公司;70的乙醇取70ML的无水乙醇加DEPCH2O(RNASEFREE)定容到100ML,于4保存备用。无水乙醇为AR级,购于宁波奥博科学仪器有限公司;5DEPCH2O(RNASEFREE)购自上海生工生物工程公司;6LB液体培养基1L蛋白胨10G,NACI5G,YEASTEXTRACT5G,PH70,氨苄青霉素终浓度100G/ML,高温高压灭菌30MIN。113
29、实验仪器1各型号枪头、无粉乳胶手套和口罩均购自江苏省通州市南兴申海玻璃仪器厂。2REVCD13863V型超低温冰箱美国REVCD公司;3GIS2008凝胶图像处理系统上海天能科技有限公司;4DV8D电热恒温槽上海一恒科技有限公司;5BIOFUGEFRESCO高速台式冷冻离心机美国SORVALL公司;6DYY8B型稳压稳流电泳仪北京六一仪器厂;7HZ9211K恒温振荡器太仓市科教器材厂;8LX100手掌型离心机江苏海门市其林贝尔仪器制造有限公司;12方法上面引言部分已经提到本实验是通过EST技术获得的大黄鱼肌动蛋白基因片段,且是从大黄鱼肌肉CDNA文库开始的,即以全长CDNA文库为材料,通过了解
30、CDNA文库构建的基础上再进行下一步的实验,CDNA文库的构建先是从大黄鱼中提取总的RNA,再从MRNA逆转录成CDNA,CDNA与载体连接,我们实验室用到的载体是PDNRLIB,然后连接的产物用电穿孔法转入大肠杆菌JM109感受态细胞中,最后进行培养,这个过程就成功构建了全长CDNA文库1013。接下来就是挑取菌落并对细菌进行扩大培养等,具体步骤如下所述。121质粒提取常规提取质粒步骤按文献1416进行,再根据自己实验室情况加以改良。1挑带有质粒的大肠杆菌于LB液体培养基中,37振荡培养1216小时,直至长出菌落(养菌扩增质粒)。2将菌落接种到96孔板上,每孔加入1ML培养物,37过夜培养,
31、室温,3000RPM离心5MIN,弃上清,倒置晾干。3加入200LSOLUTIONI,封膜用振荡器充分振荡,直至板底无沉淀为止,一定要使菌体充分分散。4加入200L新配的SOLUTIONII,用胶带封口,轻轻反复颠倒45次,使溶液充分混匀切勿剧烈振荡。5再加入200L冷的SOLUTIONIII,用胶带封口,反复颠倒15次。4000RPM离心20MIN,将上清转入另一新的96孔深孔板中。6深孔板每孔加入450L异丙醇,用胶带封口,反复颠倒5次,4000RPM离心20MIN,沉淀DNA。7弃尽上清液,加600L70乙醇,用硅胶垫封口,充分振荡,离心4000RPM,5MIN。8去掉上清,重复上一步。
32、9超净工作台吹干沉淀,用30L超纯水溶解DNA,20储存备用。10电泳检测。加3L溴芬兰,3L质粒将6L液体全部点入加样孔。电压200V,时间20MIN。123EST测序随机测序大黄鱼肌肉组织CDNA全长文库的克隆群,测序工作在北京华大基因公司完成,由ABI3730测序仪进行大规模测序。采用M13通用引物从CDNA的5端测取,本实验所用的的质粒载体为PDNRLIB,该质粒载体中含有M13正向的通用引物,引物序列为5DGCCAGGGTTTTCCCAGTCACGA3。124设计引物测通全长将测得的序列以CROSSMATCH软件并结合手工处理,去除低质量的序列和载体序列。利用BLAST将测得的有效E
33、ST(大于100BP)序列经BLASTX检索NCBI及SWISSPROT蛋白质数据库,比较EST与其他物种的同源性高低,且E值小于等于002的搜索结果认为有生物学意义上的显著相似性。获得肌动蛋白基因的EST,然后经BLAST在GENBANKHTTP/WWWNCBINLMNIHGOV/DBEST查询确定为大黄鱼肌动蛋白基因片段,接着对其设计引物来获得全长。从该基因的EST片段设计引物(20BP左右)继续进行测序,再以第二次测得的结果设计引物,一直到测通全长为止。然后根据首末重复部分进行拼接得到大黄鱼肌动蛋白基因序列的全长,并对得到的序列进行生物信息学分析。2结果21序列测定EST测序获得的大黄鱼
34、肌动蛋白基因的EST,设计引物且拼接后获得大黄鱼肌动蛋白基因全长序列,用DNAMAN软件对其全长序列翻译成氨基酸序列,整理得到为图1所示,序列全长为1431BP,其中ORF编码序列975BP,编码324个氨基酸。1G2AACACGAGCGCACGAGTCAGTGAGCGATGAAGCGGCCGCATAACTTCGTATAGCATACAT62TATACGAAGTTATCAGTCGACGGTACCGGACATATGCCCGGGAATTCGGCCATTACGGCCMPGNSAITA122GGGGGGGGTATCCTGACTCTGAAGTACCCCATTGAGCACGGTATCATCACCAACTGG
35、GACGGGILTLKYPIEHGIITNWD182GACATGGAGAAGATCTGGCACCACACCTTCTACAACGAGCTGAGAGTGGCCCCCGAGGAGDMEKIWHHTFYNELRVAPEE242CACCCCACCCTGCTCACTGAGGCCCCCCTGAACCCCAAGGCTAACAGAGAGAAGATGACCHPTLLTEAPLNPKANREKMT302CAGATCATGTTTGAGACCTTCAACGTCCCCGCCATGTATGTGGCCATCCAGGCTGTGCTGQIMFETFNVPAMYVAIQAVL362TCCCTGTACGCTTCCGGCCGTACCA
36、CCGGTATTGTGCTGGATGCTGGTGATGGTGTGACCSLYASGRTTGIVLDAGDGVT422CACAACGTCCCAGTCTATGAGGGTTACGCCCTGCCCCACGCCATCATGCGTCTGGACCTGHNVPVYEGYALPHAIMRLDL482GCTGGTCGCGATCTGACCGACTACCTGATGAAGATCCTGACTGAGCGTGGCTACTCCTTCAGRDLTDYLMKILTERGYSF542GTGACCACCGCCGAGCGTGAGATCGTGCGCGACATCAAGGAGAAGCTGTGCTATGTGGCTVTTAEREIVRDIKEKL
37、CYVA602CTGGACTTCGAGAACGAGATGGCCACCGCTGCCTCCTCCTCCTCCCTGGAGAAGAGCTACLDFENEMATAASSSSLEKSY662GAGCTTCCCGACGGTCAGGTCATCACCATCGGTAACGAGAGGTTCCGTTGCCCCGAGACCELPDGQVITIGNERFRCPET722CTCTTCCAGCCTTCCTTCATTGGTATGGAGTCTGCTGGTATCCATGAGACCGCCTACAACLFQPSFIGMESAGIHETAYN782AGCATCATGAAGTGCGACATTGACATCCGCAAGGACCTGTACGC
38、CAACAATGTCCTCTCCSIMKCDIDIRKDLYANNVLS842GGTGGTACCACCATGTACCCTGGTATTGCTGACCGTATGCAGAAGGAGATCACTGCTCTGGGTTMYPGIADRMQKEITAL902GCCCCCAGCACCATGAAGATCAAGATCATTGCCCCTCCCGAGAGGAAGTACTCCGTCTGGAPSTMKIKIIAPPERKYSVW962ATCGGTGGCTCCATCCTGGCTTCCCTGTCCACCTTCCAGCAGATGTGGATCTCCAAGCAGIGGSILASLSTFQQMWISKQ1022GAGTACGACGA
39、GGCTGGCCCCAGCATTGTCCACAGGAAGTGCTTCTAAATCCTCCATCTTEYDEAGPSIVHRKCF1082CTTCTCCAGCTTCTCCATCACTTACACCACCAACTATCGGGAGATCAAGCAAGGAGGAT1142AACCTCTGCGGCACAGCAACACTCTGCTCTCAATGGACTTTCTGTCTGCGCTGTTGACAT1202GCATATGCATTTTGTTATCCTTTTAAAAATGTGCATATTTTATAGCTGTTTGTTGTCTGT1262GTTGTACGGAGAGAGGCTGTGAAAAATCCACCACTGAACCA
40、TGCATCCACTCAAAAAAAA1322AAAAAAAAAAAAAAAAAAAAAACCATGTCGCGACTGAGCATACAACGCATGTGAACTGAT1382GCAGCCATGACTTTTCCTGCTAATTGCCATGGTCAACGGGGCGAAGTCTA图1大黄鱼肌动蛋白基因全长序列FIG1FULLLENGTHSEQUENCEOFPSEUDOSCIAENACROCEAALPHAACTIN图1显示的序列1BP到94BP为5端非编码区,95BP到1069BP为编码区,ATG为起始密码子,TAA是终止密码子,分别用下划线表明,1070BP到1431BP为3端非编码区。编码区翻译的
41、氨基酸序列已在上图列出,氨基酸数为324。22生物信息学分析221大黄鱼肌动蛋白基因序列物种的同源性比较同源性是两种核酸分子的核苷酸序列之间,或两种蛋白质分子的氨基酸序列之间相同的程度。通过NCBI(HTTP/WWWNCBINLMNIHGOV/)上BLAST来比对不同物种中肌动蛋白基因同源性17。大黄鱼肌动蛋白基因与SPARUSAURATA金头鲷,AF1904731,GASTEROSTEUSACULEATUS(三刺鱼,BT0270911),TILAPIAMOSSAMBICA(非洲鲫鱼,AB0378661),ORYZIASLATIPES(青鳉,NM0011048061),PLEUROGRAMMU
42、SAZONUS(多线鱼,NP0010911),SCOMBERSCOMBRUS(大西洋鲭鱼,EF6070931)这6中生物同源性比较得出(表1),大黄鱼与大西洋鲭鱼同源性为78,与其他几种为85,比较是以核苷酸序列进行的,说明这几种生物与大黄鱼的核苷酸序列都达到了85相似,大西洋鲭鱼的相似性稍微低了点。如看一定范围内最大的同源性时,与大西洋鲭鱼达到了96,与金头鲷同源性为95,三刺鱼94,非洲鲫鱼和多线鱼为93,从这些数据可以说明肌动蛋白基因核苷酸序列在一定区域最大的相似性很高。同样用CLUSTALW分析上面的核苷酸系列时,从起始密码子ATG后128130的GGT开始到终止密码子,之间的序列高度
43、相似,表明该基因的这段区域的高度保守性。表1金头鲷,三刺鱼,非洲鲫鱼,青鳉,多线鱼,大西洋鲭鱼肌动蛋白基因序列的同源性比较TABLE1LPHAACTINGENESEQUENCEHOMOLOGYOFSPARUSAURATA,GASTEROSTEUSACULEATUS,TILAPIAMOSSAMBICA,ORYZIASLATIPES,PLEUROGRAMMUSAZONUS,SCOMBERSCOMBRUS登录号物种名同源性AF1904731SPARUSAURATA85金头鲷BT0270911GASTEROSTEUSACULEATUS85三刺鱼AB0378661TILAPIAMOSSAMBICA85非
44、洲鲫鱼NM0011048061ORYZIASLATIPES85青鳉AB0733811PLEUROGRAMMUSAZONUS85多线鱼EF6070931SCOMBERSCOMBRUS78大西洋鲭鱼222进化树以分子数据为依据构建的进化树不仅精确地反映物种间或群体间在进化过程中发生的极微细的遗传变异(小至一个氨基酸或一个核苷酸差异),而且能借助化石提供的分子类群的分化年代能定量估计出物种间或群体间的分化年代18。根据蛋白质的序列构建分子进化树EVOLUTIONARYTREE进化树给出分支层次或拓扑图形,它是产生新的基因复制或享有共同祖先的生物体的歧异点的一种反映,树枝的长度反映当这些事件发生时就存
45、在的蛋白质与现在的蛋白质之间的进化距离。根据进化树不仅可以研究从单细胞有机体到多细胞有机体的生物进化过程,而且可以粗略估计现存的各类种属生物的分歧时间。通过蛋白质的分子进化树分析,为从分子水平研究物种进化提供了新的手段,可以比较精确的确定本文中大黄鱼骨骼肌肌动蛋白的进化地位。我们通过利用CLUSTALX及MEGA41软件来构建系统进化树。CLUSTALX先建立ALN文件,然后用MEGA41软件对大黄鱼(PSEUDOSCIAENACROCEA),金头鲷(SPARUSAURATA),三刺鱼(GASTEROSTEUSACULEATUS),非洲鲫鱼(TILAPIAMOSSAMBICA),青鳉(ORYZ
46、IASLATIPES),多线鱼(PLEUROGRAMMUSAZONUS),大西洋鲭鱼(SCOMBERSCOMBRUS),黑鼠(RATTUSRATTUS),褐鼠(RATTUSNORVEGICUS),人(HOMOSAPIENS)10中生物构建了进化树,此进化树是以这些生物编码的肌动蛋白基因核苷酸序列构建的,该进化树可分为两个进化链,鱼类为一支,哺乳动物为另一分支,金头鲷与大黄鱼的亲缘关系最近,与人、黑鼠和褐鼠的亲缘关系较远,在不同的两分支上。图2肌动蛋白在几种物种中的进化树FIG2EVOLUTIONARYTREEOFALPHAACTININSEVERALSPECIES223蛋白质结构分析2231蛋
47、白质的一级结构预测蛋白质的一级结构(PRIMARYSTRUCTURE)就是蛋白质多肽链中氨基酸残基的排列顺序,也是蛋白质最基本的结构。它是由基因上遗传密码的排列顺序所决定的。各种氨基酸按遗传密码的顺序,通过肽键连接起来,成为多肽链,故肽键是蛋白质结构中的主键。蛋白质的一级结构决定了蛋白质的二级、三级等高级结构,成百亿的天然蛋白质各有其特殊的生物学活性,决定每一种蛋白质的生物学活性的结构特点,首先在于其肽链的氨基酸序列,由于组成蛋白质的20种氨基酸各具特殊的侧链,侧链基团的理化性质和空间排布各不相同,当它们按照不同的序列关系组合时,就可形成多种多样的空间结构和不同生物学活性的蛋白质分子。通过EX
48、PASY网站(HTTP/EXPASYORG/TOOLS/)对大黄鱼肌动蛋白一级结构的预测,知道其一级结构的等电点为535,分子量为362055,氨基酸数为324(图3)。图3大黄鱼肌动蛋白一级结构等电点,分子量和氨基酸数,分别为535,363053,324FIG3PRIMARYSTRUCTUREOFPSEUDOSCIAENACROCEAALPHAACTIN,THEORETICALPI535,MOLECULARWEIGHT362055,AMINOACIDS3242232蛋白质的二级结构预测二级结构(SECONDARYSTRUCTURE)是指多肽链借助于氢键沿一维方向排列成具有周期性的结构的构象,
49、是多肽链局部的空间结构,主要有螺旋、折叠、转角、无规则卷曲等几种形式,它们是构成蛋白质高级结构的基本要素19。二级结构是通过骨架上的羰基和酰胺基团之间形成的氢键维持的,氢键是稳定二级结构的主要作用力。大黄鱼肌动蛋白二级结构(图4)分析得到,螺旋占4256,随机卷曲占3086,转角占710,随即延伸链占1944。图4大黄鱼肌动蛋白二级结构HH螺旋,TT转角,EE随即延伸链,CC随机卷曲FIG4SECONDARYSTRUCTUREOFPSEUDOSCIAENACROCEAALPHAACTINHHALPHAHELIX,TTBETATURN,EEEXTENDEDSTRAND,CCRANDOMCOIL2233蛋白质的三维结构预测蛋白质三级结构(PROTEINTERTIARYSTRUCTURE)即蛋白质分子处于它的天然折叠状态的三维构象。三级结构是在二级结构的基础上进一步盘绕,折叠形成的。三级结构主要是靠氨基酸侧链之间的疏水相互作用,氢键,范德华力和静电作用维持的。多肽链中,各个二级结构的空间排布方式及有关侧链基团之间的相互