1、Sh 生命 myc 基因的生物信息学分析 0 海洋生命学院 myc 基因的生物信息学分析 2015/7/3 课程 : 生物信息学 教师 : 张建业 时间 :周 三 56 节 教室 : 实验中心 111 学生 : 班级 : 2012 级生物化学与分子生物学 学号 : 12050032003 The gene ofmycin Rabbit 基因序列是从网站( http:/www.ncbi.nlm.nih.gov/)上,依据以下步骤获得: 1)选择 ”Gene”和输入 ”myc”, click “Search”; 2)找到 ”rabbit”, 点击进入下一页面; 3) 点击 “FASTA”,获取核酸
2、序列; 4) 得到 myc 基因序列 ; 5) 复制 全序列,保存到记事本中即可,保存格式如下; Oryctolagus cuniculus (rabbit) NC 013671.1 GGTGCGGGGGAAAGAGGTGTCTTTTTTTTTTTTTAATTATTATTTCTTTTCTCTTGGGTCCCCCTCTTCC TGGCCCCTTTGGGCAGGGAGTGGAGAGGGAGGCGGTGGAGCGCGCTGAAAGGGGAGTGGTCGGGGCTTGGCGGTGCGCGCTGCGCGGCGCTCCGGGTTTCGGGCTCCAGCGAGACCCTAACTCAAGGCTGCCCCCCC
3、TTTGTGTGCCCCGCAGCAGGCTACGCGACGATGCCCCTCAACGTCAGCTTCGCCACCAACAGGAACTATGACCTGGACTACGACTCGGTGCAGCCCTATTTCTACTGCGATGAGGAGGAGAACTTCTACCAGCAGCAGCAGCA GAGCGAGCTGCAGCCGCCGGCGCCCAGCGAGGATATCTGGAAGAAATTCGAGCTGCTGCCCACCCCGCCC CTGTCCCCGAGCCGCCGCTCCGGCCTCTGCTCGCCCTCCTACGTTGCCGTCGCGTCCTTCTCCCCCAGGG GAGACGACGGCGGC
4、GGCGGCGGCAGCTTCTCCACGGCTGACCAGCTGGAGATGGTCACCGAGCTGCTGGGCGGTGACATGGTGAACCAGAGCTTCATCTGCGACCCGGACGACGAGACCTTCATCAAGAACATCATCATC CAGGACTGCATGTGGAGCGGCTTCTCGGCCGCCGCCAAGCTCGTCTCGGAGAAGCTGGCCTCCTACCAGG CTGCGCGCAAGGACAGCGGCAGCCCGAGCCCCGCCCGCGGCCACGGCGGCTGCTCCACCTCCAGCCTGTA CCTGCAGGACCTGAGCGCCGCCGCCTCCGAA
5、TGCATCGACCCCTCGGTGGTCTTCCCCTACCCACTGCAC GACAGCAGCTCGCCCAAGCCCTGCGCCTCGCCCGACTCCAGCGCCTTCTCCCCGTCCTCGGACTCTCTGC TCTCCTCCAACGAGTCCTCTCCGCGGGCCAGCCCTGAGCCCCTGGTGCTCCATGAAGAGACACCGCCCAC CACCAGCAGCGACTCTGGTAAGCCTGAGGCCACTCCAGGCCGATCCAGGAGGGGGCGGGGTGGATGGACGCCTGTCTGTTCTCACTGGCTGCTGATCAGTGGGGCACTTGAGCCCATT
6、CTGCGTGCGTCTGTGCCGGTAT TTGGAAGGAGAAATGGCGGAGCTGGGACGGTGGGGCGCTCATCAACCCCGGAACCCTGGACTTTTTTAGA GTACCCTTGGCGCTTAGACCGTCCCAGTTTGCCATCCCCCCCCTTCTCTCCCACCCCTCA GGAATTTCAT TTGGGTTTTTAAATCTCCTGGCTTATCCATCCACTCCCTCTTACCTCTTAAGCATTTTAATTGCCTGGGG GGTGGGGGTGGGGGGGGCGTGTGAATGAGGATAAGAAAGGATTGATCTCCAGGAGTGAATGAA
7、TTGCCTGCCTCCCTTCCTTAACTTCTGAGAAGTGGCTGAAATTGAGTGGACTCAAGGCAGCTACAAGAATGAGGGGA GGGAGGCCAGCCTGCTGCCTGAGGGCTGCAGCTAGTGAAAGTGCCTATTCTGAACACTTAGAAGCAAAGC CTTGCCAAAACTAGACTTTTTTGCTCTTTCGCCCATCCCCCAGGACTTGTTGGCAAAGTTGTAAGATTTT TTTTTGCACTTCCAGTAAAATAGGGAGTTGCTAATATAGCACCTGAAGGTTCTTGGTAAAGTCCCTTAAA AATAGGAGG
8、TGCTTGGGAACATGCTTGACTCTGGGTGTGTCCAAAGCCTCATTAAGTCTTAGGTAAGAAT TGGCATCAATGTGATGTCCTGGCAAATTATAATTTTCTTGTCTGCACCACCACCCCAGCTGTCAATCTCC TCCCATTTAAATCTCACTTTGTAGGGGAGAAGAAACAGTGAGGCGTGTGCTTCTTTGGGGGTGCCGTTGT AACGTCCCAGTGCCTCCTGTTTGCATAGCATTCATTAAGCAAACAACGCAGTCATTGATTGTTGGGAAGC ATTGCTAACCGGGTGATTTCTGTTT
9、CTTTTCTTAAAGAGGAAGAACAAGAGGATGAGGAAGAAATCGATG TCGTTTCTGTGGAAAAGAGGCAGCCCTCCACCAAAAGGTCAGGGTCACCATCTGCAGGGGGCCACAGCAA ACCTCCACACAGCCCGCTGGTCCTCAAGAGGTGCCACGTCTCCACCCATCAGCACAATTACGCCGCGCCC CCATCCACCAGGAAGGACTACCCAGCTGCCAAGCGGGCCAAGTTGGACAGTGGCCGAGTCCTGAAGCAGA TCAGCAACAATCGCAGATGTGCCAGCCCCAGGTCCTCAGAC
10、ACCGAGGAGAACGACAAGAGGCGGACACA CAACGTCTTGGAACGCCAGAGGAGAAATGAGCTGAAAAGGAGCTTTTTTGCCCTGCGTGACCAGATCCCA GAGTTGGAAAACAATGAAAAGGCCCCCAAGGTAGTTATCCTTAAAAAAGCCACGGCGTACATCCTGGCCG TCCAAGCAGAGGAGCAAAAGCTCATTTCAGAGAAGGACTTGTTGCGGAAACGGCGAGAACAGTTGAAACACAAACTTGAACAGCTACGGAACTCTTGTGCATAAGTTGACCTATTGGAGGGAGGAACT
11、GGACTGGCTCAT GAATTCTCATTTGTTACTAAGGGAAATTAAGGAAACAGGTTCCTTCTGACAGAACTGCAGCAATCCATTA CGTATGAACTTATTTCACATGCATGGTCAAGTGCAACCTCACAACCTTGGCTGGGTCTTGGGACTGTAAG GTTTAGCCATAAAGTAAACTGCCTCAAATGGGACTTTGGGCATAAAATAACTTTTTTTATGCTTGCCATC TTTTTTTTGTTTGTTTCTTTTAACAGATTTGTATTTAAGAATTGTTTTTAAAAAATTCTAAAGTTTACCC AAC
12、TTTCCTGTGTAAATATGGCCATTAAATGTAAATA ACTTTAATAAAACGTTTATAGCAGTTATACAAG ATTTCAAGCCATGTATTATAAACCATAATTTTTTATTTAAGTA CATTTTCCTTTTTAAAGTTGATTTTTT TCTATTGTTTTTAGAAAAAATAAAATACCTGGCAAATATATCATTGA 6)寻找到 CDS 序列; lcl|AF519451.1_cds_AAN03876.1_1 protein=c-myc proto-oncogene partial=5,3 protein_id=AAN03876.1 lo
13、cation=463 GGGTCACCATCTGCAGGGGGCCACAGCAAACCTCCACACAGCCCGCTGGTCCTCAAGAGGTGCCACGTCT CCACCCATCAGCACAATTACGCCGCGCCCCCATCCACCAGGAAGGACTACCCAGCTGCCAAGCGGGCCAA GTTGGACAGTGGCCGAGTCCTGAAGCAGATCAGCAACAATCGCAGATGTGCCAGCCCCAGGTCCTCAGAC ACCGAGGAGAACGACAAGAGGCGGACACACAACGTCTTGGAACGCCAGAGGAGAAATGAGCTGAAAAGGAGCTTTT
14、TTGCCCTGCGTGACCAGATCCCAGAGTTGGAAAACAATGAAAAGGCCCCCAAGGTAGTTATCCTTAAAAAAGCCACGGCGTACATCCTGGCCGTCCAAGCAGAGGAGCAAAAGCTCATTTCAGAGAAGGACTTGTTGCGGAAACGGCGAGAACAGTTGAAACACAAACTTGAACAGC 7)将上述 CDS 序列的 myc.txt 格式直接改成 myc.pro,然后用软件 EditSeq 打开, 再 将 CDS序列转化为氨基酸序列 ; lcl|AF519451.1_cds_AAN03876.1_1 protein=c-myc p
15、roto-oncogene partial=5,3 protein_id=AAN03876.1 location=463 GSPSAGGHSKPPHSPLVLKRCHVSTHQHNYAAPPSTRKDYPAAKRAKLDSGRVLKQISNNRRCASPRSSDTEENDKRRTHNVLERQRRNELKRSFFALRDQIPELENNEKAPKVVILKKATAYILAVQAEEQKLISEKDLLRKRREQLKHKLEQ 1 myc 基因 功能 1) myc 基因既是一种可易位基因 , 又是一种受多种物质调节的基因 , 具有促进细胞分裂并获永生化功能 。 myc 被认为是一种序列特异性转
16、录因子而调节细胞的生长、分化及细胞程序化死亡。 Myc 蛋白过度表达可以使细胞永生化 , 降低它们 对 生长因子需求 , 促进细胞循环进展 , Myc 蛋白 或许也促进染色体组不稳定因而导致恶性肿瘤。 Myc 蛋白 亦可作为一种独立的重要的细胞周期调节因子而参与恶性肿瘤的发生发展。 2) myc 基因能够调节与细胞周期变化、细胞的生长代谢、基因的不稳定性、刺激血 管生成、细胞恶性转化、分化及凋亡的相关基因,如 BCL-2。 myc 基因的异常表达可阻止细胞分化,引起细胞转化,活化的 MYC 可以作为原癌基因参与肿瘤的形成及发展。在 DLBCL 中, MYC 常与多与其他基因损伤及细胞遗传学异常
17、相伴,如 BCL-2 重排。 3) myc 基因在肿瘤中被激活的方式有多种 : 外源序列的插入激活。 ALV 病毒整合到 B淋巴细胞 myc 基因位点附近 , 随之插入病毒长末端重复序列 ( 包含病毒启动子和增强子 )使 myc 基因处在病毒启动子下而被活化。染色体重排。这是 myc 基因激活的主要机制之一 , 在许 多 Burkitt” s 淋巴瘤中发现有染色体特异性重排 , 其中有 3 处染色体移位 , 移位后的位点为编码免疫球蛋白基因所在 , 其表达相当活跃 , 故 myc 基因的转录因此增强。基因扩增。癌基因可通过一定的机制在原来的染色体上复制出许多拷贝 , 为转录提供超量的模板 ,
18、随着转录水平的增加 , 癌基因产物剧增 , 从而增加了转化蛋白的剂量 , 促使细胞恶性转化。 myc 基因扩增在肿瘤中是一种常见现象 ,可 见于多种恶性肿瘤如鼻咽癌 、 乳腺癌 、 宫颈癌等。点突变 , 较为少见。 DNA 低甲基化 : DNA 甲基化是基因转录的重要调控方法 ,它的状态维持与基因转录活性密切相关。 DNA 转录活跃的区域通常甲基化程度较低 , 肿瘤组织 DNA 具有普遍的低甲基化特点 , 这种现象在癌前病变就出现 ,并随着肿瘤进展 , 低甲基化程度呈进行性下降 。 2 Primer 2.1 引物设计原则 ( 1)引物长度: 1830bp; GC 含量:一般在 40%60%之间
19、 ; ( 2)退火温度:一般情况下,一对引物的退火温度大致相等,可以设置一样温度; ( 3)避免扩增模板的二级结构域: 有关软件可以预测目的片段的稳定二级结构 域 ,有助于选择模板。实验表明, 若 待扩区域 的 自由能( G)小于 58.6lkJ/mol,扩增往往不能成功。 ( 4) 当被扩增的靶 DNA 序列较大,引物可能与靶 DNA 的多个地方结合,造成结果中有多个条带出现。 ( 5) 引物 3 端是延伸开始的地方。 3端不应超过 3 个连续的 G 或 C,因这样会使引物在 G+C 富集序列区被错误引发。 3端也不能有形成任何二级结构可能,除在特殊的 PCR( AS-PCR)反应中,引物
20、3端不能发生错配。 若 扩增编码区域,引物 3端不要终止于密码子的第 3 位,因密码子的第 3 位易发生简并,会影响扩增特异性与效率。 ( 6) 引物自身不应存在互补序列 ,引物自身连续互补碱基不能大于 3bp; 两引物之间不应存在互补性,一对引物间不应多于 4 个连续碱基的同源性或互补性。 2.2 Design PCR Primers for DNA 将 rabbits myc.txt( ORF)直接改成 rabbits myc.seq; ( 1) 打开软件 DNAMAN 8,然后打开 ”File”, 选择 ”Open”,选择 rabbits myc.seq; ( 2)然后打开 ”Prime
21、r”,选择 ” Design PCR Primers for DNA”, 出现设计引物的界面; ( 3)设置参数,如下图所示; ( 4) 引物结果; 选择如下引物: 5 primer: CATCCACCAGGAAGGACTAC; 3 primer: TTTCAACTGTTCTCGCCG; 相关参数见 上图 ; 2.3 Restriction Analysis ( 1) 点击 ”Restriction”,然后选择 ”Restriction Analysis”,然后进行参数设置,点击进入下一步; ( 2) 选择所有 酶,进行匹配; ( 3) 酶切分析结果如下; Restriction analys
22、is on lcl|AF519451.1_cds_AAN03876.1_1 Methylation: dam-Yes dcm-No Screened with 117 enzymes, 5 sites found BglI GCCNNNN/NGGC 1: 133 BstEII G/GTNACC 1: 2 Eco57I CTGAAGNNNNNNNNNNNNNNNN/ 1: 181 PstI CTGCA/G 1: 15 PvuII CAG/CTG 1: 124 List by Site Order 2 BstEII 124 PvuII 133 BglI 181 Eco57I 15 PstI Non
23、 Cut Enzymes AatII Acc65I AccIII AclI AflII AgeI AhaIII Alw44I AlwNI ApaBI ApaI ApaLI AscI Asp718I AsuII AvrII BalI BamHI BbeI BbvII BclI BglII Bpu1102I Bsc91I BsiI BsmI Bsp1407I BspHI BspMI BspMII BssHII BstD102I BstXI Bsu36I ClaI Csp45I CspI CvnI DraI DraIII DrdI EagI Eam1105I Ecl136II Eco31I Eco4
24、7III Eco52I Eco56I Eco72I EcoICRI EcoNI EcoRI EcoRV EheI EspI FseI HindIII HpaI I-PpoI KpnI MfeI Mlu113I MluI MscI MstI MstII NaeI NarI NcoI NdeI NheI NotI NruI NsiI PacI PflMI PinAI PmaCI PmeI PvuI RleAI SacI SacII SalI SapI SauI ScaI SciI SfiI SgrAI SmaI SnaBI SpeI SphI SplI SpoI SrfI SspI SstI Ss
25、tII StuI SunI SwaI Tth111I VspI XbaI XcmI XhoI XmaI XmaIII XmnI XorII Restriction sites on lcl|AF519451.1_cds_AAN03876.1_1 BstEII PstI 1 GGGTCACCATCTGCAGGGGGCCACAGCAAACCTCCACACAGCCCGCTGGTCCTCAAGAGG CCCAGTGGTAGACGTCCCCCGGTGTCGTTTGGAGGTGTGTCGGGCGACCAGGAGTTCTCC 61 TGCCACGTCTCCACCCATCAGCACAATTACGCCGCGCC
26、CCCATCCACCAGGAAGGACTAC ACGGTGCAGAGGTGGGTAGTCGTGTTAATGCGGCGCGGGGGTAGGTGGTCCTTCCTGATG PvuII BglI 121 CCAGCTGCCAAGCGGGCCAAGTTGGACAGTGGCCGAGTCCTGAAGCAGATCAGCAACAAT GGTCGACGGTTCGCCCGGTTCAACCTGTCACCGGCTCAGGACTTCGTCTAGTCGTTGTTA Eco57I 181 CGCAGATGTGCCAGCCCCAGGTCCTCAGACACCGAGGAGAACGACAAGAGGCGGACACAC GCGTCTA
27、CACGGTCGGGGTCCAGGAGTCTGTGGCTCCTCTTGCTGTTCTCCGCCTGTGTG 241 AACGTCTTGGAACGCCAGAGGAGAAATGAGCTGAAAAGGAGCTTTTTTGCCCTGCGTGAC TTGCAGAACCTTGCGGTCTCCTCTTTACTCGACTTTTCCTCGAAAAAACGGGACGCACTG 301 CAGATCCCAGAGTTGGAAAACAATGAAAAGGCCCCCAAGGTAGTTATCCTTAAAAAAGCC GTCTAGGGTCTCAACCTTTTGTTACTTTTCCGGGGGTTCCATCAATAGGAATTTTTTCGG 361 ACGGCGTACATCCTGGCCGTCCAAGCAGAGGAGCAAAAGCTCATTTCAGAGAAGGACTTG TGCCGCATGTAGGACCGGCAGGTTCGTCTCCTCGTTTTCGAGTAAAGTCTCTTCCTGAAC 421 TTGCGGAAACGGCGAGAACAGTTGAAACACAAACTTGAACAGC AACGCCTTTGCCGCTCTTGTCAACTTTGTGTTTGAACTTGTCG 环状 酶切图谱