1、本科毕业论文系列开题报告生物工程细胞周期蛋白依赖激酶CDK2抑制剂的构效关系研究一、选题的背景与意义美国和英国的3位科学家利兰哈特韦尔、提莫西亨特和保罗纳斯,在2001年了发现细胞周期蛋白依赖性激酶和细胞周期蛋白CYCLINS及其作用,CDKS为催化亚单位,是一类丝氨酸SER苏氨酸THR激酶,作为细胞内重要的信号传导分子,通过参与细胞周期的不同时期,促使细胞进行有序的生长、增殖、休眠或进入凋亡。CDKS与其他激酶不同,具有其独特性,必须和它们配对的CYCLINS构成二聚体复合物而起催化调节作用。细胞周期过程中,CYCLINS周期性连续的表达或降解,并分别连接到由它们瞬间活化的CDKS上,推动细
2、胞跨越细胞周期各时相转换的限制点或检验点细胞周期使细胞完成由G1SG2M各期的转换过程,在细胞分裂增殖的调控中处于核心地位。细胞周期蛋白依赖性激酶(CDKS),细胞周期蛋白以及它们的抑制剂之间的相互作用被视为很具有发展前景的攻克肿瘤治疗的抗肿瘤剂。蛋白依赖性激酶CDK2是调节细胞周期有序进行的重要蛋白,它是CDKS家族中的重要成员,它直接参与细胞周期G1S限制点、S期DNA复制和中心体复制的调节,它的活性和功能的调节是细胞周期运转中的关键环节之一,与细胞癌变有着十分密切的关系。二、研究的基本内容与拟解决的主要问题1研究的基本内容(1)了解并学习VOLSURF、CHEMBIODRAW等各种药物设
3、计的软件,并能熟练独自操作。(2)通过已有的吡唑并4,3H喹唑啉3氨甲酰类CDK2小分子抑制剂,建立其结构参数与水溶解度之间的模型,为设计合理的药物提供理论依据。2拟解决的主要问题通过建立吡唑并4,3H喹唑啉3氨甲酰类CDK2小分子抑制剂结构与其水溶解度的3DQSAR模型,给出提高这类小分子抑制剂溶解度的结构修改意见。三、研究的方法与技术路线四、研究的总体安排与进度2010年09月25日2010年12月6日1查找资料,了解相关知识2撰写开题报告3撰写综述2010年12月14日2010年1月151深入查资料,掌握实验原理和实验过程2翻译两篇外文文献3学习相关的计算软件操作2011年3月1日201
4、0年4月1对实验结果进行分析讨论,并撰写毕业论文五、主要参考文献1李月彬,查锡良细胞周期蛋白依赖的蛋白激酶抑制剂与肿瘤J生命的化学,1997,1748112陈广祥,陈丽细胞周期及其调控与肿瘤J临床军医杂志,2002,30678793邵荣光以细胞周期调控分子为靶点的肿瘤治疗J中国肿瘤,2005,14117067084王贵英,王士杰,李勇细胞周期调控因子与癌发生的关系J国外医学肿瘤学分册,2005,320114165邹向阳,李连宏细胞周期调控与肿瘤J国际遗传学杂志,2006,29170736李志琴,章静波细胞周期调控与肿瘤1J癌症进展,2004,211461507李文赟,张磊,李福龙,等抗肿瘤细胞
5、周期蛋白依赖性激酶抑制剂的研究进展J国外医药抗生素分册,2009,3031131208梁彬,邹向阳细胞周期蛋白依赖性激酶及抑制因子与肿瘤J中国实验诊断学,2006,1011137813809陈济,宋方洲CYCLINECDK2分子活性调节机制J医学分子生物学杂志,2006,3322022310胡逸林,张端莲CDK2蛋白在胆管细胞癌中的表达及临床意义J华南国防医学杂志2010,2413911刘平,张端莲,汤显斌CDK2及其抑制因子P57KIP2在血管瘤中的表达和意义J,武汉大学学报(医学报),2008,29(6)71671912李丽,齐凤英,左连富,等CYCLINE、CDK2和P21WAF1在食管
6、上皮癌变过程中的表达及意义J肿瘤2005,25215816213张素丽,郑红兵CYCLINE、CDK2在子宫平滑肌肿瘤中的表达J肿瘤防治学研究2006,33353153214张胜名,刘铭球,李奇志,等CYCLINA、CDK2基因在非小细胞肺癌中的表达及其意义J实用癌症杂志J2005,20325025315汪鑫,任晓岚,尤启冬,等细胞周期蛋白依赖激酶小分子抑制剂的研究进展J中国药师2006,9111052105416罗蕴,胡永洲细胞周期蛋白依赖性激酶抑制剂J中国现代应用药学,2003,20536036317郭婷婷,陆涛临床试验阶段的CDK抑制剂的研究进展J中南药学2008,6558659018李
7、月彬,查锡良细胞周期蛋白依赖的蛋白激酶抑制剂与肿瘤J生命的化学1997,17481119宋悦,沈铿,汤萍萍细胞周期蛋白依赖性蛋白激酶抑制剂FLAVOPIRIDOL对卵巢上皮性癌细胞及移植瘤的干预作用J中华妇产科杂志2007,421176176420宋悦,沈铿新型小分子细胞周期素抑制剂FLAVOPIRIDOL在肿瘤治疗中的应用J中华医学杂志2005,851286286521GABRIELLATRAQUANDI,MARINACIOMEIIDENTIFICATIONOFPOTENTPYRAZOLO4,3HQUINAZOLINE3CARBOXAMIDESASMULTICYCLINDEPENDENTKI
8、NASEINHIBITORSJMEDCHEM2010532171218722孙倪悦,陆涛,陈亚东,等3DQSAR和分子对接研究吲哚咔唑类细胞周期蛋白激酶抑制剂的选择性J物理化学学报2009,25464565423HTTP/WENKUBAIDUCOM/VIEW/C2351B11CC7931B765CE1549HTML24李焕,牛静,吕庆章PDK1的吲哚酮类抑制剂定量构效关系研究化学研究与应用J2010,22335035725吴艳萍,李立平,张颖,等细胞周期调控分子与肿瘤关系的研究进展J军医进修学院学报,2006,27430630826JAYALAKSHMISRIDHARNAGARAJUAKULA
9、SELECTIVITYANDPOTENCYOFCYCLINDEPENDENTKINASEINHIBITORSTHEAAPSJOURNAL2006,8204211毕业论文文献综述生物工程细胞周期蛋白依赖性激酶CDK2及其抑制剂的研究进展摘要本文详细介绍了细胞周期蛋白依赖性激酶CDK2及其抑制剂的研究进展及抑制研究方法,还概述了肿瘤发生的机理和现状,同时,对细胞周期蛋白依赖性激酶CDK2抑制剂前景进行了展望。关键词CDK2抑制剂构效关系0前言美国和英国的3位科学家利兰哈特韦尔、提莫西亨特和保罗纳斯,在2001年了发现细胞周期蛋白依赖性激酶和细胞周期蛋白CYCLINS及其作用,CDKS为催化亚单位,
10、是一类丝氨酸SER苏氨酸THR激酶,作为细胞内重要的信号传导分子,通过参与细胞周期的不同时期,促使细胞进行有序的生长、增殖、休眠或进入凋亡13。CDKS与其他激酶不同,具有其独特性,必须和它们配对的CYCLINS构成二聚体复合物而起催化调节作用。细胞周期过程中,CYCLINS周期性连续的表达或降解,并分别连接到由它们瞬间活化的CDKS上,推动细胞跨越细胞周期各时相转换的限制点或检验点细胞周期使细胞完成由G1SG2M各期的转换过程,在细胞分裂增殖的调控中处于核心地位。细胞周期蛋白依赖性激酶(CDKS),细胞周期蛋白以及它们的抑制剂之间的相互作用被视为很具有发展前景的攻克肿瘤治疗的抗肿瘤剂46。蛋
11、白依赖性激酶CDK2是调节细胞周期有序进行的重要蛋白,它是CDKS家族中的重要成员,它直接参与细胞周期G1S限制点、S期DNA复制和中心体复制的调节,它的活性和功能的调节是细胞周期运转中的关键环节之一,与细胞癌变有着十分密切的关系。1肿瘤的成因和现状肿瘤是目前世界上引起人类死亡最重要病因之一,严重威胁人类健康的一种常见病,从生物学角度来看,肿瘤表现为细胞增殖过度、分化受阻和凋亡障碍、细胞周期失调、信号传导途径异常,是一类渐进性细胞周期调控机制破坏的疾病,因此,对细胞周期调控机制和肿瘤细胞周期调控改变的重大发现,对认识肿瘤发生和演进,以及临床诊断与治疗有十分重要的意义。进三十年来,肿瘤发病率和死
12、亡率一直呈上升趋势。预计到2020年,全世界每年新发病例多达1500万例,我国在21世纪每年死于癌症的人数达150万。于是,对肿瘤的研究日渐成为热点。许多癌基因、抑癌基因直接参与细胞周期的调控或者本身就是细胞周期调控的主要因子,它们在致瘤因素作用下可发生突变、缺失、异位、扩增等变化,导致细胞周期失控。因此,肿瘤可以说是一类细胞周期性疾病。基于细胞周期蛋白激酶(CYCLINEPENDENTKINASE,CDKS在调节肿瘤细胞的增殖与死亡中所起的关键作用,CDKS抑制剂的研究是目前抗肿瘤药物研究与开发的热点之一。六、CDKS调节细胞周期的机理及抗肿瘤21细胞周期调控细胞周期(CELLCYCLE是指
13、细胞从第一次分裂结束产生新细胞到第二次分裂结束所经历的全过程,包括四个阶段G1期、S期、G2期和M期,其有序进行受到严密的调节和控制。细胞周期的调控主要依赖于由各种细胞周期蛋白CYCLIN和相应的细胞周期蛋白依赖性激酶CYCLINDEPENDENTKINASE,CDK组成的蛋白激酶复合物来完成,CDK2可分别与CYCLINE和CYCLINA结合,可分别在G1/S期和S期发挥作用78。CDK2与CYCLINE结合,使细胞由G1期进入S期,当细胞进入S期后,CDK2转而与CYCLINA结合,调控S期并推进细胞由S期越过限制点进入G2期。CDK4与CYCLIND结合使底物磷酸化,控制G1期的进行9。
14、图1细胞周期图2CDKS,CYCLINS及其功能之间的关系22CDKS调控肿瘤目已经发现有13中CDKS蛋白激酶亚型,大多数与癌症、神经系统疾病、病毒感染等疾病有关。胡逸林和张端莲10等人研究发现CDK2蛋白在胆管细胞癌中的表达比照常组的高出很多,并且他们认为,CDK2在肿瘤的发生、发展过程中发挥了细胞周期正性调节因子的作用,促进了肿瘤细胞的增殖。武汉大学的刘平和汤显斌11等人经研究发现增生期血管瘤内皮细胞核或胞质内CDK2表达强,其抑制因子,P57KIP2表达弱,而正常皮肤组织血管内皮细胞胞核或胞质内CDK2表达极弱或无表达P57KIP2表达强。他们认为两种调节因子在血管瘤的增生期和退化期的
15、表达成负相关变化,CDKS的抑制因子显著的抑制了CDK的表达,抑制了肿瘤的发生。同时,李丽、齐凤英和王辉12等人在食管上皮癌变过程中,张素丽、郑红兵等13人在子宫肌瘤中,张胜名,李奇志14等人在非小细胞肺癌中也发现了相似的结论。3细胞周期蛋白依赖性激酶抑制剂CDKS抑制剂主要有两种,一种是生物抑制剂,另一种是CDKS化学抑制剂。生物抑制剂均为低分子量蛋白质,由不同结构基因所表达。目前共发现七种,根据结构功能的差异分为两大类一类称双重特异家族,包括P21,P27,P57,另一类叫锚蛋白家族,包括P15,P16,P18,P191518。近几年来,由于对晶体结构的深入了解,人们已经能够进行分子模拟研
16、究,设计开发高效的、选择性强的CDKS化学抑制剂,并取得了突破性进展,并且已有部分药物进入临床实验阶段1920。近年来,通过传统方法和高通量筛选以及理想药物设计技术等已经获得一系列CDK小分子抑制剂,国内外已经有很多关于CDKS抑制剂的报道21,冯漫修在其导师彭文烈的知道下发现咔啉生物碱DH272对CDK2J有相当强的抑制作用,这类药物正在临床实验阶段。孙倪悦,陆涛22这等人用分子对接研究吲哚咔唑类细胞周期蛋白激酶抑制剂的选择性些。这CDKS抑制剂都具有良好的ATP三磷酸腺苷竞争抑制活性,但由于ATP激酶位点具有较高的保守性,这些抑制剂中大多缺乏较好的选择性。4药物构效关系的研究方法CDKS化
17、学抑制剂的开发主要依赖与对CDKS蛋白晶体结构的深入了解,依赖与分子对接方法在药物设计中的运用,分子对接的最初思想起源于FISHIER提出的“锁钥理论”即受体与配体的相互识别,空间结构上的相互匹配。这类方法首先要建立大量化合物的三维结构数据库,然后将库中的分子逐一与靶标分子进行“对接”,不断优化小分子化合物的位置和取向以及分子内部柔性键的二面角和构象,寻找小分子化合物与靶标大分子作用的最佳构象。同时还依赖于3DQSAR软件包的运用2223,QSAR指化学品的分子结构与其活性之间的内在定量结构活性关系研究QUANTITATIVESTRUCTUREACTIVITYRELATIONSHIP,QSAR
18、是一种已被广泛应用于药物活性的预测研究的方法,根据对已知生物活性数据对其进行了定量结构活性关系研究,以期为设计合成更高活性的该类药物提供理论指导。李焕,牛静,吕庆章24等人利用定量构效关系对PDK1的吲哚类抑制剂的构效关系进行了研究,并获得了十分满意的实验结果。2展望尽管对ATP竞争性药物是否能达到选择性治疗肿瘤效果还存在疑问,但是,一些抑制剂已经在临床阶段,并且随着大量与肿瘤信号传导通路中的激酶相关的ATP拮抗剂的研究,相信会有更多的抑制剂被开发出来。寻找对CDKS作用特异性强、副作用小的化合物已经成为对该类药物的开发重点2526。参考文献1李月彬,查锡良细胞周期蛋白依赖的蛋白激酶抑制剂与肿
19、瘤J生命的化学,1997,1748112陈广祥,陈丽细胞周期及其调控与肿瘤J临床军医杂志,2002,30678793邵荣光以细胞周期调控分子为靶点的肿瘤治疗J中国肿瘤,2005,14117067084王贵英,王士杰,李勇细胞周期调控因子与癌发生的关系J国外医学肿瘤学分册,2005,32114165邹向阳,李连宏细胞周期调控与肿瘤J国际遗传学杂志,2006,29170736李志琴,章静波细胞周期调控与肿瘤1J癌症进展,2004,211461507李文赟,张磊,李福龙,等抗肿瘤细胞周期蛋白依赖性激酶抑制剂的研究进展J国外医药抗生素分册,2009,3031131208梁彬,邹向阳细胞周期蛋白依赖性激
20、酶及抑制因子与肿瘤J中国实验诊断学,2006,1011137813809陈济,宋方洲CYCLINECDK2分子活性调节机制J医学分子生物学杂志,2006,3322022310胡逸林,张端莲CDK2蛋白在胆管细胞癌中的表达及临床意义J华南国防医学杂志2010,2413911刘平,张端莲,汤显斌CDK2及其抑制因子P57KIP2在血管瘤中的表达和意义J,武汉大学学报(医学报),2008,29(6)71671912李丽,齐凤英,左连富,等CYCLINE、CDK2和P21WAF1在食管上皮癌变过程中的表达及意义J肿瘤2005,25215816213张素丽,郑红兵CYCLINE、CDK2在子宫平滑肌肿瘤
21、中的表达J肿瘤防治学研究2006,33353153214张胜名,刘铭球,李奇志,等CYCLINA、CDK2基因在非小细胞肺癌中的表达及其意义J实用癌症杂志J2005,20325025315汪鑫,任晓岚,尤启冬,等细胞周期蛋白依赖激酶小分子抑制剂的研究进展J中国药师2006,9111052105416罗蕴,胡永洲细胞周期蛋白依赖性激酶抑制剂J中国现代应用药学,2003,20536036317郭婷婷,陆涛临床试验阶段的CDK抑制剂的研究进展J中南药学2008,6558659018李月彬,查锡良细胞周期蛋白依赖的蛋白激酶抑制剂与肿瘤J生命的化学1997,17481119宋悦,沈铿,汤萍萍细胞周期蛋白
22、依赖性蛋白激酶抑制剂FLAVOPIRIDOL对卵巢上皮性癌细胞及移植瘤的干预作用J中华妇产科杂志2007,421176176420宋悦,沈铿新型小分子细胞周期素抑制剂FLAVOPIRIDOL在肿瘤治疗中的应用J中华医学杂志2005,851286286521GABRIELLATRAQUANDI,MARINACIOMEIIDENTIFICATIONOFPOTENTPYRAZOLO4,3HQUINAZOLINE3CARBOXAMIDESASMULTICYCLINDEPENDENTKINASEINHIBITORSJMEDCHEM2010532171218722孙倪悦,陆涛,陈亚东,等3DQSAR和分子
23、对接研究吲哚咔唑类细胞周期蛋白激酶抑制剂的选择性J物理化学学报2009,25464565423HTTP/WENKUBAIDUCOM/VIEW/C2351B11CC7931B765CE1549HTML24李焕,牛静,吕庆章PDK1的吲哚酮类抑制剂定量构效关系研究化学研究与应用J2010,22335035725吴艳萍,李立平,张颖,等细胞周期调控分子与肿瘤关系的研究进展J军医进修学院学报,2006,27430630826JAYALAKSHMISRIDHARNAGARAJUAKULASELECTIVITYANDPOTENCYOFCYCLINDEPENDENTKINASEINHIBITORSTHEAA
24、PSJOURNAL2006,8204211本科毕业设计(20_届)细胞周期蛋白依赖激酶CDK2抑制剂的构效关系研究目录1引言211研究背景2111CDK2及其生理作用2112CDKS抑制剂212研究进展2132QSAR3133TRIPOS力场优化314VOLSURF软件及其参数315本论文的思路42分子计算521分子的构建和优化522VOLSURF参数的计算103结果与讨论1031整个样本集分析1032训练集分析1733预测集分析18致谢错误未定义书签。参考文献211摘要肿瘤是目前世界上引起人类死亡最重要病因之一,从生物学角度来看,肿瘤是一类细胞周期性疾病。基于细胞周期蛋白激酶(CYCLINE
25、PENDENTKINASE,CDKS在调节肿瘤细胞的增殖与死亡中所起的关键作用,CDKS抑制剂的研究是目前抗肿瘤药物研究与开发的热点之一。由于药物的水溶解度与其ADME过程有着密切联系,故本文利用VOLSURF软件来预测药物的水溶解度并测定有利于药物水溶解度的主要分子特征。被测化合物包括57个结构不同的CDK2抑制剂,通过偏最小二乘分析法(PLS),对其水溶解度的实验值与分子结构特征进行相关,得到了较好的实验结果(R209160,Q205354)。关键词CDK2;抑制剂;VOLSURF;水溶解度ABSTRACTTUMORISREGARDEDASONEOFTHEMOSTIMPORTANTCAUS
26、EOFDEATHINTHEWORLDANDITISAKINDOFCELLCYCLICDISEASEINBIOLOGICALVIEWTHESTUDYOFCDKSINHIBITORSHASBEENONEOFTHEFOCUSINRESEARCHANDDEVELOPMENTOFNEWANTICANCERDRUGSFORTHETIMEBEING,OWINGTOTHEKEYROLECDKSPLAYEDINREGULATIONTUMORCELLPROLIFERATIONANDDEATHSINCEWATERSOLUBILITYOFDRUGSHASACLOSECONTACTWITHITSADME,WEUSEDV
27、OLSURFTOPREDICTWATERSOLUBILITYOFCDK2INHIBITORSANDDETERMINATEDTHEKEYMOLECULECHARACTERSTHATWEREGOODFORITSWATERSOLUBILITY57MOLECULESWITHDIFFERENTSTRUCTURESWERETESTEDWITHPLSTORELATETHEEXPERIMENTEDWATERSOLUBILITYWITHMOLECULECHARACTER,GETTINGABETTERRESULT(R209160,Q205354)KEYWORDSCDK2INHIBITORVOLSURFWATERS
28、OLUBILITY21引言11研究背景美国和英国的3位科学家利兰哈特韦尔、提莫西亨特和保罗纳斯,在2001年了发现细胞周期蛋白依赖性激酶和细胞周期蛋白CYCLINS及其生理作用,CDKS作为催化的亚单位,是一类丝氨酸SER/苏氨酸THR激酶,作为细胞内重要的信号传导分子,它们通过参与到细胞周期的不同时期中去,促使细胞进行有序地生长、增殖、休眠或进入凋亡13。CDKS与其他激酶不同,其具有其独特性,必须和它们配对的CYCLINS构成二聚体复合物才能起到催化调节作用。细胞周期过程中,CYCLINS周期性连续的表达或降解,并分别连接到由它们瞬间活化的CDKS上,推动细胞跨越细胞周期各时相转换的限制点
29、或检验点细胞周期使细胞完成由G1SG2M各期的转换过程,在细胞分裂增殖的调控中处于核心地位。细胞周期蛋白依赖性激酶(CDKS),细胞周期蛋白以及它们的抑制剂之间的相互作用被视为很具有发展前景的攻克肿瘤治疗的抗肿瘤剂46。111CDK2及其生理作用蛋白依赖性激酶CDK2是调节细胞周期有序进行的重要蛋白,它是CDKS家族中的重要成员,它直接参与细胞周期G1/S限制点、S期DNA复制和中心体复制的调节,它的活性和功能的调节是细胞周期运转中的关键环节之一,与细胞癌变有着十分密切的关系。在细胞周期的有序调控中,CDK2可分别与CYCLINE和CYCLINA结合,可分别在G1/S期和S期中发挥作用。CDK
30、2与CYCLINE结合,磷酸化其底物蛋白,使DNA的合成得以进行,并使细胞由G1期进入S期。在细胞增值的过程中,DNA受到损伤或出现错误时,其复制是不被允许的。这是因为在高等真核细胞中,当上述情况发生时,CDK2CYCLINE复合物就会失去激酶的活性,细胞增值就停留在G1期。当细胞由G1期进入S期后,CDK2转而与CYCLINA结合,调控S期并推进细胞由S期越过限制点进入G2期78。因此,细胞中CDK2在调节细胞的周期中发挥着无比重大的作用,其在细胞中的含量也是随着细胞周期的推进而周期性变化的。而CDK2抑制剂选择性地调节激酶的活性,对调控细胞周期和肿瘤的发生有着重大的意义。112CDKS抑制
31、剂CDKS抑制剂主要有两种,一类是生物抑制剂,另一类是CDKS化学抑制剂。生物抑制剂均为低分子量蛋白质,分别由不同的结构基因所表达。目前共发现有七种,根据结构功能的差异分为两大类一类称双重特异家族,包括P21、P27、P57,另一类叫锚蛋白家族,包括P15、P16、P18、P19912。近几年来,随着对分子晶体结构的深入了解,人们已经能够进行分子模拟研究,设计开发高效的、选择性强的CDKS化学抑制剂,并且取得了突破性的进展,并且已有部分药物进入了临床实验阶段。12研究进展近年来,通过传统方法、高通量筛选1314以及理想药物设计技术等已经获得一系列CDKS小分子抑制剂,国内外已经有很多关于CDK
32、S抑制剂的报道15,冯漫修在其导师彭文烈的指导下发现咔啉生物碱DH272对CDK2有相当强的抑制作用,这类药物正在临床实验阶段。孙倪悦、陆涛16等人用分子对接研究了吲哚咔唑类细胞周期蛋白激酶抑制剂的选择性。这些CDKS抑制剂都是良好的ATP三磷酸腺苷竞争抑制活性。但是影响药物合理吸收的另外一3个因素是药物的水溶解度,溶解度会影响药物的吸收、生理活性、稳定性等。目前,增加药物水溶解度17、18的方法已有很多并且用于实际。13研究方法131计算机辅助药物设计计算机辅助药物设计19(COMPUTERAIDEDDRUGDESIGN)是以计算机化学为基础,通过计算机的模拟、计算和预算药物与受体生物大分子
33、之间的关系,设计和优化先导化合物的方法。其一般原理是,首先通过X单晶衍射等技术获得受体大分子结合部位的晶体结构,并且采用分子模拟软件分析结合部位的结构性质,如静电场、疏水场、氢键作用位点分布等信息。然后再运用数据库搜寻或者全新药物分子设计技术,识别得到分子形状和理化性质与受体作用位点相匹配的分子,合成并测试这些分子的生物活性,经过几轮循环,即可以发现新的较好的先导化合物。132QSAR定量构效关系QUANTITATIVESTRUCTUREACTIVITYRELATIONSHIP,QSAR是一种借助分子的理化性质参数或结构参数,以数学和统计学手段定量地研究小分子与生物大分子相互作用以及小分子在生
34、物体内吸收、分布、代谢、排泄等生理相关性质的方法。这种方法广泛应用于药物、农药、化学毒剂等生物活性小分子的合理设计,其实质是从已知的大量待试数据中提取有关结构活性关系的信息,发现规律,从而应用于预测、预报未知小分子的活性。一般的,QSAR2021的基本过程包括以下几个方面收集小分子化合物的活性数据。收集化合物的相关知识,包括动力学等方面的知识。提取用于描述化合物分子性质的参数。这些参数既可以是实验测定值,也可以是理论计算值。将收集到的化合物活性数据及提取得到的分子性质参数汇聚。选择合适的建模手段。其中包括线形建模法和非线形建模法。建立模型,评价该模型的品质,特别注意避免出现过拟合现象。模型的验
35、证。133TRIPOS力场优化将文献中已知水溶解度的57个化合物小分子用SYBYL73软件包中的TRIPOS力场进行部分力场优化,分子荷载用GASTEIGERHCKEL电荷。14VOLSURF软件及其参数VOLSURF软件由意大利佩鲁贾大学化学计量学实验室的CRUCIANI和瑞士洛桑大学药物化学研究所的CRIVORI联合开发,于2000年投入市场。描述小分子化合物物理化学性质的一般描述符主要有分子量、氢键供体和受体、亲脂性、疏水性等。VOLSURF软件选择了GRID计算机软件,该软件能够从能量水平上计算分子周围的一些化学基团与目标分子相互作用的计算方法来构建3D分子相互作用立场(MOLECUL
36、ARINTERACTIONFILED,MID。GRID力场常用的探针有亲水、疏水和羰基探针。水探针是用来模拟溶解和去溶解的过程,疏水探针是用来模拟生物膜和药物分子的疏水性相互作用。羰基探针是4用来模拟生物膜和药物分子间的氢键相互作用的。15本论文的思路本实验将对57个CDK2抑制剂小分子进行了研究,其结构通式如下图1所示。其中,R1、R2、R3、R4、R5分别表示不同的取代基团,形成57个结构各异的化合物。表1VOLSURF软件的描述符及其相应的化学含义TABLE1VOLSURFSCHEMICALDESCRIPTORSANDTHEIRCORRESPONDINGMEANING描述符定义V水探针可
37、达到的表面积所包围的体积S水探针围绕靶标分子滚动时可接触的表面积R分子表面褶皱程度G分子球形性和柔性W118IW1IW8相应探针和靶标分子在8个能力水平相互作用产生的区域分子量中心和亲水性区域的不平衡性CW1CW8容量因子亲水区/分子表面积EMIN1EMIN8相应探针与分子间相互作用的最小能量值D1D8相应探针与靶标分子在8个能量级水平相互作用产生的疏/亲水性区域ID1ID8分子量中心和疏/亲水性区域的不平衡性A两亲距从疏水性区域中心到亲水性区域中心的向量CP临街堆积参数,表示疏水部分与亲水部分的比值HL1HL2亲水区/疏水区的平衡值C1C8相应探针与靶标分子在8个能量级水平上的相互作用BV分
38、子最佳疏水体积HB氢键结合能力POL分子极化率ELON分子最大扩散范围DIFF分子的扩散系数EEFR最大扩散范围和固定区域最大扩散范围的比率5图1CDK2抑制剂的结构通式FIG1THEGENERALSTRUCTUREOFCDK2INHIBITORS我们将首先使用SYBYL73软件中的BUILD模块来构建CDK2抑制剂小分子的三维结构,并用分子力学方法进行能量优化,使得各个小分子的结构更加合理。再用VOLSURF软件计算分子的三维结构参数,并用软件自带的主成分分析法(PCA)和偏最小二乘分析(PLS)方法建立构效关系,由此得到的模型起到一个很好的预测作用。通过计算机辅助药物设计的使用,可以大大加
39、快CDK2抑制剂类药物的研制速度。同时,还在一定程度上节省了药物设计开发所需要的人力、物力、财力,有着较好的发展前景。2分子计算21分子的构建和优化本实验对57个CDK2抑制剂进行研究,来源于文献22、23其结构式见表2表2CDK2抑制剂结构式TABLE2STRUCTURESOFCDK2INHIBITORSNOCOMPOUNDSTRUCTURENOCOMPOUNDSTRUCTURENOCOMPOUNDSTRUCTURE12345678910111261314151617181920212223242526272829303132333435367373839404142434445464748
40、4950518525354555657表3CDK2抑制剂小分子的水溶解度(PH7)TABLE3WATERSOLUBILITYOFCDK2INHIBITORSNOEXPLOG(1/SMMOL/LPLSMODELSOFWATERSOLUBILITYLOG(1/S)12CALCDCALCDPRED1064057071211201233421423222122322723451451471416235226203782142092221992212139233210229102261901811123426023712111141151131561421691422322722515146163154
41、916069066058172032051521814316313919226214235202122622522921723422422170207180232342192452423319320025227229219262232132222723229137128136161150292252352233012312711831234219229320480310593300300963400240183508507108936003001337001500538002502439219156152402322342334116713114542113312143199214180444
42、512822621420318019746166173164471711801884822623021949220225224505122322123019124720852212212225105320819820854175152148551611721655623123323657229215201注释LOG(1/S)数值越大,代表CDK2抑制剂的水溶解度越差,其药效就会相应的下降;数值越小,其相应的水溶解度就越强,就越利于药物的吸收过程。22VOLSURF参数的计算用VOLSURF2427软件来计算已经用TRIPOS力场优化好的57个化合物的分子参数,使用5个探针(亲水探针OH2,疏水
43、探针DRY,羰基氧探针O,胺基氢探针N1,探针BOTH)与目标分子相互作用,来计算其三维分子场。在八个不同的能量级别上来计算探针与目标小分子的相互作用,结果产生了117个与探针相关的VOLSURF参数,各个参数的具体名称见表1。抑制剂小分子的结构参数以及这些结构参数与溶解度之间的关系采用主成分分析PCA和偏最小二乘分析PLS进行处理。模型的潜变量数用留一交叉验证方法得到。得到了一个包含整个样本集的模型1和一个包含有50个样本的训练集2。3结果与讨论31整个样本集分析整个样本集的57个化合物小分子,使用5个探针(亲水探针OH2,疏水探针DRY,羰基氧探针O,胺基氢探针N1,两亲探针BOTH)与目
44、标小分子相互作用,通过主成分分析和偏最小二乘分析,共产生117个参数。其中,极化率(PLO和分子量MW与所采用的探针无关,只与分子本身结构有关。PLS分析表明,当主成份在7时,模型的相关性为R209160,计算的标准偏差是SDEC02121,留一交叉验证结果表明模型的预测能力为Q205354,SDEP04987,如图3所示。该化合物的水溶解数据的实验值LOG(1/S)与计算值见表3,两者之间的相关性见图2。主成分分析(PCA)显示变量信息主要集中在前四个主成分里,四个主成分可以解释5879的信息量,从第一到第四主成分信息量分别为2302,2015,832,730。其中前两个主成分所包含的信息量
45、最为丰富。11图2抑制剂小分子水溶解度实验值和计算值的关系FIG2THERELATIONSHIPBETWEENTHEEXPERIMENTEDVALUEANDTHECALCULATEDVALUEOFINHIBITORS图3模型1主成分数与R2和Q2的关系FIG3THERELATIONSHIPBETWEENTHENUMBEROFCOMPOUNDSANDTHER2ANDQ2INMODEL1药物的水溶解度对药物的ADME过程起着至关重要的作用。图4显示出了全部抑制剂小分子的水溶解度的能力,蓝色线区域左边的部分显示的是水溶解度较差的抑制剂小分子,从蓝色线到该区域的左下方,抑制剂小分子的溶解度逐渐下降;蓝
46、色区域和红色区域中间的部分显示的是有着中等溶解度的抑制剂小分子;红色区域右边的部分显示的是有着较强溶解度的抑制剂小分子,从红色线到该区域右上方,抑制剂小分子的溶解度逐渐增强。从图的左下角到右上角,抑制剂小分子的水溶解度是逐渐增加的。有着相同结构的小分子之间,其水溶12解度相差不大,可用来预测有着相同结构的小分子的大致水溶解度。图4模型1的PLSSCORES图FIG4PLSSCORESFIGUREOFMODEL1模型1的PLSLOADINGS图清晰地显示出了水溶解度Y1和117个参数之间的关系,如图5所示。Y1显示在图形的第一象限里,是各个参数综合的结果。在第一象限里的各个参数与Y1呈正相关,在
47、第一象限内,离原点越远的参数对水溶解度Y1的贡献越大。第三象限的各个参数和水溶解度Y1呈负相关,在此象限内,离原点越远的参数对水溶解度Y1越不利,如由OH2探针形成的参数VOH2和ROH2,这也和常识一致,分子的体积越大,其溶解度反而下降。13图5模型1的PLSLOADINGS图FIG5PLSLOADINGSFIGUREOFMODEL1图6模型1的PLSLOADING图14FIG6PLSLOADINGFIGUREOFMODEL1117个参数及其系数见图6,其意义如下,140为水探针(OH2)产生的参数,分别为V、S、R、G、W1W8、BV11、BV21、BV31、BV12、BV22、BV32、
48、IW1IW8、CW1CW8、EMIN1EMIN3、D12、D13、D23;4168为疏水探针(DRY)产生的参数,分别为D1D8、BV11、BV21、BV31、BV12、BV22、BV32、ID18、EMIN1EMIN3、D12、D13、D23;6972分别为参数HL1、HL2、A、CP;7388为羰基氧探针(O)产生的参数分别为W1W8、HB1HB8;8996为两亲(BOTH)产生的参数,为W1W8;97112为胺基氢探针(N1)产生的参数,为W1W8、HB1HB83。同时还产生ELON、EFFR和DIFF三个参数。另外还产生了两个与探针数目和类型无关的参数分子极化率(POL)和分子质量(M
49、W)。从图6可以看出,由水探针(OH2)产生的一系列参数分子体积V、表面积S、表面褶皱程度R等与抑制剂小分子的水溶解度呈负相关,表明分子的体积越大、表面积越大、褶皱程度越大,化合物小分子的水溶解度越小。亲水性参数W1OH2、W5OH2、W6OH2、W7OH2及W8OH2与化合物小分子的水溶解度呈负相关,而W3OH2、W4OH2与小分子的溶解度呈正相关,可以说明亲水探针与目标分子在1、5、6、7以及8能量级上相互作用产生的亲水区域较小,对CDK2抑制剂小分子的溶解度有抑制作用。相反的,在第3和第4能量级上(W3OH2和W4OH2)产生的疏水区域较小,对化合物小分子的溶解度具有促进作用。而在第2能量级上对化合物小分子的水溶解度的贡献不大。相互作用能矢量IW1OH2IW5OH2参数与化合物小分子的水溶解度呈负相关,表明在15能量级上分子量中心与亲水区位置的不平衡性越强,对化合物小分子的水溶解度有抑制作用,而IW6OH2IW8OH2参数与化合物小分子的水溶解度呈正相关,说明在68能量级上分子量中心与亲水区位置的不平衡性越强,对化合物小分子的水溶解度越有促进作用。容量因子CW1OH2CW5OH2与化合物的活性成负正相关,表明单位面积上的亲水区域越大,对抑制剂小分子的水溶解度越有促进作用。水探针与分子相互作用产生的三个局部最小能