1、- 1 -药物设计学读书报告Discovery of Novel Nitrobenzothiazole Inhibitors for M.tuberculosis ATP Phosphoribosyl Transferase (HisG) through Virtual Screening 读书报告院 系: 生命科学院专 业: 生物技术姓 名: 周纯学学 号: 0556016指导教师: 叶德泳 老师2009 年 1 月 2 日药物设计学读书报告- 2 -Discovery of Novel Nitrobenzothiazole Inhibitors for M.tuberculosis ATP
2、 Phosphoribosyl Transferase (HisG) through Virtual Screening 读书报告在全世界范围内每年有超过 2,000,000 的人因肺结核而死亡, 全球有 1/3的人口受到了潜在的感染;其中结核分枝杆菌(M.tuberculosis)是引起结核病的主要病原菌。由于目前治疗肺结核花费的时间很长,而且结核分枝杆菌抗药性菌株越来越多,所以我们还需要寻找新的更加多样性的治疗肺结核的药物。一这篇文章的作者主要针对 HisG 蛋白靶标进行了虚拟筛选,然后对筛选得到的化合物进行体外活性测定,并根据有活性的化合物的结构特点,找到了一个很有意思的结构片段-硝基苯
3、并噻唑(nitrobenzothiazole,以下简称为 NBT) ;根据化学结构相似性搜索作者又找到了一批新的化合物,并对它们也进行了虚拟筛选,最终在这些含有 NBT 片段结构的化合物中找到了 4 个有活性的化合物。最后作者又测定了这些化合物在 whole-cell 实验中的杀菌活性。下面我根据自己的理解总结一下作者每个部分的工作。第一部分,作者主要是介绍了HisG蛋白的作用及其结构特点,以及为什么选它作为筛选的靶标蛋白。已知HisG是ATP依赖性的磷酸核糖基转移酶( ATP-PRTase:ATP-phosphoribosyl transferase),它是组氨酸生物合成通路的第一步反应的催
4、化剂,并且在嘌呤的生物合成过程中也起到了重要的作用。HisG可以催化ATP 和磷酸核糖焦磷酸盐(以下简称为PRPP :phosphoribosyl pyrophosphate)的反应,产生磷酸核糖化的 ATP(以下简称为 PR-ATP: phosphoribosyl ATP)和无机化合物焦磷酸盐。现在包括结核分支杆菌等多个物种的 HisG 蛋白的晶体结构都已经被解析出来。从结构上看,结核分支杆菌的 HisG 蛋白的分子结构显著不同于其它的磷酸核糖基转移酶家族成员,因此被归结为一种新的独特的 IV 型磷酸核糖基转移酶。HisG 蛋白有两种存在形式,一种是“短”的形式,大约由 200 个氨基酸组成
5、,可以与 HisZ 蛋白形成异八聚体;另一种是“长”的形式,大约由 300 个氨基酸组成,可以与自身形成同六聚体。结核分支杆菌的 HisG 蛋白属于后者,它包含有三个结构域,两个 N 端催化结构域,它们形成了一个开口很大的暴露- 3 -于溶剂的活性位点,还有一个 C 端调节结构域。其活性位点是由第 I 结构域和第 II 结构域(两个 N 端催化结构域)的氨基酸残基组成,包含有 ATP 和 PRPP假想的结合位点。与 ATP 结合的保守的氨基酸主要位于第 I 结构域;在第 II 结构域包含有一个与 PRPP 结合的序列,由 13 个氨基酸组成(149-161) ,位于活性位点的另一面。结核分支杆
6、菌的 HisG 蛋白 C 端结构域,即第 III 结构域,可以与组氨酸结合,结合位点大约距活性位点 40A 左右;组氨酸的结合能够导致HisG 蛋白结构域之间的旋转,从而导致了六聚体复合物的构象发生改变,最终下调 HisG 的催化活性。虽然到目前为止,还没有任何关于 HisG 蛋白敲除试验的报道,但是在组氨酸生物合成通路上的其它酶的删除突变体已经被构建。Parish 等人已经证明了敲除 HisDC 的动物对于组氨酸是营养缺陷型的,揭示了这条通路和 HisDC 中间体的重要性。并且,体外的转位子插入试验也证明了 HisG 蛋白对于细菌生长的重要性。另一方面,由于 HisG 蛋白在代谢方面的重要作
7、用,而且该蛋白仅存在于原核生物和低级的真核生物中,在人体中并不存在,这样就不用担心其抑制剂会对人体有副作用。所以作者设想把它作为治疗肺结核的潜在靶标。第二部分,虚拟筛选。本文作者是通过一个多阶段的虚拟筛选技术来寻找HisG 蛋白的抑制剂的。我把他的工作总结为两个数据库,两种对接程序。两个数据库是指 ChemBidge 数据库和 NCI 数据库,它们都是公开的化学数据库,这两个数据库包含有超过 500,000 个化合物;两种对接程序是指 GOLD 和FlexX。具体的筛选流程大概是这样的:首先,为了保证两个对接模型的可靠性,作者把反应产物 PR-ATP 对接到了活性位点处。结果表明,两种对接程序
8、对PR-ATP 的结合构象的预测是相似的,它的磷酸核糖基与 PRPP 结合位点发生了相互作用,这与已知的实验结果是一致的。另外,它的三磷酸盐基团与 ATP 结合位点附近的氨基酸残基的侧链也发生了作用。接下来,作者使用 GOLD 对接程序对这两个数据库进行了初级筛选。对接结果是通过 GOLD 打分来评价的,在排名靠前的化合物中,许多化合物都能在活性口袋附近形成多于 3 个的氢键,并且在立体结构上与结合表面也非常地匹配。另外,有一些化合物的打分值非常高,经检查发现这些化合物都有长的脂肪链结构,含有许多的旋转键,这个- 4 -现象说明这两个数据库都没有进行预先的类药性限制。按 GOLD 程序本身打分
9、的由高到低的顺序,作者从 ChemBridge 数据库中选择了 7000 个化合物,从NCI 数据库中选择了前 4500 个化合物,总共 11,500 个化合物。然后,为了进一步保证结果的可靠性,作者又对初筛选择出来的 11,500 个化合物进行了第二次对接,这次使用的对接程序是 FlexX。对接结束后,作者对这些化合物又进行了一致性打分,这不仅包括 FlexX 打分,还包括 DOCK 打分,PMF 打分,ChemScore 打分和 GOLD 打分,最终按照一致性打分大于等于 4 的标准,从ChemBridge 数据库中选择了 700 个化合物,从 NCI 数据库中选择了 450 个化合物。最
10、后,作者根据 Lipinski 的“5 规则”对挑选出来的 1150 个化合物进行了进一步地筛选,规定如果一个化合物违反了超过一半的规则就会被删除掉,同时,如果化合物的可旋转键的个数超过 8 个也同样会被删除掉。但是这里有一点是与 Lipinski 规则不一致的地方,因为该蛋白的活性位点很大,所以作者就把分子量的限制定到了 550Da,而不是 Lipinski 规则里的 500Da。经过这个筛选以后,作者从 ChemBridge 数据库的 700 个化合物里去掉了 154 个,从 NCI 数据库的 450 个化合物里去掉了 90 个,这样就只剩下了大约 900 多个化合物。接下来,作者在分子图
11、形软件 sybyl 里肉眼观察挑选出来的 900 多个化合物,观察到了三种主要的结合模式。一种是结合在 ATP 结合位点,一种是结合在 PRPP 结合位点,另一种是结合在产物结合位点,即 PR-ATP 的结合位点。这为作者最终挑选化合物提供了一定的依据。最终,作者根据以下三个标准:1)与活性口袋附近的残基形成氢键的可能性;2) 占据的活性位点的位置;3)结构的特异性。从 ChemBridge 数据库选择了 13 个化合物,从 NCI 数据库里选择了 37 个化合物,共 50 个化合物来进行下一步的体外活性的实验测定。第三部分,化合物体外抑制活性的测定:实验是通过测定 ATP 和 PRPP 反应
12、产物 PR-ATP 的量来判断抑制活性的。经过实验,总共有 7 个化合物(结构见附图一)在 10M 浓度下显示了明显的抑制作用。其中有三个化合物,4、6 和 10 号化合物显示了超过 50%的抑制作用,进一步地实验证明 4 号和 6号化合物在 1M 的浓度下依然分别有 40%和 35%的抑制作用;对于 4 号化合物,预测的 IC50 是 4M,6 号化合物的 IC50 是 6M ,换算成抑制常数大概- 5 -是 2,这比已知的抑制剂如 dicoumarol(60M )和pentachlorophenol(50M)要好很多。第四部分,探索硝基苯并噻唑片段的作用。根据文献调研,作者对 6 号化合物
13、的 NBT 取代基的作用非常有兴趣,因为它的结构比较像 dinitrophenol,而该化合物已经被证实对大肠杆菌里的 HisG 蛋白有一定的抑制作用。所以为了研究这个片段的作用,作者又进行了以下实验。作者首先采用了结晶的方法来证明 6 号化合物的预测结合模型是有效的,同时也证实了 NBT 片段的重要性。接下来,为了找到更多有抑制活性的化合物,作者又在 ChemBridge 数据库里找到了含有 NBT 结构或其类似结构的 4,854 个化合物,并运用 Lipinski 规则对它们进行筛选,然后用 FlexX 程序对接,并对它们进行了一致性打分。在去掉结构冗余的化合物后,作者最终选择了 19 个
14、化合物,体外实验证明了其中的 4 个化合物(结构见附图二)在 10M 的浓度下有抑制活性。第五部分,在M. smgmatis菌株里进行whole-cell实验,即对上述在体外测得有活性的化合物进行抑菌活性测定。M. smgmatis菌株属于分支杆菌菌株类,在基因组水平上与结核分支杆菌有很高的相似性,因此,它常被用来作为结核分支杆菌的替代品来进行潜在抑制剂抑菌活性测定。实验结果证明了其中的两个化合物,17号和18号具有抑制细菌生长的活性。二下面,结合我在课堂上学到的知识对这篇文章做进一步分析。在这篇文章中,作者使用的主要方法之一就是虚拟筛选。虚拟筛选,也被称为计算机筛选,即在进行生物活性筛选之前
15、,在计算机上对化合物分子进行预筛选,以降低实际筛选化合物数目,同时提高先导化合物的发现效率。虚拟筛选技术主要可以分为两大类:基于靶点结构的虚拟筛选和基于配体相似性的虚拟筛选,本文主要用到的是基于靶点结构的虚拟筛选技术,同时也用了基于配体相似性的虚拟筛选技术,如根据NBT化学结构相似性搜索又找到了一批新的化合物。我们知道,基于靶点结构的虚拟筛选技术的代表性方法是分子对接,这也- 6 -正是本文作者采用的主要方法。分子对接就是将配体分子放置到受体大分子的活性位点中,预测小分子与受体结合构象及作用能的过程。其目的是从小分子数据库中发现合适的化合物作为受体大分子的配体,分子对接可以从整体上考虑配体与受
16、体结合的效果,能比较有效地避免其他从头设计方法中容易出现的局部作用较好,而整体结合欠佳的情况。分子对接中配体结合构象的优化是非常重要的环节,只有找到小分子配体合适的构象,才能得到比较准确的结果。目前,关于构象优化的算法有很多,大体上可以分为三类:一是系统搜索,包括片段生长法,构象搜索法和构象库方法;二是随机搜索法,包括蒙特卡罗法,模拟退火法,遗传算法和禁忌搜索法;三是确定性搜索,主要是分子动力学模拟。因为每种算法都有其各自的优缺点,不能说哪一种算法更好,所以本文作者也是选择了两种不同的对接程序进行虚拟筛选,其中GOLD对接程序采用的是遗传算法(随机搜索法) ,而FlexX对接程序采用的是片段生
17、长法(系统搜索) 。我认为这样做的结果的可信度比只使用其中任何一种程序的结果可信度要高。本文作者挑选化合物的依据是根据打分的高低,这里的打分结果是由打分函数来评判的。虚拟筛选中的打分函数包括两重含义:先对同一个分子的不同结合构象进行打分,评价各构象的结合好坏;再对数据库中的不同分子的最好结合构象进行打分,以得到最终的结合能力从高到低的化合物分子清单。现在的打分函数大致可以分为以下几类:基于力场的打分函数,半经验的自由能打分函数和基于知识的打分函数。但是由于每一种打分函数都有其不完善的地方,近年来又出现了一种新的“一致性”打分方法,它综合了五种打分:FlexX打分、DOCK打分、PMF打分、 C
18、hemScore打分和GOLD打分,这样一种方法在降低假阳性方面的效果十分显著。本文的作者不仅考虑了两种对接程序的打分,而且又考虑了这些化合物的一致性打分,使得结果更加让人可信。另外,本文作者在筛选化合物的过程中,还用到了 Lipinski 规则。Lipinski规则又被称作“五规则” ,被广泛用于数据库的初筛中。具体要求如下:氢键给体(连接在氮原子和氧原子上的氢原子数)数目小于 5;氢键受体(氮原子和氧原子的数目)数目小于 10;相对分子质量小于 500;脂水分配系数小于 5。经过这个规则的筛选,更有利于作者得到最后能够成药的化合物。- 7 -三我觉得这篇文章整体来说做得非常好。第一,作者的
19、思路好且实验比较完整,先是虚拟筛选,然后是进行体外化合物反应催化活性验证,最后又做了抑菌活性的实验验证,作者的实验条理非常清楚,最终也得到了很好的结果。第二,作者实验设计十分严谨。例如,在做虚拟筛选之前,作者首先验证了所选择的筛选模型是否正确,并且选用了两种不同的虚拟筛选方法,增强了实验结果的可靠性。另外,作者在实验过程中,发现所筛选的化合物数据库没有进行类药性的评价,所以作者在筛选的过程中引入了Lipinski规则,以期能够得到更好的结果。第三,作者在筛选化合物的过程中引用了一致性打分的方法,降低了假阳性的可能。我认为,本实验美中不足的地方有两点。第一,缺少体内实验。通过前面的实验,筛选出有
20、活性的化合物分子,最终能否由类药化合物转化为真正的药物,还要有进一步的动物和人体试验验证。我们可以通过建立由结核分枝杆菌引起的结核病小鼠或者其它动物模型,通过动物体内实验验证这些化合物的药理活性。这方面的工作应该不难,我推测应该是他们这在做这方面的工作或者已经做了这方面的工作,但结果不尽理想,所以就没有一起发表。第二,对化合物抑菌活性测定方法不完善。虽然M. smgmatis菌株属于分支杆菌菌株类,在基因组水平上与结核分支杆菌有很高的相似性,但我认为不能完全用其作为该抑菌试验的替代品。而且,临床引起结核病的主要是结核分枝杆菌,直接用结核分枝杆菌做实验有利于和后续的动物试验和临床试验结合起来。附图1(附图1、2中的化合物结构均是使用ISIS/Draw分子绘图软件绘制): 4号小分子: NNSNHOSN- 8 -6号小分子: NHNOOSNN+OO10号小分子: NHOSS CH3OOCH314号小分子:- 9 -HOSN+ONOHOH15号小分子: SNNNH2NH2S16号小分子: HOSONNH2NH2N SOOH1号小分子:- 10 -Cl ONOH NOOO附图二:17号小分子: N+ON+OOBr NHOHNHOO18号小分子: OHNHNON+ONHOHN+OO19号小分子: