1、I 抗结核病药物的 3D-QSAR 定量结构性质关系研究 摘 要 采用三维全息原子场作用矢量 (3D-HoVAIF)和 基于虚拟蛋白质受体原子探针的分子表面随机采样分析 (RaSMS)对 25 个 查耳 酮 类抗结核病药物进行定量构效关系 (QSAR)研究。运用 多元线性回归 (Multiple linear regression, MLR)及 偏最小二乘回归 (partial least square regression, PLS)建模,同时 采用内部及外部双重验证的办法对所得模型稳定性能进行了深入分析和检验。 采用 3D-HoVAIF 的 MLR 及 PLS 建模的复相关系数 (Rcum
2、2)、留一法 (leave-one-out, LOO)交互校验 (cross-validation, CV)复相关系数 (QLOO2)和外部样本校验复相关系数 (Qext2)分别为 0.984、 0.920、 0.808 和 0.998、 0.975、 0.903;采用 RaSMS分别为 0.975、 0.914、 0.764 和 0.926、 0.905、 0.829。 结果表明 , 3D-HoVAIF 和 RaSMS都有 较好表征抗结核药物分子结构信息,因而能建立具有良好稳定性和预测能力的QSAR 模型。 关键词: 体外抗菌活性 , 抗结核病药物 , 三维全息原子场作用矢量 , 比较分子
3、/虚拟受体相互作用分析法, 定量构效关系 II Anti-TB drugs by 3D-QSAR Quantitative Structure-Property Relationship Study ABSTRACT A newly developed three-dimensional holographic vector of atomic interaction field (3D-HoVAIF) and Protein-based virtual surface receptor molecule atom probe analysis of random sampling (RaSM
4、S) were used to describe the chemical structures of 25 Chalcone as antituberculosis agents. Here quantitative structure activity relationship (QSAR) models were built by Multiple linear regression ( MLR) and partial least square regression (PLS). The estimation stability and generalization ability o
5、f these models were strictly analyzed by both internal and external validations. When use 3D-HoVAIF, the correlation coefficient (R2) of established MLR and PLS, leave-one-out (LOO) cross-validation (CV), predicted values versus experimental ones of external samples were 0.998、 0.975、 0.903 and 0.92
6、6、 0.785、0.785, respectively. When use (RaSMS), the results were 0951、 0.914、 0.829 and 0.928、0.905、 0.764. The results indicated that results of PLS here had favorable estimation stability and good prediction capabilities. Satisfactory results showed that 3D-HoVAIF and RaSMS could preferably expres
7、s information related to biological activity of anti-tuberculosis drug. KEY WORDS: in vitro antibacterial activity, anti-tuberculosis drug, three-dimensional holographic vector of atomic interaction field, quantitative (3D-HoVAIF), Protein-based virtual surface receptor molecule atom probe analysis
8、of random sampling (RaSMS), structure-activity relationship (QSAR) III 目 录 摘 要 . I ABSTRACT . II 1 引 言 . 1 1.1 结核病和抗结核病药物简介 . 1 1.1.1 结核病简介 . 1 1.1.2 抗菌活性 . 1 1.1.3 抗结核病药物的发展历史 . 1 1.1.4 抗结合药物回顾 . 2 1.1.5 抗结核新药研究开发的现状 . 2 1.2 计量化学简介 . 4 1.3 计算机辅助药物分子设计的基本理论与方法 . 5 1.3.1 计算机药物辅助设计的基本理论 . 5 1.3.2 常用的计
9、算机辅助药物设计方法 . 5 1.4 定量构效关系研究 . 5 1.4.1 定量构效关系研究的基本理论 . 5 1.4.2 定量 构效关系研究的发展 . 6 1.4.3 定量构效关系研究的意义 . 7 1.4.4 定量构效关系的研究现状 . 7 2 原理与方法 . 9 2.1 三维全息原子场作用矢量 (3D-HOVAIF)的基本概念及相关计算 . 9 2.2 基于虚拟蛋白质受体原子探针的分子表面随机采样分析 (RASMS)的基本概念及相关计算 . 15 2.2.1 蛋白质受体原子探针 . 15 2.2.2 虚拟受体可及表面 . 16 2.2.3 药物分子中常见原子分类 . 17 2.2.4 探
10、针原子与药物配体的作用模式 . 17 2.2.5 RaSMS 实现过程 . 18 2.3 多元线性回归原理 . 19 2.4 偏最小二乘法原理 . 20 3 模型的建立与检验 . 22 3.1 数据采集 . 22 3.2 变量筛选 . 23 3.3 多元线性回归建模 . 24 IV 3.3.1 模型的建立 . 24 3.3.2 模型的检验 . 26 3.4 偏最小二乘建模 . 27 3.4.1 模型的建立 . 27 3.4.2 模型的检验 . 30 4 结论 . 33 致 谢 . 34 参 考 文 献 . 35 抗结核病药物的 3D-QSAR 定量结构性质关系研究 1 1 引 言 1.1 结核
11、病和抗结核病药物简介 1.1.1 结核病简介 结核病 (tuberculosis, TB)是结核分枝杆菌 (Mycobacterium tuberculosis, MTB)引起的感染性疾病 , 可侵犯全身各器官,以肺结核最为多见。它 是一种发展缓慢、如果不加治疗能导致长期健康不良及死亡的疾病。 结核病在过去被称为 “ 痨病 ” 。 它是 由于 感染结核杆菌而引起的一种慢性传染病 。它传染性强 , 散播面广 , 而且不分地域、季节均可能发生。结核病主要是通过空气传播的呼吸道传染病 , 此外还可以通过消化道、皮肤、胎盘和生殖器等途径传染。对人类来说 , 普遍对结核菌易感 , 但感染后是否发病决定于
12、结核菌的毒力、数量 以及人体抵抗力。尤其是人体的抵抗力减退 , 就容易发生结核病 1。 全球有 1/3人口感染了结核杆菌 , 其中 99%的结核病死亡者分布在发展中国家。患病率高、死亡率高、耐药率高、年递降率低是结核病近年的疫情特征。 100多年以来 , 虽有不少抗结核病药物被发现 , 但每年仍有 30万人死于结核病 , 其中主要是 14 55岁的青年和中年人。近几年 , 结核发病率有上升趋势。据专家预测 , 如不采取有力措施 , 未来10年内全球将有 3000万人死于结核病。全球每年有 1%的人被结核杆菌感染 , 现有活动性肺结核病人 2000万 , 每 10秒钟就有 1人死于结核 病 ,
13、每 4秒钟就有 1人患上结核病。我国现有活动性肺结核病人 600万 , 每年因结核病死亡 25万人 。 1.1.2 抗菌活性 抗菌活性 是指 抗菌药 抑制或杀灭病原微生物的能力。可用体外抑菌试验和体内实验治疗法测定。体外抑菌实验对临床用药具有重要参考意义。能够抑制培养基内细菌生长的最 低 浓度为 最小抑菌浓度 ( minimal inhibitory concentration, MIC)。以杀灭细菌为评定标准时,使活菌总数减少 99%或 99.5%以上,称为 最小杀菌浓度( minimal bactericidal concentration, MBC)。在一批实验中能抑制 50%或 90%
14、受试菌所需 MIC,分别称为 MIC50及 MIC90。 抗菌药 的抑菌作用和杀菌作用是相对,有些抗菌药在低浓度时呈抑菌作用,而高浓度呈杀菌作用。 1.1.3 抗结核病药物的发展历史 最早出现的有效抗结核药物当数链霉素 (SM)。它发现于 20世纪 40年代 , 当时单用 SM治疗肺结核 2 3个月后就可使临床症状和 X线影像得以改善 , 并可暂获痰菌阴转。对氨水杨酸 (PAS)被应用于临床后发现 , SM加 PAS的治疗效果优于单一用药 , 而且可以防止结核分支杆菌产生耐药性。发明异烟肼 (INH)后 , 有人单用 INH和联用 INH+PAS或 SM进陕西科技大学毕业论文 2 行对比治疗试
15、验 , 再一次证明了联合用药的优势。于是在此基础上产 生了著名的结核病标准 化疗方案 , 即 SM+INH+PAS, 疗程 一年半至两 年 , 并可根据药源和患者的耐受性将 PAS替换为乙胺丁醇 (EMB)或氨硫脲 (TB1), 俗称 “ 老三化 ” 。 20世纪 70年代随着利福平 (RFP)在临床上的应用以及对吡嗪酰胺 (PZA)的重新认识 , 在经过大量的实验后 , 短程化疗成为结核病治疗的最大热点 , 并取得了令人瞩目的成就。 1.1.4 抗结合药物 回顾 自 1944年发现链霉素 , 20世纪 50 60年代发现异烟肼与利福平以来 , 相继有多种抗结核药问世 。 根据抗菌作用强弱可分
16、为 :1)具有杀菌作用的药物 。 如异烟 肼、利福平、链霉素、卡那霉素、卷曲霉素、乙硫异烟胺、吡嗪酰胺等 。 2)具有一定杀菌作用的药物 。如氧氟沙星、左氧氟沙星等喹诺酮类抗菌药 。 3)具有抑菌作用的药物 。 如乙胺丁醇、环丝氨酸、对氨基水杨酸等 。 按临床应用可分为一线与二线抗结核药 。 前者有异烟肼( NH)、利福平( RFP)、链霉素( SM)、吡嗪酰胺( PZA)、乙胺丁醇( EB);后者有乙硫异烟胺( ETH)、卡那霉素( KM)、环丝氨酸( CS)、卷曲霉素( CPM)、氨硫脲( TBL)、对氨基水杨酸( PAS)、氧氟沙星( OFLX) 2。 1.1.5 抗结核新药研究开发的
17、现状 近年来抗结核药物的研究开发获得进一步的发展 , 发现了一些有苗头的新化合物 ,开发的前景也很广阔。 1) 利福霉素类 利福喷丁于 1998年在美国获得批准用于治疗结核病。利福布丁获准用于 HIV合并结核病不能应用利福平的患者。苯并口恶嗪利福霉素 (rifalazil, KRM-1648, RLZ)比利福平具有更强的杀菌作用 , 对结核分枝杆菌的 MIC比利福平强 64倍 , 而半 衰期长 60h, 在小鼠结核病治疗实验中 RLZ加吡嗪酰胺的联合灭菌效果可与异烟肼与利福平的联合治疗效果相比拟 , 而在停药后复发率更低。现进入 期临床研究。 但利福霉素类药物存在交叉耐药性 , 且有动物实验结
18、果表明它们均对 MDR-TB无效。 2) 氟喹诺酮类 (FQs) 研究发现本类中第三代、第四代氟喹诺酮类药物中有不少具有较强的抗结核分枝杆菌活性 , 对非结核分枝杆菌亦有作用 , 目前环丙沙星、氧氟沙星、左氧氟沙星等成为治疗 MDR-TB的主要选择药物。莫西沙星 (moxiflox acin) ( MIC 0. 25 Lg/ ml)3、加替沙星(gatiflox acin) (0. 25Lg/ml)4和加仑诺沙星 (garenox acin)等第四代 FQs显示更强的抗结核活性 , 具有一定的开发潜力。 3) 新大环内酯类药物 (克拉霉素、阿奇霉素、罗红霉素 ) 这类药物是红霉素的衍生物 ,
19、抗分枝杆菌的作用机制是菌体内核糖体的 SOS亚基可逆性结合 , 干扰蛋白质的合成。其中罗红霉素抗结核分枝杆菌作用最强。与利福平和异抗结核病药物的 3D-QSAR 定量结构性质关系研究 3 烟肼有协同作用。此类药物有良好的药动学特征 , 口服易吸收 , 组织穿透性好 , 组织细胞内浓度高于血药浓度 , 并有中等长的半衰期 , 新大环内酯类药物主要用于非结核分枝杆菌感染和耐多药结核病的治疗。 4) 恶唑烷酮类 本类属于新型的合成抗菌剂 , 具有广谱的抗分枝杆菌作用 , 作用机制是通过与 50S核 糖体亚单位相结合抑制细菌蛋白质的合成 , 目前正从中开发抗革兰阳性耐药菌和抗分枝杆菌的新药。其中 PN
20、U-100480在治疗小鼠结核感染中证实其疗效 , 剂量 100 mg/kg时与异烟肼 25 mg/kg的效果相当 , 此外在合并的实验中发现其作用与异烟肼或利福平在不同实验中的活性 5。另一药利奈唑酮 (Linezolid)在小鼠实验治疗中比 PNU-100480和异烟肼稍差 , 已试用于耐药结核病的治疗并取得明显的疗效 6, 但因有血液学毒性等及价格昂贵等问题而受限。 5) 硝基咪唑并吡喃类 源于 20世纪 70年代印度研究者的发 现 , CGI-17341对耐药结核分枝杆菌的 MIC为0.1 0.3 Lg/ml, 体外抗结核活性近于异烟肼、利福平 , 动物实验结果亦然 , 与其他抗结核药
21、物无交叉耐药 , 是有希望的抗结核药 , 正处于 期临床研究阶段。本类中筛选出硝基咪唑并吡喃有效化合物 PA-824对敏感结核分枝杆菌和单耐利福平结核分之杆菌的MIC是 0.015 0.25 Lg/ml, 多耐药结核分枝杆菌对 PA-824同样敏感 , 与现有的抗结核药物无交叉耐药性 7。体外实验发现 PA-824在低氧环境下培养的非复制期结核分枝杆菌模型中有作用 , 其活性类似于甲硝唑 , 明显强于 CGI-17341和异烟肼 (异烟肼对此模型中的结核分枝杆菌无作用 )。应用结核分枝杆菌报告荧光素酶表达的菌株的短期小鼠感染模型对 50种以上的 NAPs化合物的体内活性测定时发现 , 虽然 P
22、A-824的体外抗结核活性不是最强的 , 但在口服 25 mg/kg剂量下具有最强的体内活性 , 说明 PA-824具有较 NAPs中其他化合物良好的药动学特征。急性动物毒性实验 LD50是 1000 mg/kg, 500 mg/kg连续口服 28d, 未出现明显不良反应。 PA-824对多耐药结核分枝杆菌、非复制持留性结核分枝杆菌均具有抗菌活性 , 说明 NAPs可能具有新的作用机制 8。本类中筛选出的有效化合物为 PA-824, 它对药物敏感的结核分枝杆菌及耐利福平的结核分枝杆菌的 MIC为0.015-0.25 mg/ml, 对耐多药结核分枝杆菌也敏感。它对缺氧条件下培养的结核分枝杆菌有杀
23、菌活性。治疗豚鼠气雾感染结核时 , 40 mg/kg每日一次连用 30d时 , 其疗效与异烟肼治疗相当。硝基咪唑并吡喃类已证明对持留状态和休眠状态的结核分枝杆菌有效 , 这类化合物的出现对改善非复制菌群的作用带来极大的希望 , 提示有可能成为缩短疗程的有效药物。 6) 吩噻嗪类 氯法齐明 (氯苯吩嗪 , clofazimine, CFM)是一种用于麻风病的药物 , 近年来开始试用于耐药结核病的治疗。 CFM是一种吩嗪染料 , 通过与分枝杆菌的 DNA结合抑制转录而产生抑制分枝杆菌生长的效果。硫利达嗪 (thioridazine)9是抗精神病药 , 服药后耐受性较好 ,陕西科技大学毕业论文 4
24、氯丙嗪对敏感菌及耐药菌均有效在体外减慢结核分枝杆菌的生长。此类药物对人体结核病的治疗作用尚有待进一步研究。 7) 脂肪酸和分枝菌酸合成的抑制剂 是抗结核药物开发的一个新领域。硫内酯霉素 (thio lactomy cin, TLM)在试管内小鼠巨噬细胞模 型中显示 , TLM有杀灭细胞内结核分枝杆菌作用并呈剂量依赖性。辛磺酰基乙酰胺 (N-octanesulfony lacetamide, OSA)对耐异烟肼和多耐药结核分枝杆菌的 MIC分别为 6.25和 12.5 Lg/ ml。 8) 硫乙酰霉素 10Glax o-Smithkline公司抗结核药项目执行董事 Duncan博士称 , 公司正
25、与美国国立卫生研究所 (NIH)合作开发一种天然抗结核药物 硫乙酰霉素 , 这种低分子量化合物在体内和体外均具有抗结核能力 , 对耐药结核分枝杆菌亦有作用 , 该研制始于 2001年 , 进入临床应用可 能尚需数年 11。 1.2 计量化学简介 又称化学统计学 , 数学、统计学、计算机科学与化学结合而形成的化学分支学科。它应用数学、 统计学和其他方法和手段(包括计算机)选择最优试验设计和测量方法 ,并通过对 测量数据的处理和解析 , 最大限度地获取有关物质系统的成分、结构及其他相关信息。 化学计量学是瑞典 Umea大学 S.沃尔德 (S.Wold)在 1971年首先提出来的。 1974年美国B
26、.R.科瓦斯基和沃尔德共同倡议成立了化学计量学学会。化学计量学在 80年代有了较大的发展,各种新的化学计量学算法的基础及应用研究取得了长足的进 展,成为化学与分析化学发展的重要前沿领域。它的兴起有力地推动了化学和分析化学的发展,为分析化学工作者优化试验设计和测量方法、科学处理和解析数据并从中提取有用信息,开拓了新的思路,提供了新的手段。 化学计量学的研究对象是有关化学量测的基础理论和方法学。它所研究的内容包括:统计学和统计方法;分析信息理论;采样;试验优化与设计;分析校正理论;分析信号检测和分析信号处理;化学模式识别;图像分析;构效关系研究;人工智能和专家系统;人工神经元网络与自适应化学模式识
27、别;库检索等。其任务是研究有关化学测量的理论与方法学, 应用数学、统计学与信息理论、计算机科学的方法和手段,科学地设计化学实验,选择最优的测量方法,最有效地获取体系有用的特征数据,并通过解析测量数据最大限度地从中提取有关物质的定性、定量、形态、结构等信息。它是一门正在发展的新兴学科,其主要研究内容包括统计学与统计方法、校正理论、模型估计和参数估计、实验设计和优化方法、分析信号处理、化学模式识别、定量构效关系、人工智能和专家系统、软件和库检索等。 抗结核病药物的 3D-QSAR 定量结构性质关系研究 5 1.3 计算机辅助药物分子设计的基本理论与方法 1.3.1 计算机药物辅助设计的基本理论 随
28、着生命科学和信息科学的快速 发展, 21世纪创新药物研究以全新的面貌出现。以化学、生物学、数学和计算机科学为基础的计算机辅助药物分子设计12(computer-aideddrug design, CADD)在药物研发中起着重要的作用,是药物研究的主要技术之一,已成为国际上十分活跃的科学研究领域。 计算机辅助药物设计以计算机为工具,根据前人积累的有关生物活性物质结构与功能的资料,以及受体在生物体内的作用靶点,采用各种理论计算方法和分子图形模拟技术,设计出具有特定药效的药物分子。计算机辅助药物设计方法可以用于研究配体和受体复合物的构型和 立体化学特征、药物与受体的结合模式和特异性、药物分子的活性基
29、团和药效团模型等,为改进现有的生物活性物质的结构并设计出新的药物分子提供理论指导和思路 13。 1.3.2 常用的计算机辅助药物设计方法 计算机辅助药物设计是基于对药物和受体间相互作用的理解和研究。根据生物大分子 ( 受体 ) 是否已知把计算机辅助药物设计方法分为两类 14,一类是基于配体的药物设计,另一类是基于受体结构的药物设计。 基于配体的药物设计方法主要是针对未知受体结构的药物分子的设计,主要包括定 量构效关系方法 15、药效基团模型方法以及类 药性分析方法这三种方法。基于受体结构的药物设计是通过各种计算化学和分子图形学的方法来研究受体与配体的结合模式和特征,探讨影响配体与受体结合的关键
30、分子间作用;结合系统能量和分项能量的分析计算以发现选择性作用于靶点的配体分子。基于受体结构的药物设计包括活性位点分析法、数据库搜寻法和全新药物设计。 1.4 定量 构效 关系研究 1.4.1 定量 构效 关系研究的基本理论 狭义的构效关系 (structure activity relationships, SAR)是指药物的结构发生变化时生物活性的定性变化经验。定量构效关系 (quantitative strucher activity relationships, QSAR)是由 SAR发展而来的,它采用数学模式来描述药物的生物活性与结构间的定量依赖关系16,是适应合理设计生物活性分子的需
31、要而发展起来的 17。定量构效关系 18-19是指利用理论计算和统计分析工具来研究系列化合物结构 (包括二维分子结构、三维分子结构和电子结构 )与其生物效应 (如药物的活性、毒性、药效学性质、药物代谢动力学参数和生物利用度等 )之间的定量关系,即采用数字模型,借助理化参数或结构参数来描述有机陕西科技大学毕业论文 6 小 分子化合物 (药物、抑制剂等 )与有机大分子化合物 (酶、辅酶或有机大分子 )或组织之间 (受体、细胞、动物等 )的相互作用关系。 1.4.2 定量构效关系研究的发展 1868年, Crum Brown和 Fraser发表了 QSAR方面的第一个方程巾 =f(c), 该方程表明
32、20,化合物的生理活性由可用化学结构 C的函数表示,但并未建立明确的函数模型。最早的可以实施的定量构效关系方法是美国波蒙拿学院的 Hansch在 1962年提出的 Hansch方程。其最初的形式为方程 (1-1), lgl C=algP+b+cEs+constant (1-1) 即活性与疏水参数 lgP、电性参数 和立体参数 Es相关。随后, Hansch和日本访问学者藤田稔夫等人一同改进了 Hansch方程的数学模型,引入了指示变量、抛物线模型和双线性模型等修正,得到方程 (1-2),使得方程的预测能力有所提高 21。 lgl C=a(lgP)2+blgP+c+dEs+constant (1
33、-2) Free等人几 乎与 Hansch方法发表的同时发表了 Free Wilson方法,其直接以分子结构作为变量对生物的生理活性进行回归分析。 Hansch方法、 Free Wilson方法等方法均是将分子作为一个整体考虑其性质 , 并不能反应分子的三维结构与生理活性之间的关系,因而被称为二维定量构效关系 (2D QSAR)。 20世纪 80年代在 QSAR研究中出现了考虑生物活性分子与受体结合的三维结构性质的研究方法,称为三维定量构效关系 (3D-QSAR)。如在 1979年 Crippent22等提出距离几何学的 3D-QSAR、 1980年 Hopfinger23-24等提出分子形状
34、分析方法和 1988年 Cramer25等提出了比较分子场方法 (CoMFA)等。比较分子场方法一经提出便席卷整个药物设计领域,成为了应用最广泛的基于定量构效关系的药物设计方法; 1990年出现了新的三维定量构效关系方法,如在比较分子场方法基础上改进的比较分子相似性方法 (CoMSLA)以及在距离几何学的 3D-QSAR基础上发展的虚拟受体方法等,这些方法都成功得到了一些3D-QSAR模型,为设计高活性生物分子提供了很多有益的提示。 1997年 Hopfinger等提出了 4D-QSAR的概念,此方法首次采用遗传算法选择分子动力学产生的构象来产生最佳的构效关系模型。用每个格点对用的原子占有率来作为偏最小二乘回归的变量,根据原子的不同特征定义了七种不同种类的原子模型。 4D-QSAR方法考虑了药物分子的整个构象空间,考察了多种原子叠合方式,因此在概念上比传统的 CoMFA方法有一定的进步。在 QSAR研究过程中考虑影响生物活性的因素不断增加, QSAR向着更高的维数发展,接着又有了 5D-QSAR、 6D-QSAR概念的提出,它们各有特色 , 但还没被普遍承认,有待进一步的研究和考证 26。