中文摘要
2019年末,突然爆发的新型冠状肺炎(COVID-19),对世界各地的人类的生心健康造成了极大的威胁,该疾病不仅会导致严重的肺部疾病、心脏病、肝病等,还可能引发的严重的后遗症。然而,由于病毒变异速度不稳定、药物上市的临床周期缓慢等因素,目前市场上极度缺乏对COVID-19患者的总体生存期有益的药物,因此开发新的治疗COVID-19的药物迫在眉睫,这些工作具有一定的挑战性但对于全球人类的健康而言却是必要的。众所周知,传统药物的研发需要耗费大量经费和时间成本,并且从头开始设计新药除了上市周期长的掣肘外,往往难以达到预期的临床效果,因此我们需要药物重定位来帮助我们从已开发的药物中筛选出潜在的药物靶点并且对COVID-19具有有效的治疗。
药物重定位作为一种优秀的药物开发工具,其优势在于可以快速筛选出潜在的药物,而且筛选出来的药物大多可以投入其他疾病的治疗,由于已上市的药物在安全性和副作用指标方面已经非常确定,新药开发的速度不仅大幅度提高和新药开发的成本也大大节省。除了药物重定位,近年来飞速发展的深度学习技术也成为了药物预测的一个必不可少且有效的工具。本研究提出了一个基于几何深度学习的消息传递神经网络(MPNN)模型,该模型是由图神经网络、计算方法和机器学习方法等方法的集成的,用于识别基于化合物数据库的潜在COVID-19治疗药物,与传统的药物筛选方法相比,基于几何深度学习的MPNN模型在药物重定位方面具有低成本和高准确性的优点。
本研究使用MPNN模型学习来自化合物数据库的基于SMILE序列的化合物特征。五重交叉验证下,模型的AUC为0.94,预测的准确率为0.909,灵敏度为0.866。最后,使用该模型根据指定阈值从上市药物中筛选得到71种药物,作为潜在的COVID-19治疗药物预测结果。
总之,本研究提出基于几何深度学习的模型,在上市药物中筛选潜在的COVID-19治疗药物,为COVID-19治疗药物重定位提供了新的思路和方法。
关键词:新型冠状病毒肺炎;几何深度学习模型;药物重定位;消息传递神经网络
1、文献综述
1.1 COVID-19药物重定位的研究背景及现状
1.1.1研究背景
2019年末,突然爆发的新型冠状肺炎(COVID-19),对世界各地的人类的生心健康造成了极大的威胁,此症状是由严重急性呼吸系统综合症冠状病毒-2,它不仅会导致严重的肺部疾病、心脏病、肝病等,还可能引发的严重的后遗症,这些现象目前已经在临床观察中被证实。然而,由于病毒变异速度不稳定、药物上市的临床周期缓慢等众多因素,目前市场上极度缺乏可用于治疗COVID-19的药物,因此开发新的治疗COVID-19的药物迫在眉睫。众所周知,传统药物的研发需要耗费大量经费和时间成本,并且从头开始设计新药除了上市周期长的掣肘外,往往难以达到预期的临床效果,因此我们需要药物重定位来帮助我们从已开发的药物中筛选出潜在的药物靶点并且对COVID-19具有有效的治疗。
COVID-19是一种由重大的急性呼吸系统综合症冠状病毒2型(SARS-CoV-2)引发的,它们通过呼吸系统进入肺部,从而导致人类患上这种病。这种病毒拥有一个独一无二的外壳,并以单链核糖核酸结构存在。SARS-CoV-2在人类中的传播率相对较高,在肺炎的发生发展中也更加严重,连带其他脏器损伤的反应也会更剧烈[1],并且有几率会引发严重的新冠后遗症,例如大脑萎缩、感官认知下降和其他一些不能预料的症状。截止2023年4月13日,全球总确诊人数约6.8亿,其中包括684万左右的死亡病例。
由于X食品和药物管理局(FDA)权威机构的严格把控,避免药物滥用等不可控的状况,目前只有少数且特定的药物被授权允许用于治疗新冠肺炎,这一现状也大大表明了开发新的抗新冠肺炎药物的迫切程度和必要程度。然而广而周知的是,传统的药物开发过程既费时又费钱。具体来说,一方面,在临床I期试验中,超过90%的药物不予批准进入临床II期实验中,需要返回去再进行深度研发。这是由于开发的新药的结构特征不可预知和控制,没有已知的药物结构作为对照,这些药物往往会违反药物的安全性原则,引起人体的不良反应[2,3]。另一方面,一种新药的成功上市在需要花费数十亿美元的同时,还要需要长达十几年的时间对药物进行反复的验证[4]。SARS-CoV-2是一种具有不同变异的病毒,除了没有特定的治疗药物外,治疗算法也可能随着时间而改变。在短时间内开发新的疫苗和抗病毒药物可能并不现实,而且可能对不同变异的病毒没有效果。
鉴于目前这些挑战,在研发新药的同时即积极发现新药的结构和功效的同时,对进一步提高已上市的药物治疗疾病的新靶点的有效利用率,也是我们发现潜在药物不可忽视且亟切的一种药物研发愈加重要的具体策略,这就是“老药新用”,一直以来在医药界和研究界都得到了广泛持续关注。“老药新用”即药物重定位(Drug Repositioning,DR),旨在深入分析当前及未来开展药物研发以及其相关的前瞻性、药物动力学、疗效及安全性等方面的信息,以期找到对疾病有更加安全、更具潜力的治疗方案。与新药开发相比,已知药物的结构和临床效用在可控范围内,这因此能够降低小分子化合物的药物开发风险。综上所述,药物重定位具有明显的优势,它不仅能让待研究的药物小分子化合物跳过临床I期,迅速投入于II期和III期临床研究,降低相关开发成本,获得更好的投资回报,还能大大加快开发时间,投入市场使用。
基于几何深度学习(Geometric Deep Learning,GDL)的消息传递神经网络(Message passing network,MPNN)模型[5]是最近非常流行的一种方法,用于预测病毒与药物的相互作用并直观地显示它们之间的关系。由于RNA分子的三维结构及其在药物发现中的关键作用,很难通过计算来预测它们。通过MPNN模型,即使是从少量数据中也能有效地学习,可以预测病毒的蛋白质结构和药物相互作用可视化病毒与药物的关系[6]。MPNN将经典方法推向了mRNA和蛋白质结构预测等问题的背景。MPNN通过在药物相互作用和药物发现中增加其三维分子结构的深度来提高模型的性能。
1.1.2国内外研究现状
一些研究人员借助机器学习的方法进行抗SARS-CoV-2药物重定位的研究。Anh-Tien Ton等人[7],开发的深度学习平台-深度对接(Deep Docking,DD)能够用于快速获取对接程序的对接得分,进而使其可以在短时间内对数十亿个分子开展虚拟筛选,现阶段Deep Docking已被应用于从13亿化合物中发现对SARS-CoV-2主蛋白酶(Mpro)抑制的化合物。Wang等人开发了COVIDVS-3深度学习模型[8],模型的效率和质量很高,不会不支持在筛选含有数据量庞大或者化合物结构极其复杂的数据库的使用。模型的这一特点有利于加快发现治疗COVID-19相关药物的研究进度。基于该模型,从ZINC15数据库中筛选490万个类药物分子,发现一种新的化合物是SARS-CoV-2主蛋白酶(Mpro)的抑制剂。Yang等人开发了一种用于发现治疗COVID-19的药物的目标预测和虚拟筛选的平台—D3AI-CoV,其有三个新开发的深度学习的模型组成,即MultiDTI、MPNNs-CNN和MPNNs-CNN-R模型,对于目标预测,MultiDTI和MPNNs-CNN模型的AUC分别为0.93和0.91。D3AI-CoV用于虚拟筛选,其命中率也比其他方法更好。它可以作为预测活性化合物潜在的目标和快速识别针对COVID-19治疗特定目标蛋白的活性分子的在线工具[9,10]。
1.2研究内容及意义
本研究通过使用一个基于几何深度学习的模型,学习临床验证以及研究潜在的治疗COVID-19药物的SMILES结构特征。使用消息传递神经网络以几何深度学习的方式检索特征,提取的深层特征组合并由分类器进行分类,从而推断潜在的药物-病毒的关联。并在候选药物中寻找类似的药物-病毒的关联,从而预测出新的COVID-19治疗药物,对预测出来的高得分药物进行文文献验证,进而实现药物重定位。
本研究具有低成本和高准确性的优点,可以对药物重定位提供一定的技术支持。本研究也可以应用于其它疾病并为潜在的新的疫情进行方法学准备。总之,本课题提出基于几何深度学习的MPNN模型,在上市药物中筛选潜在的抗SARS-CoV-2药物[1,8],实现药物重定位。
2、材料与方法
该课题的流程主要分为四个步骤:包括药物的收集和预处理、模型的训练、药物预测和结果验证。图2-1显示了所提出的MPNN模型的流程图。
图2-1基于几何深度学习的消息传递神经网络模型流程图
Figure.2-1 Flowchart of Message Passing Neural Network Model Based on Geometric Deep Learning
2.1数据收集和预处理
2.1.1潜在的COVID-19治疗药物结构数据获取
在这项研究中我们从PubChem[11]数据库中收集药物的SMILES结构[12]信息作为模型的训练集数据。PubChem数据库由X国家卫生研究院和国家生物技术信息中心联合搭建的,为广大的科研人员能够系统研究有机小分子的生物活性而开发的药物数据库。这些有机小分子具有多种生物活性,包括但不限于核苷酸、碳水化合物、脂质、肽、多种小分子物质,甚至还包括经过特殊处理的大分子物质,它们在生命中发挥着重要的作用。新冠肺炎的无效药物数据集(阴性样本)从MoleculeNet数据库[13]中收集。MoleculeNet是专门设计用于评估和检验分子特性的机器学习方法的基准。随后,我们将每个药物样本的类别设置为1或0,其中1代表阳性样本,0代表阴性样本。部分阳性样本如表2-1所示,部分阴性样本如表2-2所示。
2.1.2候选预测药物结构数据获取
在这项研究中我们将会从MCE数据库[5]获取预测候选药物数据集。MCE数据库可提供活性化合物库、类药多样性库、虚拟筛选数据库等170余种化合物库,化合物总数约1600万,每种化合物均有详尽的生物活性数据和(或)清晰准确的理化结构信息。MCE共纳入2600+种新型药品,它们在进行大规模的临床试验之后,均显示出卓越的安全性、有效的药理作用以及可持续的药效。MCE的FDA上市库是一种很好的药物再利用工具,可以显著加快药物开发进程。在MCE数据库收集FDA认证的药物的SMILES结构数据作为候选预测药物的数据,部分候选预测药物如表2-3所示。
2.1.3模型的特征表示
国际通用的简化分子线性输入规范(SMILES)[12]所描述的药物独特的化学结构可以采用ASCII字符串所规范地描述药物分子结构来表示。为了更加准确地描述和理解本研究的药物化学结构,我们采用SMILES作为表达形式,从而将复杂的分子线性模型转换成一种更加精确的形式。具体原因如下所述[14]。(一)、SMILES易于表达:SMILES可以用较短的字符串表示复杂的化学结构,使药物化学结构可以用简单的方式轻松表达。(二)、SMILES易于存储和传输:SMILES字符串是文本形式的,可以轻松地存储和传输,不需要任何特殊的二进制格式或文件格式。(三)、SMILES可读性强:相对于其他表示法,如分子图、结构公式等,SMILES字符串易于阅读和理解,因此可使科学家在合作时更容易交流。(四)、SMILES可用于计算机化学:SMILES表示法可以轻松地转换为其他化学表示法,如MOL文件、INCHI等,因此非常适合用于计算机化学领域中的虚拟筛选和分子模拟等应用。(五)、SMILES可用于数据库搜索:SMILES字符串可以用于在化学数据库中搜索特定的化学结构,这对于发现新的化学物质非常有用。总的来说,SMILES表示法是一种易于表达、存储和传输的化学表示法,它在化学研究、计算机化学、药物设计等领域中有着广泛的应用。
为了在MPNN模型中训练数据,我们首先要将在PubChem数据库获取的潜在COVID-19治疗药物的SMILES格式的数据集转换为分子表示,以便于对化学结构特征的提取。然后以原子为节点化学键为边转换为分子表示转换为基于几何深度学习的模型可以理解的图形结构,并为每个原子和化学键分配相应的特征向量,即包含原子序数、自由基电子数等特征在内的特征集合。图结构是一个无向图,SMILES非常适合将化合物表示为图形数据结构。在此表示中,我们将化合物中的原子表示为图的节点,原子间键表示为图的边。化合物中的不同类型的键均已被具体覆盖。图2-2显示了根据草酰乙酸盐离子的SMILES序列,经过分子表示和图形表示两次特征转换,提取化合物特征的过程。
2.2模型的训练
使用从PubMed数据库获取的潜在COVID-19治疗药物的SMILES结构对模型进行训练模型,用于确定新的新冠肺炎病毒和药物的关系。后期将在MCE数据库获取的上市药物SMILES结构投入到训练好的模型中得出药物相似度定量估计,用来判断其成为治疗COVID-19药物的概率。
消息传递神经网络(MPNN)是一种神经网络模型,用于处理预测有机分子量子性质的图形。消息传递神经网络将图数据结构中的信息转化为一个向量,这个向量称为图嵌入。根据图上其他节点的消息更新嵌入向量。在消息传递神经网络中,节点特征向量被转移到不同的空间。我们将药物的SMILES格式转换为分子表示,在几何深度学习模型中使用的性质是分子的原子序数、价电子数、氢原子数、杂化态、原子度、形式电荷、自由基电子数、是否含有苯环、手性标签、化学键类型和共轭态。通过采用消息传递神经网络框架,我们可以将信息的流动过程分为消息传送(Message Passing Phase)和消息读取(Readout Phase),从而有效减少数据的错误,并且增强数据的准确度。该框架包含了3个公式[15],可以帮助我们更好地理解信息的传输过程。
在本研究中,在消息传递阶段,假如将一张图用G=(V,E)来表示,其中V和E两者为一个集合,V包含了图G中所有的节点,E包含了图G中所有的边。那么对于一个特定的节点v而言,可以有如下表达:
在公式(3)中:是最终的输出向量;作为读取函数,该函数能从整张图节点的最后一层隐藏状态中读出图嵌入向量,这个函数有两个要求:1、可以求导;2、必须具备置换不变的特征。T为消息传递阶段中的最后一个时间步长。本文中的读取函数为一个全连接层,其参数的设定由模型的训练得出。
在最后一步中,提取所有新更新的潜在状态,并生成描述整个图的最终特征向量。它用于消息传递阶段使用的消息传递神经网络结构中的GRU(门控递归单元)。GRU简单的基于嵌入向量的先前值来更新嵌入向量。GRU在图中找到最佳路径。更新后的消息传递函数如等式(4)所示[16]。
简而言之,消息传递神经网络的作用是聚合所有原子信息,并结合为分子水平的表示。MPNN阶段将相关数据放在不同的空间中彼此接近。
为了对药物进行更精准的预测,除了消息传递神经网络框架所划分的两部分,即消息传递和读出外,还需要对信息的进一步处理构建一个三层的分类网络。通过使用全连接层,我们可以从传统的处理方法(卷积、池化等)中提取出有价值的信息,并且可以对这些信息进行映像。为了大大增强网络的稳健性和可靠性,我们使用多种迭代,将上一次迭代所挑选的相似的特征集合再组合,在下一次的迭代中可以有效地降低上一次特征集合位置特征对此次分类结果的影响。虽然卷积层的作用是提取特征,但在实际应用中,同一类别的特征在多种不同的待测样本中可能重复出现,这会使使用局部特征来确定具体类别这一举措变得低效。三个全连接层在这个模型中执行的是组合特征和分类器的功能,这就大幅度降低上述风险,它们能使多种特征结合起来,综合全面地确定特征的分类[17]。
在三层分类网络阶段,在通过消息传递步骤获得节点嵌入向量之后,通过分子上的节点上的平均池化来获得图嵌入。卷积层中插入池化层不仅可以使操作后所提取的信息结果相比输入对象变得降维和抽象,计算量大幅度减少,而且池化层不会改变原图像特征,还可以在输入图像上增加旋转、偏移等方面的鲁棒性[18]。然后,将获得的该图嵌入值通过全连接层,并实现预测。此外,图嵌入向量具有交换不变性。
如图2-3所示,本文前两层全连接层采用Dropout机制[19],用来增强模型的稳定性和鲁棒性。在完全连接层阶段,为了避免由模型过度拟合导致的结果偏差,我们将在三个全连接层的前两层中的Dropout值设置为0.5,在进行本轮迭代训练和优化前,随机丢弃50%节点并因此产生的网络结构更加丰富。我们使用交叉验证来保证模型多次的训练,验证结果也证实了当隐含节点Dropout率等于50%时,该模型具有最佳性能。第一、二个全连接层使用ReLU[20]作为激活函数,以高效的解决梯度爆炸或消失的问题,从而大大提高了结果的准确性和可靠性,加快收敛速度。第三个全连接层使用Sigmoid函数预测二分类的输出类别。在完全连接的网络部分中,第一个层包含72个神经元,第二个层包含36个神经元,最后一个层包含1个神经元作为输出。图2-3显示了在完全连接的网络部分中使用的架构。基于所提出的基于几何深度学习的MPNN模型的算法过程如表2-4所示。
2.3验证和性能指标
本研究首先采用五倍交叉验证法来评估模型性能。通过对五组数据进行随机抽样,从而确定一组用于进行验证,另外四组用于进行训练,以确保在进行多轮迭代时,这两组数据之间能够完全隔离,而且彼此之间也没有任何关联。经过五次迭代,我们可以获得训练集的拟合效果,并且可以通过对验证集的评估,来确定模型的性能指标的平均值和标准差,并将其作为模型的性能指标结果。这样,所有数据都参与了模型的构建和验证,最终得到最优的模型。此外,为了进一步评估模型各项性能,本研究还选择使用单独的测试集对模型进行测试,以得到更加具有说服力的结果。当数据集包含相同的阳性和阴性样本时,我们还将采用90%的样本用于训练,将剩下的10%用于验证。在对所提出的基于几何深度学习的MPNN模型的验证阶段,为了估算该模型的有效性,我们使用了以下几种常见的评价指标来评估模型性能。从公式(5)到(11),这些参量分别代表了精度、灵活性、特异性、F1评分、阳性预测率、NPV以及Matthews相关性的指标,它们的具体英文表达形式分别是:ACC、SEN、TP、FL、PPV、TN、MCC。在公式中,TP指的是那些经过精准鉴定的真实的阳性,TN则指的是真实分类的阴性样本,而FP则指的是那些经过精心鉴定的错误分类的阳性样本,FN代表错误分类的阴性样本。
通过将伪阴性率(FPR)与真阳性率(TPR)的变化关系用图形的形式表示出来,我们可以构建出一条ROC曲线,使用曲线下面积即AUC值来评估模型的有效性。使用ROC曲线来评估模型的核心概念是将模型预测的准确率、可靠性、可预测的复杂性等因素考虑进去,通过测定每个参数的阈值,来反映出模型预测的准确率、可靠率、可预测的复杂性等,从而构建一条TPR-FPR曲线,从而更好地反映出模型预测的准确率、可靠率等指标的动态变化。当ROC曲线显示出模型具有较高的预测精度时,AUC值就会随之增加,越接近于1,表明模型的预测能力较强。
2.4候选药物预测及分析
2.4.1候选药物预测
使用已知的潜在COVID-19治疗药物数据对模型进行训练,训练完毕后,我们在MCE数据库获取2703种FDA批准的上市药物,作为候选预测药物数据。选用上市药物作为候选预测要的原因如下。(一)、已知药物的安全性和耐受性:已经上市的药物通常已经经历了严格的药物审批过程,对其安全性和耐受性有了充分的评估。相对于新药物,药物重定位所需的安全性和毒性研究方面成本更低。(二)、降低研发成本和时间:药物重定位相对于新药研发需要更少的时间和成本。药物重定位只需要重新评估已有药物的临床有效性和安全性,而不需要重新设计和合成药物。(三)、潜在的市场和商业机会:已经上市的药物已经证明了其在市场上的接受度和商业潜力,因此,药物重定位可能会更快地获取市场份额和商业成功。(四)、降低开发风险:由于已知药物的安全性和耐受性,药物重定位的开发风险更低。此外,因为已知药物的作用机制和药效,药物重定位也可能比新药研发更容易获得临床成功。
将候选预测药物的SMILES投入到训练好的模型之中。在这个阶段,使用药物相似度定量估计(QED)[21]评估药物间的相似性,从而预测候选药物的抗病毒潜力。QED是一种衡量药物分子与药物性质相似度的方法,它基于化学描述符和机器学习技术来评估化合物是否具有药物潜力。QED技术可以帮助机器学习算法从多种化学特征(如分子量、脂溶性、氢键供体和受体)中提取出重要信息,并以0到1的精确度来评估这些特征对于药物开发的影响。分数越高,表示化合物越有可能具有良好的药物性质。QED是用于比较两个或多个化合物之间药物性质相似度的指标。通过计算不同化合物的QED分数,可以评估它们是否具有相似的药物性质[21],例如溶解度、生物利用度、脱靶作用和毒性等。药物相似度QED可用于药物重定位、化合物筛选和药物设计等领域,以帮助研究人员预测药物性质和研发新型药物。
通过采用Sigmoid激活函数,我们可以计算出每个样本的正负值,从而获得更加准确的药物重定位结果。为此,我们将所有样本划分为阳性概率超过0.97的,以便更好地评估模型的准确性。
2.4.2预测结果分析
由于候选预测药物中都是上市的药物,我们很容易就能获取其具体的分类信息以及药理作用,对于高得分的候选预测药物,我们主要从其药理信息、文献支持、药物靶点等方面研究其是否具有潜在的COVID-19治疗作用,进而对模型的准确性给出进一步支持。
2.5药物-靶点网络构建
我们整合预测得到的高得分药物、靶点及其它们之间的关联信息来构建药物和靶点为节点,药物和靶点之间的关系为边的药物-靶点网络。在DrugBank数据库[22]获取高得分的候选药物靶点,并将靶点物种范围限制人类和病毒中,以精准确定预测药物对COVID-9可能的治疗机制。使用Cytoscape-3.9.1[23]绘制网络,可以深入探究药物与靶点之间的相互关系,从而更好地了解这些药物及其作用机制。
3、结果
3.1模型的训练结果及超参数
本研究使用了消息传递神经网络(MPNN)作为基于几何深度学习的模型对样本进行训练和分类,将药物的SMILES结构投入到模型进行训练,并确定模型的超参数。分别使用了阳性样本和阴性样本比例为1:1、1:1.5、1:2的数据集进行训练,并使用验证集对分类结果进行分类。
模型中的epoch参数我们设置的标准大小为20,并使用Adam优化器优化算法。其中的学习率我们设置为0.001,batch size参数设置为32。Adam[24]同时拥有AdaGrad和RMSProp两种算法的强大功能,能够有效地提升梯度下降的性能,具有如下显著的优点[24]:(一),它能够根据一阶矩估计和二阶矩估计,不断调整不同的参数,提升自身的学习能力,达到较高的自适应性。Adam算法的出色表现体现在它的高维特性上,它可以迅速地找出并达成最佳结果。(二)、有效处理稀疏梯度:在大规模机器学习问题中,许多参数都是稀疏的,即只有很少一部分参数是非零的。Adam算法通过采用指数加权平均值的方式,可以有效地抑制稀疏梯度,从而大大提升梯度下降的效率。(三)、不受初始超参数影响:Adam算法对于初始超参数的选择相对不敏感,对于不同的超参数设置能够在大多数情况下产生较好的结果。这样就避免了需要手动调整超参数的情况,减少了调参的时间和精力。(四)、可以处理非平稳目标:Adam算法能够有效地处理复杂的非平稳目标,它采用指数加权平均值来计算梯度,从而更好地模拟复杂的非平稳目标,并且能够更准确地预测和识别出潜在的问题。这使得Adam算法能够更准确地估计参数的更新方向,同时避免了出现梯度爆炸或梯度消失的情况。
经过深入研究,我们发现,当正负样本比例为1:1时模型的效果最好,故选用该数据集对MPNN模型进行训练。正负样本为1:1、1:1.5、1:2是的模型精度及损失函数随模型训练的变化情况分别于图3-1、图3-2、图3-3展示。
图3-1模型训练集及测试集的损失值及精确度变化图像(阳性样本:阴性样本=1:1)
Fig.3-1 Image of loss values and accuracy changes in model training and testing sets(positive sample:negative sample=1:1)
图3-2模型训练集及测试集的损失值及精确度变化图像(阳性样本:阴性样本=1:1.5)
Fig.3-2 Image of loss values and accuracy changes in model training and testing sets(positive sample:negative sample=1:1.5)
图3-3模型训练集及测试集的损失值及精确度变化图像(阳性样本:阴性样本=1:2)
Fig.3-3 Image of loss values and accuracy changes in model training and testing sets(positive sample:negative sample=1:2)
3.2模型的效能
3.2.1模型的性能评价指标
在本研究中,对训练数据集进行了5倍交叉验证(CV),用来验证我们提出的基于几何深度学习的模型在预测新冠肺炎药物-病毒相互作用方面的有效性。我们将训练集集随机地划分为大小一致的五组,每次验证选取其中一组子集用于验证模型,其余四组来训练模型,如此重复将每一组子集都纳入验证集,将每次迭代结果的均值作为模型验证的最终结果。作为5次交叉验证的平均值,基于几何深度学习的MPNN模型其AUC性能为0.94(图3-4)。曲线下面积(AUC)是根据所提出的基于几何深度学习的MPNN模型中的ROC曲线计算的,以描述研究的质量,这为预测冠状病毒的药物-病毒相互作用提供了更准确的视觉解释。经过统计参数评估,CNN的准确性、敏感性、特异性、F1评分、阳性预测率、性预测率以及Matthews相关系数均达到了预期的水平,具体结果可参见表3-1。
此外,在五倍交叉验证中每次迭代时,我们将训练集样本随机划分为5个等同的子集,分别作为5倍CV的训练集和验证集使用,并从数据集中随机选择10%的样本来生成包含的相同数量正负样本的独立测试集。这使每次迭代时训练集和验证集相互独立互不影响,使模型在效能评估方面具有真实性。最后,训练集来对已验证的模型进行深度训练,再使用测试集的样本对模型进行预测,此过程中使用的测试集和训练集一直保持相互独立的状态。作为5次交叉验证的平均值,基于几何深度学习的MPNN模型其AUC性能为0.93(图3-5)。经过交叉验证后每次迭代测试集所验证的模型结果分析如表3-2所示。
图3-6显示了部分独立测试集药物QED预测得分。第一行第一个药物标记为阳性,该模型给出的打分为0.98,即0.98的概率可以用于治疗COVID-19。第二行第一个药物标记为阴,模型给出的打分为0.12,即0.12的概率可以用于治疗COVID-19。综上可以证明该模型性能较好,对于药物的打分具有一定的准确性。
3.2.2 MPNN模型与其它模型的比较
药物-病毒相互作用的预测是一个新的非常重要的问题,一些基于深度图网络和计算的方法已经被开发出来用于这一重要任务。因此,我们将我们所运用的MPNN模型与其他文献中现有模型进行了比较。基于深度图网络模型方法介绍如下:
HGATMDA[25]:是一个基于异构图注意力网络的模型,用于识别药物-病毒关联。
HMDAKATZ[26]:是一个基于KATZ测量的模型,用于识别药物与病毒的关联。
GCNMDA[27]:是一种新的基于图卷积网络的药物-微生物关联预测模型。
WMGHMDA[28]:是一个基于元图的模型,用于识别药物与靶标的相互作用。
WNN-GIP[29]:是一个基于加权最近邻高斯的模型,用于预测药物与病毒的关联。
NTSHMDA[30]:是一个基于随机行走的模型,通过整合网络拓扑相似性来预测药物与微生物的关联。
GCMDAR[31]:是一个基于图卷积网络的模型,用于预测药物与病毒的关联。
IMCMDA[32]:是一种基于诱导矩阵完成的模型,用于预测疾病mRNA的相关性。
SANE[33]:是一个关注序列的网络嵌入模型,用于预测病毒与药物的相互作用。
LASS0-DNN[34]:是一种预测药物与病毒相互作用的最小绝对收缩和选择算子和深度神经网络模型。
表3-3显示了我们使用的MPNN模型在AUC方面优于其它10种模型。特别是,我们提出的MPNN模型的AUC性能为94.00%,比原先排名第一的和第二的方法SANE和LASSO-DNN分别高4.39%和5.00%。HGATMDA模型的性能排名第三,为88.95%。从表中可以看出,与其他模型相比,IMCMDA模型的性能最低,为62.35%。
我们使用的MPNN模型优于其他图形和计算基本方法的原因是,我们在多维上连续表达编码的分子信息,并用数千个分子信息训练神经网络。以连续形式表示分子在数学上为确定药物-病毒相互作用提供了便利。此外,几何深度学习模型具有高性能的原因是,它根据化学性质(分子的原子序数、价电子数、氢原子数、杂化态、原子度、形式电荷、自由基电子数、是否含有苯环、手性标签、化学键类型和共轭态)对要形成的键结构进行建模。简而言之,它很好地反映了药物和病毒分子的生物活性是可以测量的。最后,我们的模型使我们能够更准确地捕捉神经网络中节点和边缘之间的语义信息,从而有助于提高我们模型的预测能力。
3.3潜在的COVID-19治疗药物预测及分析
3.3.1预测药物的文献验证
将MCE的上市药物的SMILES投入到训练好的模型中,即可获取药物的QED得分,部分药物的QED如图3-7所示。将所有药物的QED得分进行统计,并将QED得分大于0.97的药物作为药物重定位的结果,最后获取了71种药物。对获取的71种高打分药物进行文献验证,我们将比较典型的药物和能查询到文献信息的药物进行记录进行展示(表3-4)。对于71种高打分药物,大量药物有文献证据支持其具有治疗COVID-19的作用,故证明本论文使用的模型具有一定的准确性。
图3-7部分上市药物的药物重定位得分
Fig.3-7 Drug repositioning scores for some marketed drugs
Vinpocetine是vinca生物碱的合成衍生物,用于治疗脑血管疾病的神经症状,可抑制1型磷酸二酯酶,增加环状单磷酸鸟苷和单磷酸环腺苷[35]。Vinpocetine具有强大的抗炎和抗氧化能力,能够有效阻止炎症反应的发生。此外,Vinpocetine通过抑制丝裂原激活蛋白激酶(MAPK)信号通路来缓解氧化应激(OS)和炎症反应。NF-κB通路对新冠肺炎中高炎症引起的急性肺损伤具有重要影响,因此Vinpocetine在调节NF-κB通路的同时也可以对治疗COVID-9也有一定的作用。总而言之,Vinpocetine通过抑制NF-κB/MAPK信号通路具有值得注意的抗炎和抗氧化作用,对新冠肺炎具有肺部和肺外保护作用,减少SARS-CoV-2诱导的超炎和氧化应激[36]。
注:第一列至第四列分别为药物在MCE数据库的目录号、药物名称、药物适应症、支持性的PubMed ID。
Gemigliptin被证明能够有效地降低2型糖尿病患者的血糖水平[37],这种药物的功能机制应该归结为二肽基肽酶-4(DPP-4)的活力。有文献证明Gemigliptin作为SARS-CoV-2病毒性半胱氨酸蛋白酶(3CLpro)潜在抑制剂。此外,文献中的计算模型显示,Gemigliptin有可能抑制β冠状病毒家族中的其它病毒性半胱氨酸蛋白酶,包括SAR-CoV Mpro和MERS-CoV CLpro,这表明Gemigliptin有可能被重新用作广谱抗病毒药物[38]。
Argatroban是一种合成的直接凝血酶抑制剂,新冠肺炎大流行的发病机制,凝血酶抑制剂可能会发挥多种潜在的治疗作用,包括抗血栓、抗炎和抗病毒活性[37]。Argatroban是一种合成、小分子、直接、竞争和选择性凝血酶抑制剂,并具有公认的药代动力学特征。除了抗血栓性疾病外,它同时具有抗炎和抗病毒活性,还可以用于治疗被批准用于治疗肝素诱导的血小板减少症[39]。
值得注意的是,Boceprevir、simeprevir、Narlaprevir、Asunaprevir、Grazoprevir、Ledipasvir和Voxilaprevir均用于治疗丙型肝炎病毒(HCV),故为我们提供了一条用于治疗新冠肺炎的药物重定位方向,即用于治疗丙型肝炎的药物可能是潜在的治疗新冠肺炎的药物[40]。
3.3.2预测药物的靶点分析
统计预测得到的71种高打分药物靶向病毒或人类的靶点,共计64个。对这些靶点的功能进行分析,得到了其中一些靶点与COVID-19预防和治疗具有关联性的证据,并将其靶点的相关信息及其支持的文献证据整理在表3-5中。
人类二肽基肽酶-4(DPP-4)是一种膜结合的氨基肽酶,通过灭活蛋白来调节胰岛素释放。因此,DPP-4抑制剂被用作口服抗糖尿病药物,以恢复正常的胰岛素水平。除了降低人体内血糖的作用外,DPP-4抑制剂还可以保护心脏、调节抗炎和免疫活性、抗纤维化作用、抗血栓作用和血管内皮保护作用。有研究证明SARS-CoV-2刺突糖蛋白和DPP-4相互作用的研究预测了SARS-CoV-2的可能进入路线。因此,DPP-4抑制剂可以有效地减少病毒引发的“细胞因子风暴”,从而停止对重要器官的炎症损伤。此外,DPP-4抑制剂可能会干扰病毒进入宿主细胞[41]。
NS3-4A丝氨酸蛋白酶作为一种非共价异二聚体,是丙肝型病毒(HCV)蛋白酶之一,是丙肝型病毒蛋白酶之一参与使其在HCV多蛋白的四个位点切割分解[42]。HCV NS3/4A(催化亚基和激活辅因子)蛋白酶与SARS-CoV-2 Mpro具有相似的三维结构,特别是在关键活性位点残留物的排列方面。Khushboo Bafna等人[43],确定了八种与Mpro活性位点结合的HCV丝氨酸蛋白酶抑制剂,这表明这些HCV丝氨酸蛋白酶抑制剂可以有效地与SARS-CoV-2 Mpro活性位点结合,表明HCV丝氨酸蛋白酶抑制剂可以作为SARS-CoV2 Mpro的抑制剂。
丙型肝炎病毒(HCV)非结构性5A蛋白(NS5A)对病毒RNA复制至关重要,并可能在颠覆宿主细胞内信号通路方面发挥作用[44]。有报告显示,HCV NS5A抑制剂对SARS-CoV-2外切酶校对器起作用[45]。
缓激肽受体B2(BDKRB2),缓激肽介导的信号机制激活过多的促炎细胞因子,包括白细胞介素-1β(IL-1β)、白细胞介素-2(IL-2)、白细胞介素-6(IL-6)和白细胞介素-8(IL-8)。这些细胞因子的上调对各种临床疾病都有影响,如导致纤维化的炎症、心血管疾病,以及COVID-19。在SARS-CoV-2感染中,缓激肽水平升高,据报道会引发各种症状。所有这些都使缓激肽成为具有巨大治疗价值的分子的核心点[46]。
注:第一列至第四列分别为靶点名称、靶点物种类型、靶点对于COVID-19潜在的作用、支持性的PubMed ID。
促性腺激素释放激素受体(GnRHR)在大脑、内分泌器官和嗅觉神经元中高度表达。有研究表明,SARS-CoV-2尖峰蛋白与GnRHR具有很强的结合相互作用,其可作为发现新冠肺炎的新药物靶点[47]。
脂肪酸合成酶(FASN),Junjun Chu等人[48]确定了抑制或促进SARS-CoV-2病毒感染的基因,包括两个关键候选基因:ACACA和FASN。他们确定脂肪酸合成酶抑制剂是预防和治疗新冠肺炎的候选药物。
多巴胺受体2(DRD2)对于大脑中多种大脑功能的信号传递至关重要。SARS-CoV-2分别使用血管紧张素转换酶2(ACE2)和神经多林-1(NRP-1)作为主要受体和进入辅因子进入细胞。细胞进入是病毒生命周期启动的第一步也是重要的一步,是抗病毒干预的理想目标。基于细胞和生化分析显示,DRD2拮抗剂抑制了融合活性和SARS2-S与NRP-1的结合,但不能抑制其与ACE2的结合[49]。
β3整合素(ITGB3),也被称为CD61或GP3A。在整合素家族中,它具有非常普遍的应用,不仅可以起到黏着细胞的作用,还可以调节癌症的发展,改变癌症的发展路径,建立癌症的发展模式,以及改善癌症的发展趋势,从而有效地抑制癌症的发生发展[50]。ITGA2B和ITGB3已被进一步确定为新冠肺炎相关中风的关键基因[51]。
3.4药物-靶点网络分析
通过系统的整理最终获取的71种药物及其靶点间的关联信息,我们使用网络可视化软件(Cytoscape)将药物-靶点网络可视化并且对其进行分析,通过计算节点的连通度(Degree)来表示药物与靶点之间的关系。最终71种药物及其靶点构成的网络如图3-8所示。值得一提的是,虽然有少部分药物没有检索出来自病毒或人体的靶点信息,但是这些使用本研究提出的模型预测得到的与COVID-19临床实验药物具有相似特征的药物仍是具有治疗潜力的,不排除通过目前未知靶点发挥作用的可能,故列入本研究的结果范围中。
图3-8使用Cytoscape预测的药物-靶点网络。网络中药物节点显示为外圈的绿色菱形,靶点节点显示为内圈的蓝色圆形,节点大小与连通度成正比。药物节点名称为MCE提供的目录号,靶点节点标签为靶点的名称。
Fig.3-8 Predicted drug-target network.In the network,the green diamond nodes are drugs,while the blue circular nodes are targets.Connectivity is proportional to the size of the node.The drug node name is the MCE catalog number,and the target node label is the
target’s name.
通过计算节点的连通度,发现5种多靶点药物,分别是:HY-B0731A、HY-P0035、HY-B0032、HY-B1700A、HY-P0017(图3-9)。HY-B0731A(哌罗匹隆,PerosPirone)被认定为一种有效的抑制精神病的非传统方法[52],它能够有效地抑制血清素5-HT2的活性,以及多巴胺D2的活性[53];HY-p0035(Insulin human),又被认定为一种有效的短期糖尿病抑制剂,能够有效地降低1型和2型糖尿病患者的尿糖水平[54],以及改善糖尿病患者的糖尿病控制情况[55];HY-B1700A(氯米洼库,Mivacurium)被证明能够作为一种短期的、无需外界刺激的、能够迅速、可控的抗精神病药物。它被血浆中的胆碱酯酶水解,其化学结构有利于组胺的释放,导致皮肤或心血管症状,特别是在剂量增加或快速注射药物时[56];HY-P0017(丙氨酸,Aprotinin)是一种丝氨酸蛋白酶抑制剂,用于降低冠状动脉搭桥手术中高风险患者围手术期失血的风险和输血需求[54]。上述这些药物与传统药物不同,具有多种不同的靶点,而且这些靶点的信息公开,它们在药物重定位时的疗效和安全性都会更高,与目前只了解的单一靶点药物治疗时相比,可以减少患者的副作用和降低耐药性。
通过计算连通度,我们发现2个高连通度靶点,分别是NS3/4A和GNRHR(图3-10),该两个靶点已经作为潜在的COVID-19治疗靶点内容中提及。
图3-9预测得到的药物-靶点网络中的高连通度药物及其靶点。药物节点为网络右侧绿色菱形,靶点节点为网络左侧蓝色圆形,度越大所连接的节点大小越大。
Fig.3-9 High connectivity drugs and their targets in the predicted drug-target network.The green diamond shaped nodes in the network are drugs and the blue circular nodes are targets.The size of a node is directly proportional to its connectivity.
图3-10预测得到的药物-靶点网络中的高连通度靶点及靶向它的药物。药物节点为网络左侧绿色菱形,靶点节点为网络右侧蓝色圆形,度越大所连接的节点大小越大。
Fig.3-10 High connectivity targets and drugs targeting them in the predicted drug target network.The green diamond shaped nodes in the network are drugs and the blue circular nodes are targets.The size of a node is directly proportional to its connectivity.
4、讨论
COVID-19会导致严重的肺炎和其它脏器损伤,引发新冠后遗症。目前,可用于治疗COVID-19的药物还很较少,开发新的治疗COVID-19的药物仍是具有一定挑战且必要的工作。
本研究利用MPNN模型,通过对PubChem数据库中潜在的COVID-19治疗药物的SMILES特征的学习和训练,有效地识别出可能的治疗方案,以便更快地预测上市药物的可能性。通过应用基于几何深度学习的MPNN模型,我们发现它在识别潜在的COVID-19治疗药物方面表现优异(AUC=0.94),并且从MCE数据库中的2703种上市药物筛选出71种被用于药物重定位的结果。
通过本次研究,我们发现了一种卓越的几何深度学习方法,能够迅速发现潜在的COVID-19治疗药物,并且期望通过这种筛选方式,能够为COVID-19的药物重定位提供一种全新的视角。
我们使用的基于几何深度学习的模型优于其他其他传统的药物筛选方法的原因是,我们在多维上连续表达编码的分子信息,并用数千个分子信息训练神经网络。以连续形式表示分子在数学上为确定药物-病毒相互作用提供了便利。此外,MPNN模型具有高性能的原因是,它根据化学性质(分子的原子序数、价电子数、氢原子数、杂化态、原子度、形式电荷、自由基电子数、是否含有苯环、手性标签、化学键类型和共轭态),对要形成的键结构进行建模。简而言之,它很好地反映了药物和病毒分子的生物活性是可以测量的。最后,我们的模型使我们能够更准确地捕捉神经网络中节点和边缘之间的语义信息,从而有助于提高我们模型的预测能力。
虽然由于随机选择的阴性样本的使用、有限数量的阳性样本和有限数量的实验验证的病毒-药物关联使得提出的MPNN模型存在一些局限性。但是随着后续实验数据的增加,更精确的阳性样本的积累,这些问题都会在一定程度上得到解决。本文所使用的模型在识别抗新冠肺炎药物-病毒相互作用方面存在以下新颖性:(1)与其他文献中的方法不同,本文是图神经网络、计算方法和机器学习方法等方法的优秀集成。(2)与现有工作相比,本文使用消息传递神经网络和具有全连接网络的模型结构测量药物分子与新冠肺炎病毒的相互作用的优势。
5、结论
在本研究中,我们提出了一个有效的基于几何深度学习的MPNN模型,用于快速识别对抗新冠肺炎感染的候选药物。我们的模型将SMILES格式的抗病毒药物集成到消息传递神经网络和全连接网络中,以推断出可用于实验治疗新冠肺炎的药物。在五重交叉验证下,MPNN模型的AUC为0.94,预测的准确率为0.909,灵敏度为0.866。实验结果表明,MPNN模型在药物-病毒相互作用预测方面具有较强的能力且在识别药物方面表现出了良好的性能,可以为化学家和药品制造商在实验分析中识别出高度可靠的候选药物并且为COVID-19治疗药物重定位提供了新的思路和方法。最终我们使用的MPNN模型在2703种上市药物中,筛选出71种高打分药物作为筛选结果。通过文献检索对筛选得到的结果从药物功能和靶点功能角度进行解释。经过文献验证,该模型的筛选的药物具优秀的有治疗COVID-19的潜力。
虽然由于目前的研究数据量的不足会给我们的研究带来一定的局限性,但我们相信该模型人能对COVID-19治疗药物重定位提供一些指导意义。随着COVID-19研究的深入发展,模型性能将得到极大的改善,完善模型对于药物治疗COVID-19效果的预测,并在不久的将来可以实现快速且高效地投入到对任何新兴病毒感染疾病的药物筛选工作中。
6、致谢
行文至此,落笔为终。相聚于秋,离别为夏。我的大学生涯和学生时代即将结束。当我们看到这个世界时,我们会想起过去,即使我们内心深处充满了不舍,我们也会感到感激。
饮水思源,学成念吾师。首先感谢我的论文指导教师,从选题,开题到毕业论文的写作过程中给予了我莫大的帮助,老师和师姐在忙碌的工作中来审查和修改我的论文。每当我出现困难或是有困惑的时候,老师和师姐都会给我答疑解惑并提出一些新的方向,让我受益匪浅。我对我的授课老师深表感激,正是他们的指导和帮助,使我能够获得如此丰富的专业知识。一朝沐杏雨,一生念师恩。
家庭教育能够让人成长,而这种教育需要长期付出。我非常感激妈妈、外婆二十多年来一直关注、帮助、指导我成长。这些人让我有机会体验到许多令人惊叹的事物,并且成长为一个有能力应付挑战、勇于接受新事物的人。春风化雨,皆是感恩。祝愿我的家人身体健康,幸福美满。
虽然时光流逝,但“山水一程,三生有幸”仍然给我带来了温暖。我要感谢我的室友们给予我的支持和关怀。非常感激那些温暖如阳光般温柔地守护着我的室友,他们给予了我最宝贵的回忆,不论它有多么漫长,它却给予了我最深刻的体悟,使我学会了如何去面对生活,学会去接纳。在这个酷热的季节,我们所有的人都应该开始我们的新的旅程。我们希望所有人在未来的路上能够平安无事,不负韶华。
此上,感激之意,穷千词而不能绘其一。恭敬在心,不在虚文。
论文停留在书写,但人生还要继续书写。
7、参考文献
1.Das B,Kutsal M,Das R.A Geometric Deep Learning Model for Display and Prediction of Potential Drug-Virus Interactions against Sars-Cov-2.Chemometr Intell Lab Syst.2022;229:104640.
2.Krantz A.Protein-Site Targeting.Diversification of the Drug Discovery Process.Nature Biotechnology.1998;16(13):1294.
3.邰杨芳,王帅,张芬利,于琦,贺培凤.国内药物重定位研究的主题及发展脉络分析.中国新药杂志.2020(022):029.
4.Luo H,Li M,Yang M,Wu FX,Wang J.Biomedical Data and Computational Models for Drug Repositioning:A Comprehensive Review.Briefings in Bioinformatics.2020.
5.Ma C,Wang Y,Choza J,Wang J.Drug Repurposing Screening Identified Tropifexor as a Sars-Cov-2 Papain-Like Protease Inhibitor.2021.
6.Townshend R,Melo L,Liu D,Dror RO.Geometric Deep Learning on Biomolecular Structure.Biophysical Journal.2021;120(3):290a.
7.Ton AT,Gentile F,Hsing M,Ban F,Cherkasov A.Rapid Identification of Potential Inhibitors of Sars-Cov-2 Main Protease by Deep Docking of 1.3 Billion Compounds.Mol Inform.2020;39(8):e2000028.
8.Wang S,Sun Q,Xu Y,Pei J,Lai L.A Transferable Deep Learning Approach to Fast Screen Potential Antiviral Drugs against Sars-Cov-2.Brief Bioinform.2021;22(6).
9.Yang Y,Zhou D,Zhang X,Shi Y,Han J,Zhou L,Wu L,Ma M,Li J,Peng S,Xu Z,Zhu W.D3ai-Cov:A Deep Learning Platform for Predicting Drug Targets and for Virtual Screening against Covid-19.Brief Bioinform.2022;23(3).
10.Richardson P,Griffin I,Tucker C,Smith D,Oechsle O,Phelan A,Rawling M,Savory E,Stebbing J.Baricitinib as Potential Treatment for 2019-Ncov Acute Respiratory Disease.The Lancet.2020;395(10223):e30-e31.
11.Sunghwan K,Chen J,Cheng T,Asta G,He J,He S,Li Q,Shoemaker BA,Thiessen PA,Yu B.Pubchem in 2021:New Data Content and Improved Web Interfaces.Nucleic Acids Research.2020.
12.David,Weininger.Smiles,a Chemical Language and Information System.1.Introduction to Methodology and Encoding Rules.Journal of Chemical Information&Modeling.1988.
13.Wu Z,Ramsundar B,Feinberg EN,Gomes J,Geniesse C,Pappu AS,Leswing K,Pande V.Moleculenet:A Benchmark for Molecular Machine Learning.arXiv e-prints.2017.
14.Kwon S,Yoon S.Deepcci:End-to-End Deep Learning for Chemical-Chemical Interaction Prediction.ACM.2017.
15.Gilmer J,Schoenholz SS,Riley PF,Vinyals O,Dahl GE.Neural Message Passing for Quantum Chemistry.2017.
16.Cho K,Merrienboer BV,Bahdanau D,Bengio Y.On the Properties of Neural Machine Translation:Encoder-Decoder Approaches.In:Association for Computational Linguistics,2014.
17.Shermin T,Murshed M,Lu G,Teng SW.An Efficient Transfer Learning Technique by Using Final Fully-Connected Layer Output Features of Deep Networks.2018.
18.Revisiting the Statistics Pooling Layer in Deep Speaker Embedding Learning.2021 12th International Symposium on Chinese Spoken Language Processing(ISCSLP),2021.
19.Krizhevsky A,Sutskever I,Hinton G.Imagenet Classification with Deep Convolutional Neural Networks.Advances in neural information processing systems.2012;25(2).
20.Rectified Linear Units Improve Restricted Boltzmann Machines Vinod Nair.International Conference on International Conference on Machine Learning,2010.
21.Bickerton GR,Paolini GV,Besnard J.Quantifying the Chemical Beauty of Drugs.
22.Wishart DS,Feunang YD,Guo AC,Lo EJ,Wilson M.Drugbank 5.0:A Major Update to the Drugbank Database for 2018.Nucleic Acids Research.2017;46(Database issue).
23.Shannon,P.Cytoscape:A Software Environment for Integrated Models of Biomolecular Interaction Networks.Genome Research.2003;13(11):2498-2504.
24.Kingma D,Ba J.Adam:A Method for Stochastic Optimization.Computer Science.2014.
25.Long Y,Zhang Y,Wu M,Peng S,Kwoh CK,Luo J,Li X.Heterogeneous Graph Attention Networks for Drug Virus Association Prediction.Methods.2022;198:11-18.
26.Prediction of Microbe-Drug Associations Based on Katz Measure.2019 IEEE International Conference on Bioinformatics and Biomedicine(BIBM),2019.
27.Long Y,Wu M,Keong KC,Luo J,Li X.Predicting Human Microbe–Drug Associations Via Graph Convolutional Network with Conditional Random Field.Bioinformatics.2020(19):19.
28.Long Y,Luo J.Wmghmda:A Novel Weighted Meta-Graph-Based Model for Predicting Human Microbe-Disease Association on Heterogeneous Information Network.BMC Bioinformatics.2019;20.
29.Twan VL,Elena M,Peter C.Predicting Drug-Target Interactions for New Drug Compounds Using a Weighted Nearest Neighbor Profile.PLoS ONE.2013;8(6):e66952-.
30.Luo J,Long Y.Ntshmda:Prediction of Human Microbe-Disease Association Based on Random Walk by Integrating Network Topological Similarity.IEEE/ACM Transactions on Computational Biology&Bioinformatics.2018:1-1.
31.Huang YA,Hu P,Chan K,You ZH.Graph Convolution for Predicting Associations between Mirna and Drug Resistance.Bioinformatics.2019;36(3).
32.Xing C,Lei W,Jia Q,Na-Na G,Jian-Qiang L.Predicting Mirna-Disease Association Based on Inductive Matrix Completion.Bioinformatics.(24):4256-4265.
33.Xsab C,Zy D,Lei WE,Lun H,Lw E,Bj F,Bzab C.Sane:A Sequence Combined Attentive Network Embedding Model for Covid-19 Drug Repositioning.Applied Soft Computing.2021;111.
34.You J,Mcleod RD,Hu P.Predicting Drug-Target Interaction Network Using Deep Learning Model.Computational Biology&Chemistry.2019;80:90-101.
35.Szatmari SZ,Whitehouse PJ.Vinpocetine for Cognitive Impairment and Dementia.The Cochrane database of systematic reviews.2003;1(1):CD003119.
36.Al-Kuraishy HM,Al-Gareeb AI,Fageyinbo MS,Batiha GE-S.Vinpocetine Is the Forthcoming Adjuvant Agent in the Management of Covid-19.2022.
37.Kathiresan S,Shiomura J,Jang IK.Argatroban.Journal of Thrombosis&Thrombolysis.2002;13(1):41.
38.Rao PPN,Pham AT,Shakeri A,Shatshat AE,Zhao Y,Karuturi RC,Hefny AA.Drug Repurposing:Dipeptidyl Peptidase Iv(Dpp4)Inhibitors as Potential Agents to Treat Sars-Cov-2(2019-Ncov)Infection.Pharmaceuticals.2021(1).
39.Aliter KF,Al-Horani RA.Thrombin Inhibition by Argatroban:Potential Therapeutic Benefits in Covid-19.Springer US.2021(2).
40.Oerlemans R,Ruiz-Moreno AJ,Cong Y,Kumar ND,Dmling A.Repurposing the Hcv Ns3–4a Protease Drug Boceprevir as Covid-19 Therapeutics.RSC Medicinal Chemistry.2021(4).
41.Snehasish Nag,Samanwita Mandal,Oindrila Mukherjee S,,c,Kunducorresponding R.Dpp-4 Inhibitors as a Savior for Covid-19 Patients with Diabetes.2023.
42.Chao L.Hcv Ns3-4a Serine Protease,Hepatitis C Viruses:Genomes and Molecular Biology,2006.
43.Bafna K,Krug R,Montelione G.Structural Similarity of Sars-Cov2 Mproand Hcv Ns3/4a Proteases Suggests New Approaches for Identifying Existing Drugs Useful as Covid-19 Therapeutics.ChemRxiv:the preprint server for chemistry.2020.
44.Tan S,Lai S.Ns5a–from Obscurity to New Target for Hcv Therapy.Recent Patents on Anti-Infective Drug Discovery.2008;3(2):-.
45.Nguyenla X,Wehri E,Dis EV,Biering SB,Schaletzky J.Discovery of Sars-Cov-2 Antiviral Synergy between Remdesivir and Approved Drugs in Human Lung Cells.Cold Spring Harbor Laboratory.2020.
46.Andi B,Kumaran D,Kreitler DF,Soares AS,Keereetaweep J,Jakoncic J,Lazo EO,Shi W,Fuchs MR,Sweet RM.Hepatitis C Virus Ns3/4a Inhibitors and Other Drug-Like Compounds as Covalent Binders of Sars-Cov-2 Main Protease.Scientific Reports.
47.Elkazzaz MR,Ahmed A,Haydara T,Amer Y.Discovering of Gpcr and Gnrhr as Sars-Cov-2 Binding Receptors,the Scientific Breakthrough That Could Explain the Mystery of Its Common Symptoms with Unknown Aetiology.In Silico Research.2021.
48.Chu J,Xing C,Du Y,Duan T,Liu S,Zhang P,Cheng C,Henley J,Liu X,Qian C.Pharmacological Inhibition of Fatty Acid Synthesis Blocks Sars-Cov-2 Replication.Nature Metabolism.2021(11):3.
49.Hashizume M,Takashima A,Ono C,Okamoto T,Iwasaki M.Phenothiazines Inhibit Sars-Cov-2 Cell Entry Via a Blockade of Spike Protein Binding to Neuropilin-1.Antiviral research.2022:105481.
50.Chen,Zhu,Ziqing,Kong,Biao,Wang,Wen,Cheng,Anhua,Xin.Itgb3/Cd61:A Hub Modulator and Target in the Tumor Microenvironment.American journal of translational research.2019;11(12):7195-7208.
51.Cen G,Liu L,Wang J,Wang X,Chen S,Song Y,Liang Z.Weighted Gene Co-Expression Network Analysis to Identify Potential Biological Processes and Key Genes in Covid-19-Related Stroke.Oxid Med Cell Longev.2022;2022:4526022.
52.Onrust SV,Mcclellan K.Perospirone.Cns Drugs.2001;15(4):329-337.
53.Paulis TD.Perospirone(Sumitomo Phamaceuticals).Current opinion in investigational drugs(London,England:2000).2002;3(1):121-129.
54.Dan B.Drugbank,Dictionary of Bioinformatics and Computational Biology,2014.
55.Lurasidone Hydrochloride(Latuda):Management of Manifestations of Schizophrenia.Canadian Agency for Drugs and Technologies in Health.2014.
56.Ortiz JR,Carrascosa F.Mivacurium.Revista Espanola de Anestesiologia y Reanimacion.1997;44(8):315-320.
1、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“文章版权申述”(推荐),也可以打举报电话:18735597641(电话支持时间:9:00-18:30)。
2、网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
3、本站所有内容均由合作方或网友投稿,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务。
原创文章,作者:1158,如若转载,请注明出处:https://www.447766.cn/chachong/204420.html,