数据挖掘《中国药典》2020年版肾病相关中药成方制剂的核心药对及其作用靶点预测

肾病(kidney disease )是指影响肾脏功能和结构的疾病,作为高血压、糖尿病和类风湿性关节炎等常见疾病的并发症,具有患病率高、预后差和医疗费高的特点[1-4] 。因其辨证困难,临床用药复杂[5] ,易产生不良反应[6] ,目前对肾病的治疗方法主要集中在控制病情进展和缓解症状上,缺少精准治疗肾病的药物组合[7]

核心药对的活性成分作用于肾病靶点发挥治疗作用,分子对接技术可以模拟和预测活性成分和肾病靶点之间形成稳定复合物的结合模式及该模式下结合作用的强弱[17] 。寻找肾病靶点对于研究核心药对治疗肾病的作用机制十分重要,文献计量学方法可以体现肾病研究热点,寻找肾病相关热点靶点和通路。

本研究通过收集《中国药典》2020 年版一部(以下简称《中国药典》)[18] 收录的肾病相关中药成方制剂,通过数据挖掘、文献计量学和分子对接的方法和技术研究了肾病相关中药复方的核心药对及其作用机制,研究思路及流程如图1 所示。

1 材料与方法

1.1 数据收集及处理

以《中国药典》为数据来源,在成方制剂和单味制剂的功能主治项下以“肾”为检索词,筛选相关中成药,收集其名称、处方、中药性味归经等信息,在Excel 2019 软件中建立数据库。

对数据库进行整理:①对组成、功能主治、给药途径、临床疾病等一致仅剂型存在差异的中成药进行合并,如将六味地黄丸、六味地黄丸(浓缩丸)、六味地黄软胶囊等合并为六味地黄丸。②对中成药的组方药味名称进行统一,对功效相同来源相同的药味进行统一,如白术(炒)、白术(麸炒)统称为白术;生地黄统一为地黄等。处方中如果涉及相关中药饮片有效成分提取物的,按一味药计。删除中成药组方中的化学药成分,如维生素B、维生素E等。

1.2数据挖掘方法

Excel 2019 软件对药味及其四气、五味、归经进行频次分析。基于R studio 软件,使用Apriori 算法和Eclat 算法挖掘所有药味中的关联规则并对结果可视化,同时采取提升支持度的方法筛选核心药物组合。选取频率大于10% 的药味,使用NbClust 包计算其最佳聚类数。采用Ward. D 算法进行聚类分析,绘制聚类分析树状图。采用Phi 相关系数计算两两药味之间的相关性。以中药为变量,以处方为观测计算处方间的JSC 并推断核心处方。

Phi 相关系数(φ [15,19] 的计算公式:φ sqrt(χ2/n) ,其中χ2 是统计量,n 是样本总数。JSC 计算公式[15] J(A, B)= |A B |/ |A B |,其中A B 分别表示2 个处方,|A B |表示处方A 和处方B 的交集大小;|A B |表示处方A 和处方B 的并集大小。

1.3 肾病相关靶点分析

使用VOSviewer 1.6.20分析肾病研究相关热点靶点。以中国知网(CNKI)为数据库,设置检索条件:(主题为肾病)AND(主题为治疗)。设置检索范围:总库和中英文拓展。检索时间为201411日—2024525日。将检索获得的文献以“Refworks”格式导出,导入VOSviewer 1.6.20软件,合并相同词义的关键词,如将关键词“TGF-β1”和“转化生长因子β1”均以“TGF-β1”表示等。绘制关键词共现网络,得到肾病相关热点靶点和通路。

1.4分子对接

选择文献报道的核心药对中能够治疗肾病的化合物,从PubChemhttps://pubchem.ncbi.nlm.nih. gov)在线数据库的3D Conformer模块下载其3D结构,保存为“sdf”格式。从RSCB PDBhttps://www. rcsb.org/)数据库筛选出热点蛋白的晶体复合物保存为“pdb”格式。用Discovery Studio软件对各化合物和蛋白进行前处理后再进行分子对接,以结合能评价核心药对的主要活性成分与靶点的结合活性,绘制以氢键和π-π键为主要相互作用力的靶点和最佳构象活性成分的结合模式图。统计受体同所有化合物各对接构象之间氢键、疏水相互作用和 Favorable”的总数目,绘制氨基酸残基贡献柱状图。

2 结果

2.1药味频次分析

《中国药典》共收录216个治疗肾病的中药成方制剂,合并相同药方不同剂型的中成药,得到166个中成药,涉及347个药味,药味出现频数总计1 786 次。其中使用频率大于30% 的中药共3 味,依次为熟地黄(65 次)、茯苓(59 次)、当归(50 次)。另有238 味中药使用频率≤2% ,占全部中药味数的68.59% ,见表1 。频率 10% 29 味中药见图2

2.2药味性味归经分析

3 47味药中47味药无性味归经,总频次60。因此,只

对有性味归经的药味进行统计分析。其中四气频次最高为温(529次),五味频次最高为甘(1 150 次),归经频次最高为肾经(1 002 次),其次为肝经(986 次),见表2

2.3药味关联规则分析

使用Apriori 算法和Eclat 算法,挖掘347 味中药的关联规则(图3 )。图中每一个网格点表示1 味中药,节点大小表示支持度,节点越大,支持度越高,两药同时出现的频率越高;节点颜色表示提升度,节点越红/ 黄,提升度越大,两药相关性越强[20] 采用提升支持度的方法挖掘347味中药的最强关联规则。设置支持度分别为12%18%,置信度60%,提升度大于1。支持度大于12%得到15条规则。其中3味药组6组,药对9对,置信度最大的规则为{山药,泽泻}{茯苓}。支持度大于18%得到2条关联规则,置信度最大的规则为{山药}{茯苓}。结果表明,出现山药时茯苓出现可能性最大。结果如图3所示。2种算法计算结果相同,同时也证明了Eclat算法计算中药关联规则的适用性。

2.4 聚类分析

使用R包中的NbClust包计算频率>10%29味中药的最佳聚类数。将不同函数得出的最佳聚类数综合统计(图4),得出最佳聚类数为327。采用Ward. D算法,设置聚类数为327,绘制树形图(图5),不同颜色代表不同类别。聚类数为327时山茱萸和牡丹皮均被聚为一类。

2.5 相关性分析

Phi 系数φ 的大小表示两因素之间的关联程度。当φ 值小于0.3 时,表示关联较弱,当φ 值大于0.6 时,表示关联较强[21] 。采用φ 计算频率>10% 29 味中药两两之间的相关性,绘制相关性热图,结果如图6 所示。图中颜色越深两药相关性越强,山茱萸- 牡丹皮(φ 0.72 )相关性最强。

2.6处方相似度分析

JSC 的取值范围0 1 ,其值越接近于1 2 个集合之间的相似程度越高[22] 。剔除药味≤2 的方剂,得到处方152个。计算152个组方之间的JSC,选择JSC0.3的方剂绘制网络图,结果如图7所示。图中节点表示方剂,节点大小表示关联方剂的多少,关联方剂越多,节点越大。节点之间连线的粗细和长短表示方剂之间的JSCJSC越大连线越粗越短,方剂间相似度越高。六味地黄丸的6味药均存在于相似度高的处方之中(表3),如麦味地黄丸等均为六味地黄丸的加味方。六味地黄丸是滋阴补肾的经典方剂,其配伍体现了山药-茯苓健脾益肾,山茱萸-牡丹皮补益肝肾的作用。然而,二者作用机制研究较少,因此通过预测其治疗肾病有关活性成分的作用靶点,丰富其作用机制的研究。

2.7 治疗肾病的靶点确认

VOSviewer 软件对关键词进行关键词共现分析,得到含有239 个节点和2 568 条边的关键词共现网络,如图8 所示。图中每一节点对应一个关键词,节点大小对应该关键词在文献中出现的相对频率,节点间的连线对应二者的共现关系。关键词词频在一定程度上反映了该领域的研究热度[23] ,其中“转化生长因子-β1transforming growth factor-β1TGF-β1)”是出现次数最多的蛋白,“TGF-β1/Smad信号通路”是出现次数最多的信号通路,也是有Pirfenidone 阳性药的成熟通路。细胞外基质(extracellular matrix ECM )蛋白的积累会导致肾纤维化,已有研究表明TGF-β1/Smad 通路中TGF-β1 Smad3 Smad4 Smad7 参与ECM 蛋白合成和降解的过程,是影响肾纤维化的关键靶点[24-26]

2.8分子对接

在下载的pdb ”蛋白 文件中,含有原配体的选取原配体坐标作为活性口袋;不含原配体的使用Discovery Studio软件计算活性口袋的坐标。以各核心药味和“肾病”为关键词,在Web of Science进行检索,选择通过体内实验研究得出核心药味治疗肾病的主要活性成分的文献,以报道最多的活性成分作为目标成分。将目标成分(表4),分别与文献计量学分析出的目标蛋白(表5)进行半柔性对接。

配体与受体结合时,结合能越低结合构象越稳定[38] ,结合能低于0时,反应能自发进行[39] ,结合能<7 kcal/mol1 kcal4.2 kJ)表明具有强烈的结合活性。如表6所示,5个活性成分均与关键蛋白能够自发结合形成稳定的复合物且有强烈的结合活性,表明山药-茯苓和山茱萸-牡丹皮极有可能通过作用于TGF-β1SMAD3SMAD4SMAD7 4个蛋白治疗肾病。药物和靶点的最佳结合模式(最佳结合能)如图9所示。

如图10所示,TGF-β1参与形成疏水相互作用较多的残基有VAL21944个)、LEU34038个)和ALA23025个),同时VAL219是“Favorable”数量最多的氨基酸残基。表明TGF-β15个活性成分之间主要通过疏水作用相互结合,提示VAL219是影响二者疏水相互作用的关键残基。Smad3参与形成疏水相互作用较多的残基有HIS39929个)、LEU36723个)和HIS24923个),同时HIS399是“Favorable”数量最多的氨基酸残基。表明Smad35个活性成分主要通过疏水作用相互结合,提示HIS399是影响二者疏水相互作用的关键残基。Smad4参与形成氢键较多的残基有ASP39633个)、ALA30927个)和ARG44127个),同时ASP396ARG441是“Favorable”数量最多的氨基酸残基。表明Smad45个活性成分主要通过氢键相互结合,提示ASP396ARG441是影响氢键相互作用的关键残基。Smad7参与形成氢键较多的残基有LYS34330个)、GLU38425个)、GLN39621个),同时LYS343是“Favorable”数量最多的氨基酸残基。表明Smad75个活性成分主要通过氢键相互结合,提示LYS343是影响氢键相互作用的关键残基。

3 讨论

肾为先天之本,能够滋养濡润和推动温煦机体各脏腑组织;治疗肾病可以推动类风湿性关节炎[40] 、高血压[41] 和糖尿病[42] 等慢性疾病的治疗进程。本研究通过频次分析、关联规则分析、相关性分析、聚类分析和处方相似度分析挖掘出治疗肾病的核心药对山药- 茯苓和山茱萸- 牡丹皮。山药- 茯苓均味甘、归肾经,甘味药的补益作用可以调节机体免疫、缓解症状[43] ;归肾经的药对对肾病的治疗具 有一定优势[44],两药作为临床常用的健脾利湿药对,均始载于《本经》并列为上品[45]。山药滋补脾胃,茯苓利水,“脾为后天,肾为先天,脾非先天之气不能化,肾非后天之气不能生”[46],两药合用,“利水而不伤正,补而不助邪”,有健脾肾止泻、滋补脾阴之功效。山茱萸-牡丹皮均归肝、肾经。肝藏血,肾藏精;肝主疏泄,肾主闭藏。因肝肾之间,阴液互相滋养,精血相生,故称肝肾同源[47],并形成了“肝肾同治”的治法。山茱萸和牡丹皮配伍出自于张仲景《金匮要略》的肾气丸[48],二药配伍促进肾精-肝阴相生的动态平衡,养肝而益髓强肾[49]

为丰富山药- 茯苓和山茱萸- 牡丹皮治疗肾病的作用机制研究,本研究通过文献计量学分析寻找肾病相关热点蛋白,通过分子对接预测二者治疗肾病的作用靶点。根据文献计量学结果,选择TGF-β1/Smad 信号通路中的关键蛋白TGFβ1 Smad3 Smad4 Smad7 作为本研究用于分子对接的受体,以报道较多的核心药对中治疗肾病的主要活性成分薯蓣素、丹皮酚、马钱苷、莫诺苷和茯苓酸A 作为配体进行分子对接。 结果表明薯蓣素、丹皮酚、马钱苷、莫诺苷和茯苓酸 A 均可与目标蛋白TGF-β1Smad3 Smad4 Smad7 自主结合并具有强烈的结合活性,表明核心药对很可能通过作用于TGF-β1/Smad 信号通路发挥治疗肾病的作用。现有文献报道,缬氨酸是纤维化中调节代谢的重要支链氨基酸[50] ;天冬氨酸是慢性间质性肾病的新生标志物[51] ;组氨酸、精氨酸和赖氨酸等的代谢可能参与肾病的发病机制[52-54] ,进一步证实了上述氨基酸的残基VAL219 HIS399ASP396ARG441LYS343是核心药对通过TGF-β1/Smad 信号通路治疗肾病的关键氨基酸残基。然而,分子对接只是一种预测性的计算模拟,并不能完全反映在生物体内的真实情况,因此仍需要进一步验证实验来确认以上化合物与TGF-β1/Smad 信号通路的确切相互作用及其在肾病治疗中的作用机制。

综上所述,本研究通过数据挖掘《中国药典》治疗肾病相关中成药的处方规律,发现了核心药对山药- 茯苓和山茱萸- 牡丹皮。通过文献计量学和分子对接的方法对核心药对治疗肾病的作用机制进行研究,预测了其作用靶点和通路,研究了分子间的相互作用,揭示了山药- 茯苓和山茱萸- 牡丹皮作为TGF-β1/Smad 信号通路的调节剂在肾病治疗中的潜在应用。

利益冲突 所有作者均声明不存在利益冲突

参考文献(略)

来 源:孙梦豫,邓清月,孙澜彬,田子怡,郑 媛,刘 薇,黎明霞,马嘉慕,齐晓丹,王秀环,折改梅.数据挖掘《中国药典》2020年版肾病相关中药成方制剂的核心药对及其作用靶点预测 [J]. 中草药, 2025, 56(1): 154-164.返回搜狐,查看更多

责任编辑:

平台声明:该文观点仅代表作者本人,搜狐号系信息发布平台,搜狐仅提供信息存储空间服务。
阅读 ()