近日,我校中医药创新研究院/交叉学科研究院本草基因组学研究团队在《Journal of Pharmaceutical Analysis》(中科院一区,Top期刊)发表了题为“TCMKD: From Ancient Wisdom to Modern Insights-A Comprehensive Platform for Traditional Chinese Medicine Knowledge Discovery”的文章(图1 文章首页)。TCMKD平台通过整合方剂、疾病、靶标等七类核心数据,构建了涵盖143,331个实体的高质量中医药知识图谱,实现了“证候-方剂-药材-成分-靶标-疾病”之间的全链路关联。平台集成了知识图谱可视化查询工具与智能中医药问答系统,提升了复杂中医药数据的检索与分析效率。此外,TCMKD还提供了文本标注、数据挖掘等一系列智能处理工具,支持“靶标筛选-网络构建-通路富集”一站式分析流程,为揭示中医药作用机制、发现潜在药物靶标等研究提供了技术支撑与解决方案。成都中医药大学本草基因组学团队博士研究生萧文科和张梦晴为共同第一作者,宋驰研究员和陈伟教授为共同通讯作者。

图1 文章首页
中医药作为中华文明延续数千年的医学体系,以其独特的整体观、辨证论治思想和丰富的临床实践经验,在慢性疾病管理、疑难复杂病治疗及预防医学等领域具有不可替代的优势。然而,中医药现代化发展仍面临诸多挑战。其核心理论体系多源于长期临床经验的归纳总结和哲学思辨的综合认知,对于系统性分子机制的阐释尚显不足;与此同时,浩繁的古籍文献、经典方剂、药材信息以及临床数据分散在不同的资源库中,不仅存在术语标准不一、数据格式异构、验证体系缺失等问题,也严重制约了数据的跨领域整合与深度挖掘。因此,构建一个能够整合多源数据、支持多种算法分析的综合性中医药平台,已成为推动中医药现代化研究与创新发展的迫切需求。
TCMKD 平台系统整合了七类核心数据,包括 262 种证候、48,644 首方剂、9,953 种中成药、3,817 味中药材、36,403 种成分、18,665 个靶标以及 23,750 种疾病,形成了一个包含 144,410 个实体和 360 万条关联关系的高质量中医药知识图谱。该图谱实现了从“证候—方剂—药材—成分—靶标—疾病”的全链条数据贯通,为中医药的现代化研究提供了系统化的数据支撑(图2 TCMKD平台概览)。

图2 TCMKD平台概览
TCMKD平台进一步集成了多种高效的数据分析工具(图3 TCMKD平台工具展示),旨在系统挖掘中医药大数据中蕴含的内在规律与作用机制。平台的核心功能包括:基于 Apriori 算法 的数据挖掘模块,用于识别高频药材组合;以及基于 Bron-Kerbosch 算法 的关联分析模块,用于揭示方剂中关键药对之间的潜在联系。此外,平台还提供 聚类分析 与 决策树分析 工具,可通过定量评估药材与疾病间的关联强度,实现对潜在治疗靶点的分类与预测。
为进一步解析中药成分的作用机制,TCMKD内置了功能富集分析模块,支持基于GO注释和KEGG通路的富集分析,并集成了GSEApy、clusterProfiler等常用软件包,能够快速识别活性成分所涉及的关键生物学过程。同时,平台开发了网络定位与分离工具,依托人类蛋白质相互作用组数据,通过计算药物与疾病模块间的最短路径距离,预测潜在的药物-疾病治疗关联,为中医药作用机制研究和药物再利用提供了新的分析视角。此外,TCMKD平台构建了交互式 知识图谱系统,支持模糊搜索并可动态展示“药材-成分-靶点-疾病”多层级关联网络,直观呈现复杂的药理关系。平台还集成了自然语言问答系统,便于用户进行高效的信息检索与知识获取。同时,内置的文本标注工具可对非结构化文本进行智能处理,支持18类实体 与 13 类关系的标注任务。

图3 TCMKD平台工具展示
为展现平台的应用价值,该研究以肺癌为切入点,利用平台内置的多维数据分析工具,探索了治疗肺癌中药的用药规律及其潜在作用机制(图4 基于TCMKD平台从肺癌用药规律发现到作用机制解析的应用案例)。通过关联规则分析、极大团挖掘与分层聚类等方法,识别出了治疗肺癌的关键药物。进一步借助网络定位与分离工具,评估了关键药物之间的作用相似性及其与疾病的关联强度,为中医药在肺癌治疗中的临床应用提供了科学依据,体现了该平台在中医药知识发现与机制解析方面的实用价值。

图4 基于TCMKD平台从肺癌用药规律发现到作用机制解析的应用案例
该研究得到了四川省自然科学基金(2024ZDZX0019)的资助。
全文链接:https://doi.org/10.1016/j.jpha.2025.101297
(文、图/中医药创新研究院/交叉学科研究院)