尝试整合多种中医药信息资源,并基于互联网技术构建知识共享平台,为广大中医药科研工作者和爱好者提供信息获取渠道。基于Docker的分布式服务模式部署平台整体架构,依据中医药术语词库为基础创建搜索引擎,采用知识图谱的形式将文献信息中蕴含的病、症、证、治、方、药等各知识节点进行关联呈现。构建融合国医大师专科专病用方经验、名老中医医案、中医常用方剂、常见病诊疗指南、中成药等中医药特色的关联型知识数据库,实现了便捷、精准、高效的信息检索和“多维度”中医药知识共享服务。
随着科技飞速发展和互联网信息技术的高度融合,科技信息数据量呈现海量的骤增态势。由于目前信息数据呈现的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知识提出了挑战。诸如中医药术语、诊疗指南、名医经验医案、方剂学、中药学等学科信息相互独立呈现于各种信息载体中,并未得到很好的开发利用,形成一种信息孤岛,造成了宝贵信息资源的浪费。针对以上问题,尝试采用分布式服务架构模式整合资源,利用知识图谱技术将相对独立的信息资源进行“多维度”关联融合,用现代科技语言对中医药理论及实践经验进行科学阐释及解读,并进一步信息化、数字化、知识化。以期实现“一站式多维度”知识获取平台。
平台架构方法研究
平台系统体系结构为了保证平台系统服务的重用性、维护性、扩展性以及数据库安全性,平台基于分布式服务模式架构,将功能应用拆分为3个高内聚低耦合的服务模块:检索模块、知识图谱模块、用户管理模块。每个模块运行独立进程,服务间采用轻量级通信机制,独立部署。独立服务设计虽然是先进的架构,但在系统的复杂性、服务的持续集成方面却有无法回避的弊端,因此,引入了Docker技术。Docker是遵从Apache2.0协议开源的容器引擎,利用轻量级虚拟化技术实现资源隔离,并将各种环境依赖和应用统一打包,以达到方便应用移植和部署的目的。首先将各服务模块打包成独立的Docker镜像,之后push到私有镜像库中,每次部署服务时从私有镜像库pull下对应的镜像,按照DockerCompose编排好的微服务调度方式运行镜像。使用Docker后,平台各服务模块的框架如图1所示。多个业务系统独立部署在Docker容器中,将复杂的应用系统拆分成多个功能单一、业务逻辑简单的服务进行独立部署。每个微服务注册在EurekaServer中,通过声明式的RESTfulAPI相互调用。
图1平台服务模块的框架
搜索子模块设计该模块设计应充分考虑中医药领域知识特点,提供高效、准确、便捷的检索体验为目标。①高效:在前期研究的基础上,采用elasticStack作为搜索引擎,其基于分布式多副本数据存储,内嵌倒排技术的搜索模式,能提供很高的数据检索能力,可实现亿级数据量的秒查询响应。②准确:以中医药术语为标准,医用字典为参考,结合平台已有数据为基础,从文本信息中抽取关键词建立索引机制与数据相联系。构建同义词词典对关键词进行扩充,词典基于树形结构建立术语包含与被包含的关系,如治法“化痰开窍”可关联到“涤痰开窍”和“豁痰开窍”;饮片“金银花”可关联到“忍冬花、银花、二花、双花”,从而解决中医证候名称、治法名称、饮片名称等术语一词多义、一义多词的问题。基于以上技术,平台搜索模块实现了在不修改原始文献术语的情况下,仅依据搜索引擎建立的词典,实现精准检索的目的。③便捷:平台数据依据主题内容分类,导致用户想要获取不同类型的数据,需要多次进入不同数据库进行检索。为了给用户提供更便捷的检索体验,在平台首页创建了可遍历平台全部数据库的检索栏,如以“发热、头痛、咳嗽、鼻塞”四个检索词进行全库检索,结果页面如图2所示。其中“贯*感冒胶囊”词条来自于中成药数据库;“薄杏汤”词条来自于中医常用方剂数据库;“感冒”词条来自于国医大师专病用方经验数据库,实现了在一个界面下一次性完成对多个数据库的统一检索。
图2全库检索结果界面
图3医案知识图谱
信息管理子模块设计信息管理模块实现对平台使用者审核,数据管理者权限与数据维护的综合性管理,具有涉及面广、管理模块多、功能多样化的特点。基于JeePlus开发平台搭建信息管理模块,它是采用面向声明的开发模式,具有泛型编写极少代码即可实现复杂的数据展示、数据编辑、表单处理等功能特点。如用户管理界面如图4所示,实现多级化、多角色的管理和审核机制,提供图表化的数据维护功能,对每一个注册用户可独立定义访问权限。平台所有数据资源支持基于EXCEL表格模板批量导入、导出,数据采用外部采集、加工、审核的方式,管理员只需要进行一次导入操作,即可将数据批量导入指定数据库,简化了数据维护的成本,保证了平台数据的质量和安全。
图4平台用户管理界面
专题数据库的构建
国医大师专科专病用方经验数据库该数据库以病为纲,研究整理了第一、二批60位国医大师独具特色的专病用方经验。按照脾胃肝胆病、心肺脑病、妇科病、肿瘤病、肾系病、气血津液头身肢体病和针灸进行学科分类,字段包括病症、国医大师姓名、处方名、处方组成、功效、主治、用法、经验、词条来源、参考文献。目前共收录专科专病经验方条。60位国医大师的学术思想、临床经验及技术是他们毕生研读经典、博采诸家,长期临证总结出来的,是中医药学术最具价格的核心之一。
名医医案数据库刘炳凡是全国第一批名老中医学术经验传承导师,湖南中医五老之一,在中医临床、中医理论体系研究等方面造诣精深,在中医界享有很高的声望。本次主要收录刘老自20世纪三四十年代至九十年代初期亲自整理的医案手稿,这些医案包含了病者、病证、诊断、治法、处方、效果、按语解释等详实信息,在力求忠实于刘老手迹原貌的基础上,对其中刘老个人习惯用语加以适当标注,如“北辛(北细辛)”“上桂(肉桂)”“北味(北五味子)”“枣皮(山茱萸)”等。该数据库目前共收录刘老医案数据条,涉及皮肤、妇、儿、骨伤、五官、肿瘤等常见病,比较全面、真实地体现刘老“治病必须治人、治人必须重视脾胃”的学术思想。
中医常用方剂数据库该数据库数据来源于国家中医药管理局中医药名词术语成果转化与规范推广项目,故在数据构建中对其标注国家权威认证标识。目前共收录方剂首,字段包括:方剂名称、注释、组成、用法用量、功用、主治、方义、加减化裁、重要文献摘要、附方。该数据库蕴含信息量大,且经过国家权威发布,非常适合中医教学和临床参考使用。
常见病诊疗指南数据库中医常见病诊疗指南从年起由中华中医药学会陆续发布。包含中医外科、妇科、儿科、皮肤科、眼科等11个中医临床专科个病症的诊疗指南,从而初步形成了中医常见病临床诊疗技术规范体系。本次尝试收录肿瘤中医诊疗指南(ZYYXH/T--)、中医内科常见病诊疗指南西医疾病部分(ZYYXH/T50--)、中医内科常见病诊疗指南中医病证部分(ZYYXH/T4-49-)。2.5中成药数据库该库数据基于CFDA公布的国药准字号及对应的中成药名称,信息源自《新编国家中成药》第2版、《中国药典》版以及药品生产厂家