基于方剂数据挖掘的疾病与证候要素关系研究

基于方剂数据挖掘的疾病与证候要素关系研究

ID:9702262

大小:56.50 KB

页数:8页

时间:2018-05-05

基于方剂数据挖掘的疾病与证候要素关系研究_第1页
基于方剂数据挖掘的疾病与证候要素关系研究_第2页
基于方剂数据挖掘的疾病与证候要素关系研究_第3页
基于方剂数据挖掘的疾病与证候要素关系研究_第4页
基于方剂数据挖掘的疾病与证候要素关系研究_第5页
资源描述:

《基于方剂数据挖掘的疾病与证候要素关系研究》由会员上传分享,免费在线阅读,更多相关内容在应用文档-天天文库

1、基于方剂数据挖掘的疾病与证候要素关系研究:张帆,任廷革,刘晓峰,孙燕,汤尔群【关键词】中医方剂数据库;证候要素;数据挖掘有研究者提出“证候要素”的概念[1],认为证候要素是指辨证所要认识和确定的病位和病性,是通过对证候的辨识而确定的病理本质,是构成“证”的基本要素[2]。病位证候要素包括心、心神(脑)、肺、脾、肝、肾、胃、胆、小肠、大肠、膀胱、胞宫、精室、咽喉、口齿、鼻、耳、目、肌肤、筋骨、经络、胸膈等。病性证候要素包括传统意义上的病因和病机,如风、寒、暑、湿、燥、火(热)、脓、痰、饮、水停、食积、虫积、气滞

2、、气逆、气闭、血瘀、血热、血寒、气虚、气陷、气不固、气脱、血虚、阴虚、亡阴、阳虚、亡阳、阳亢、阳浮、津亏、精亏等[3]。尽管对证候要素的界定有多种不尽相同的意见,但有一点是一致的,即证候要素反映了证候的特征和本质。因此,研究疾病的证候要素分布规律,有重要的学术和临床意义,现将本研究方案叙述如下。  1研究方法  古代方剂文献记载了大量的传世方剂,其中大多数是验之有效的。在这些方剂文献中,有与方剂相关的病名、病因、病机、病位和临床表现的描述,蕴含了丰富的医理信息。本研究以中医方剂数据库系统(下简称“方剂库”)为

3、平台。方剂库是“中医药基础数据库”中的一个子系统,实现了中医古代方剂文献信息的高度结构化存储,可用主题词和关键词进行查询,并可对查询结果进行统计和关系分析,实现了基于频次的数据挖掘。由此来释放中医方剂文献所蕴涵的信息,为我们的研究提供技术支持。  1.1方剂库数据的分布特点  方剂库共收录了由先秦到民国73种书籍中记载的共计92102条方剂文献,这些文献覆盖了历史上的绝大部分的经典方书,年代跨度在2000年以上。方剂库数据的分布有2个特点:首先是公元960年(宋元年)以前的方剂文献,采取拉网式过筛的方案,对国

4、内有记载的所有方剂进行采集存储,使这1000多年的病证信息从方剂的层面得到全面的释放;其次是参考《中国医学史》、《中医各家学说》、《中国古代主要医家现存著作大系表》等文献,对公元960-1919年期间的文献进行筛选,其原则是让各个朝代都有文献被采集,主要涉及影响较大的方书、临证各科典籍等文献。由于上述这2个特点,本研究在数据上具有了较好的代表性。  1.2方剂数据的预处理  要让基于数据库的系统挖掘功能发挥作用,首先要让数据高度结构化。为此,我们研制了数据采集系统,这个系统的任务是完成非结构化数据(文本数据)

5、向结构化数据(解析数据)的转换,同时为数据的一致化维护(主题标引)提供软件环境。其意义在于使数据在具备结构化(语法)的基础上,在“中医药主题词表”的帮助下,在不改变文献原义的准则指导下,尽可能实现数据语义上的一致。我们制定了严格的文献数据解析细则和数据标引操作规范,标引的内容包括方剂组成、功效、主治病证、症状体征、病因、病机、病位、发病特征等内容,目前在方剂库的数据中至少有66204条方剂记录满足挖掘需求。  1.3方剂库系统的挖掘功能  方剂库系统提供了一个可以在局域网和互联网上使用的中医方剂文献信息的共享

6、平台,该数据库具有检索、统计分析和归类集合功能。方剂库检索功能包括:支持多种检索方式,既可以用自由词检索,也可用主题词检索;满足多条件组合检索等方式,可实现较复杂的逻辑查询;设置有二次查询(在结果中筛选)功能,以减少查询结果的“噪音”。方剂库统计分析功能包括:对查询所得方剂记录的种种属性进行频次统计和关系分析,如限定某种“病名”,分析病机、病位的情况,或限定某种“病位”,分析症状体征的情况等;可对统计出的数据进行归类集合,该功能是依据“中医药学主题词表”的结构进行的,可实现符合中医学知识结构的归类分析。  1

7、.4分析对象和目标的设计  本研究选取方剂文献中出现频率较高的咳嗽、呕吐、中风、腹痛、泄泻、水肿、抑郁症和消渴等8种疾病作为研究对象;对病位、病机、病因3类证候要素各选2种,以便进行比较,病位选择“肺”和“肾”,病机选择“气虚”和“阴虚”,病因选择“寒邪”和“湿邪”。利用系统的数据挖掘功能,对上述选择的文献数据分别进行纵向、横向分析和不同历史阶段的分析。纵向分析:以数据库中符合挖掘条件的全部记录为分析对象,以“病名”为切入点,分别统计病位、病机、病因等证候要素分布规律;横向分析:以方剂库中符合挖掘条件的全部记

8、录为分析对象,以病位、病机、病因为切入点,分别对其涉及的疾病进行统计;不同历史阶段的比较分析:选取某一病种为切入点,分别取公元960年前后2个历史时期的数据进行分析,对该病种在不同历史阶段的病位、病机、病因进行比较。  咳嗽病机出现频率最高是肺伤;呕吐病机出现频率最高的是风邪致病、寒邪致病、气虚;中风病机出现频率最高的是风邪致病、气虚、血虚;腹痛病机出现频率最高的是寒邪致病、气滞;泄泻病机出现频率最

当前文档最多预览五页,下载文档查看全文

此文档下载收益归作者所有

当前文档最多预览五页,下载文档查看全文
温馨提示:
1. 部分包含数学公式或PPT动画的文件,查看预览时可能会显示错乱或异常,文件下载后无此问题,请放心下载。
2. 本文档由用户上传,版权归属用户,天天文库负责整理代发布。如果您对本文档版权有争议请及时联系客服。
3. 下载前请仔细阅读文档内容,确认文档内容符合您的需求后进行下载,若出现内容与标题不符可向本站投诉处理。
4. 下载文档时可能由于网络波动等原因无法下载或下载错误,付费完成后未能成功下载的用户请联系客服处理。