数据挖掘技术及其在中药配伍系统中的应用研究

数据挖掘技术及其在中药配伍系统中的应用研究

蔡越君[1]2003年在《数据挖掘技术及其在中药配伍系统中的应用研究》文中认为中医药是中华民族具有几千年传统的医药学,中华民族繁衍生息到现在充分证明了中医顽强的生命力及其实用价值。近几年来,中医药科学问题的现代研究不仅是中医药本身的研究重点,也成为其他学科,如化学、药物学研究的重点。随着信息化的深入,中医药信息越来越多,对其整理和归纳的工作也越来越复杂:如何从中找到有用的中医药知识;如何利用以前的临床案例来进行中医证侯的诊断;如何利用巨大的方剂知识,为中医专家有效地提供新的方剂配伍,是叁个急需解决的问题。 数据挖掘技术是解决机器学习、模式识别、数据库技术等各种领域中的大型实际应用问题而提出的一些工程性方法的集合,主要是为了从大型数据库中高效地发现隐含在其中的知识或规律,并为人类专家的决策提供支持。高频集发现和贝叶斯分类是两种重要的数据挖掘技术。 中药知识发现集中在发现常用的单味药合用模式,在中医术语中称之为药对,这可以用高频集发现来解决;中医症候诊断可以看成是在大量临床案例库上的贝叶斯训练器和分类器;解决方剂配伍问题的关键是建立起一个合适的配伍计算机模型。本文在这叁个方面作了下面一些工作: 1.分析高频集发现算法在中药知识发现中的模型,建立起合理的数据结构,并对Apriori算法做了一些改进,提出了一个新的参数:有效支持度,以便使找到的药对真正满足中医专家的兴趣,并在几十条中医数据基础上作了一些测试工作。 2.分析了贝叶斯算法的工作原理,并建立起中医证候诊断的模型:建立起以症状为维度的特征空间,以证侯为分类目标的空间,初步建立起一个中医证侯诊断的原型演示系统。 3.研究了中医方剂组方的过程,提出了方剂配方的计算机模型,设计了一个计算机方剂配方系统,给出了计算机方剂组方的具体步骤,探讨了这种模型的可行性,有效性。 4.开发了一个计算机系统Formula,它集成了中药药对发现功能,中医证侯诊断功能以及在中医专家的支持下的计算机辅助组方功能。

吕庆莉[2]2016年在《数据挖掘与复杂网络的融合及其在中医药领域应用》文中提出传统中医药作为中华历史的瑰宝,在经历时间淘洗后沉淀下大量的珍贵经验和价值数据。数据挖掘和复杂网络作为数据处理及知识发现的有效手段,分别从统计性和复杂性角度描述数据,并被广泛应用于现代中医药学研究中。数据挖掘偏向于发掘表层统计规律,缺乏对于系统内在机制的深入讨论;复杂网络主要通过网络角度描述系统结构,长于在功能复杂性中发掘普适规律,但在大数据处理中存在局限。分析了数据挖掘及复杂网络在中医药领域的应用及各自存在的问题,并给出2种模式整合的方法及框架,以脑血管疾病中医用药为例,构建其中医用药属性拓展网络,并结合改进的重迭社区发现(COPRA)算法挖掘中医用药重迭社团,探讨中药方剂配伍规律。该方法可在原有基础上有效发掘非频繁项集的药性关联规律,为中药配伍提供依据。

廖水亨[3]2017年在《闽台名医临证处方用药配伍特色研究》文中研究指明目的:挖掘着名中医陈鳌石教授治疗肿瘤的处方用药配伍规律及特色,总结和传播其治疗的用药经验和学术思想,为肿瘤的治疗提供临床和科研的借鉴。方法:本研究收集陈鳌石教授门诊治疗肿瘤的医案461例,共3511张处方;将所得原始文献录入计算机建立原始数据库,然后通过数据标准化处理原始数据库,建立目标数据库;采用频数统计、关联规则方法对目标数据库进行肿瘤病名统计、药物统计、药性分析、药物关联分析等方面挖掘陈教授治疗肿瘤处方用药配伍特色。结果:(1)陈教授治疗肿瘤病病种范围广,涉及28种肿瘤。(2)辨证思路:以脏腑经络辨病位,以八纲辨证、气血津液等定病性。(3)陈教授善治乳腺癌、胃癌和肺癌,疗效显着。乳腺癌以血虚气少居多,胃癌以气虚血少居多,肺癌以肺阴不足居多,病位主要在肝、脾、肺叁脏,病性以血虚、气虚、阴虚、血瘀、痰湿、气滞、郁热为主。(4)所用中药共323种,总使用频数为38383次,频次最高者为白芍,其次是白术、黄芪等健脾益气之药,再次是重楼、薏苡仁等清热之品,可见陈鳌石教授在治疗肿瘤上重视补法,但也兼顾清法,补中有清,扶正祛邪。(5)中药的功效分类最多的分别是补虚药和清热药。补虚药中补血药最多,补气药次之;清热药中清热解毒药居多,其次为清热凉血药。(6)四性中偏重寒、温、平,五味集中于甘、苦、辛,具有甘补甘缓,苦降辛开,升降同调,寒温并用的特点;用药剂量有峻缓之别,如白芍、白术、黄芪、薏苡仁等中药最大用量与最小用量相差较大。(7)扶正之法常从养血、滋阴、益气、健脾来开源,从化湿、祛痰、通瘀、清热等祛邪以使正气化生运转通畅,减少消耗以节流。(8)陈鳌石教授在常用相须、相使配伍方法外,也擅长寒温并用,扶正与祛邪同施,补清合用、补而不滞等配伍特色。结论:陈鳌石教授常以辨证与辨病相结合进行肿瘤诊疗,辨证以脏腑经络辨病位,以八纲辨证、气血津液等定病性,辨病多结合现代检查手段。陈教授善治乳腺癌、胃癌、肺癌,主张扶正祛邪的治疗大法,虚者补之实则泻之。陈教授喜从"虚、瘀、热"立论,从"肝、脾、肺"等脏腑入手,重视补法,亦善用清法和消法,清补兼施,攻补结合,扶正祛邪。补虚时常从养血、滋阴、益气、健脾来开源,从通瘀、化湿、祛痰、清热等祛邪,以使正气化生运转通畅,减少消耗以节流。结合陈教授临证肿瘤患者多经西医手术、化疗等治疗后,正气亏虚不耐攻伐的情况,故陈教授以扶正为主,以祛邪为辅的治法,贴合临床实际,疗效显着。通过对医案研究分析,能挖掘陈教授遣药配伍规律和用药特色,但同时数据挖掘研究在中医药研究领域也有不足之处。

宋兆林[4]2014年在《数据挖掘技术在中药方剂配伍中的应用研究》文中指出随着信息技术的发展与国家社会对中医药信息化建设的重视,对中医药数据挖掘的工作也随之深入。由于历史与地域的原因,中医药信息量巨大。如何充分利用文献典籍、临床数据及方剂理化来完成数据挖掘工作,从中找到有用的中医药知识为中医药配伍提供辅助决策,加快新知识发现的过程,是本研究的重点。数据挖掘可以用于找出隐藏于大数据之下的规律。在本课题中将数据挖掘应用于中药对的挖掘,并为此设计了一个中药配方系统,为中药研发提供有力的参考。在研究策略上,先对数据采集与预处理的特点进行了介绍,结合中医药的特点进行了数据的预处理。在论文的核心工作中,对中医药配伍和方剂分析。最后根据软件工程的过程进行需求分析、设计、编码,形成最终的应用软件。具体工作如下:1、由于中药方剂、药材等信息来源的问题,中医药原始数据在名称存在别名、药物同源等各种情况,难以直接应用于挖掘,本课题使用了药材名称检索的方式进行别名的处理。2、针对方剂中中药剂量不统一的情况,本课题先对剂量先转化为统一单位后采用百分比的方式确定各味药在方剂中的百分比。在方剂数量多的情况下,这些药物呈现连续的分布,因此对原始数据、计量单位等进行了预处理,对中药方剂数据进行规范化,为数据挖掘算法提供了模糊化表示的数值型数据。3、使用FP-Tree算法实现本课题中的数据挖掘引擎。并且针对该引擎的应用设计了系统的体系结构。以上工作不仅可以满足本系统对数据挖掘的需求,而且还可以将本引擎应用于其他项目,更为重要的是在后续的应用中如果有变更引擎的需求,那么很容易的通过简单替换就能实现系统的升级。4、结合本课题的目标,依照中医药数据的特点,使用数据挖掘相关方法对方剂中“症状一症状”、“药物一归经”、“药物一药物”的相关的规则进行了挖掘。5、为了增加用户的体验,验证挖掘的结果。在本研究的最后设计了一个中药方剂配伍系统。该系统的设计以软件工程中的瀑布模型为指导,从需求分析入手,进行概要设计与详细设计。在详细设计时对系统的数据访问层及业务逻辑层进行了重点的规划,提高了系统的灵活性。

王敏[5]2009年在《中医“毒热”数据分析系统的研究与实现》文中提出中医文化源远流长,荟萃几千年来众多中医学者的辛勤与智慧,积累了大量的中医文献资料和数据。如何应用现代科学技术手段,为中医理论的发展提供支持成为目前亟需解决的重大问题。本文就如何利用计算机技术特别是数据仓库、数据挖掘技术,为中医“毒热”理论研究提供支持予以探讨。本文从课题研究背景、数据采集与预处理、联机分析处理、关联规则和原型系统实现等几个角度讨论中医“毒热”数据分析系统。在数据采集与预处理部分,介绍了数据预处理基本技术,分析了中医“毒热”数据的特点,给出了中医“毒热”术语的规范化和编码处理方法;举例说明了数据采集中的最关键工作——数据标引。在联机分析处理部分,介绍了数据仓库模型设计和OLAP定义、数据组织、操作等理论基础;在充分分析的基础上,分割出了病因主题、病状主题、病机主题和治法主题,并且给出了各个主题的多维模型设计结果。在关联规则分析部分,首先介绍了关联规则基本概念和基本算法,在对同类算法的分析研究基础上,提出了基于位图矩阵和Apriori性质的二维关联规则改进算法。在原型系统实现部分,从软件开发技术角度,给出了中医“毒热”数据分析原型系统的体系结构和功能模块,并对关键技术予以详细描述。实践证明,本文设计的中医“毒热”数据分析原型系统是可行的,并且取得较好的效果。

李园白[6]2006年在《中医妇科常见病医案数据挖掘方法研究》文中研究指明数千年来,中医药学绵亘不绝,积累的数据可谓浩如烟海。目前中医药情报工作者面临的问题,是如何从海量数据中深入、准确、快捷地提取出有价值的知识,为临床和科研服务。本课题从蕴含丰富中医知识的医案入手,利用数据挖掘技术对四种妇科常见疾病医案进行处理,并从临床角度展开分析。文中探讨了这种新型信息技术在中医药医案数据分析中的应用效果,并认识到其获取的新知识,对临床研究具有一定的参考意义。期望本课题研究能为数据挖掘技术在中医药信息领域的应用提供方法学参考。 1 研究背景 目前,已经有许多研究人员应用数据挖掘中的关联分析技术对中医药数据进行处理。如成都中医药大学与四川大学合作对脾胃病方的数据挖掘,中国中医研究院中医药信息所与浙江大学合作对中国方剂数据库、中医药临床文献题录库和现代生物医学文献库的数据挖掘以及西南交通大学对乙肝医案的数据挖掘,加上一些小型的零散研究,研究数目共计十一项,涉及研究单位十二家。 但中医药领域的数据挖掘研究是近四、五年来才逐步开展起来,应用尚属初级阶段,其局限性不可避免,概括如下: 首先原始资料基本局限于医案或方剂,内容大多是药对的提取,导致挖掘结果只限于方剂的配伍方面;其次无论是利用已有数据库还是自行建立的数据库,都缺乏对数据规范深入系统的研究,从而影响了数据挖掘效果;最后关于结果的分析,以往研究大都停留在验证已有理论,而对于传统知识中未包含的新鲜知识,未能进一步分析,使得数据挖掘结果的含义很难解读,直接影响挖掘结果的利用。 2 研究内容 本课题以四种妇科常见疾病为例,利用数据挖掘技术对医案数据进行处理分析。本课题的研究过程主要包括确定研究目标、数据采集、数据预处理、数据处

赵丹丹[7]2006年在《数据挖掘在治疗糖尿病中药方剂数据库中的应用模拟》文中认为作为新兴的数据处理技术,数据挖掘是伴随着数据库技术的发展而逐步完善起来的,主要是为了从大型数据库中高效地发现隐含在其中的知识或规律,并为人类专家的决策提供支持。数据挖掘已经在许多领域得到应用,在医学领域的应用虽然刚刚起步,但也表现出良好的发展势头。 五千年的中华民族的文化底蕴,是中医药发生、发展的基础。近几年来,中医药科学问题的现代化研究不仅是中医药本身的研究重点,也成为其他学科,如化学、药物学研究的重点。几千年的经验积淀,中医药已经积累了海量数据。如中药方剂数据中蕴涵了大量有益信息,这些信息却很少得到充分的挖掘和利用,靠手工操作来理解分析这些数据己远远超出了人的能力。目前的数据库系统可以高效地实现数据的录入、查询、统计等功能,但无法发现数据中存在的关系和规则。迅速发展的数据挖掘技术,为此提供了有效途径。 随着社会经济的进步与发展,威胁人类健康的疾病谱正在变化。慢性非传染性疾病对国民、尤其是老年人群的健康的威胁越来越大,最为明显的是2型糖尿病在全球范围内的几近流行的上升趋势。积极开展糖尿病及其并发症的防治已成为目前医学界研究的热点。 本文就是以治疗糖尿病的中药方剂数据为研究样本,采用数据挖掘技术对其用药规律进行了有益探索。首先总结了数据挖掘的研究现状及最新进展,并简单介绍了中医药治疗糖尿病的相关知识。然后探讨了数据挖掘的基本理论和方法,并选择合适的算法应用于中药方剂数据库,挖掘其中有用的知识。 本文提出了数据挖掘方法应与领域相结合的思想。主要做了以下工作:对中医药方中不规范的数据进行了处理,建立了基本库和应用库;对关联规则及算法进行了改进,以发现中药配伍的规律;并引进了聚类算法分析技术,通过聚类分析方法对药物进行聚类,以适应针对大型数据库中混合数值和分类数据。因为在数据挖掘领域中,研究工作已经集中在为大型数掘库的有效和实际的聚类分析寻

赵丹丹[8]2007年在《Apriori算法改进及其在中药知识发掘中的应用》文中研究表明数据挖掘是伴随着数据库技术的发展而逐步完善起来的,已经在许多领域得到应用,在医学领域的应用虽然刚刚起步,但也表现出良好的发展势头。文章以治疗糖尿病的中药方剂数据为研究样本,将数据挖掘技术与中医药领域相结合,通过对关联规则及其算法的改进,来发现中药配伍的规律,从而提取出使用中药治疗糖尿病的整体用药规律。

曾萍[9]2007年在《基于KDD技术的中医药信息系统》文中认为随着KDD技术的不断发展和成熟,数据挖掘作为KDD技术的核心,使得对中药信息进行挖掘研究、找出其隐藏的有价值的信息成为可能。本文以贵州大学计算机科学与技术学院开发的毕节中药信息网为平台。首先对中药方剂数据进行信息化处理,针对方剂数据的不确定性、噪声大等特点,采用了方剂预处理过程,以正交分离方法将方剂中的每味中药单独存放,借助中药词典处理方剂中的中药异名现象,对中药剂量的不一致进行统一,对方剂数据的信息化处理进行了探索。其次利用数据挖掘中的频繁集、关联规则和Apriori算法,以感冒类方数据为例,开展中药的知识发现研究,证实和发掘中药中隐含的有价值的信息,揭示中药配伍规律,为中药的新药开发提供参考依据。最后介绍了聚类分析的概念,对层次聚类方法进行了研究,将Jaccard评价系数应用到感冒类方数据中,对在感冒类方中出现中药的功效和性味方面作了聚类分析,得出在感冒类方中的药物在性味和功效上的分类信息,可为中药组方时替代药的选取、新方的设计提供帮助。

袁文婕[10]2006年在《基于数据挖掘的中医诊疗经验方法研究》文中研究说明中医是我国的瑰宝,对名老中医经验的总结不仅能丰富中医学的理论体系,还能对中医学的学术进步产生巨大的推动作用,因此传承名老中医的临床经验是我国一向非常重视的任务。名老中医在长年的临床实践中积累了大量的宝贵经验,而这些经验都是隐含在大量的临床病历中的,单单靠人的手工收集和整理是远远不够的,必须要借助于计算机技术这个强大的武器,因此如何利用计算机技术挖掘出各类隐含在大量病历资料中的临床经验是传承名老中医经验的一大关键。 本文以名老中医的慢性胃炎临床诊断病历为原始资料,介绍了对原始数据的预处理方法,并从不同角度,运用不同的挖掘方法来挖掘数据中蕴含的各种经验信息:利用关联规则算法来得到原始数据中症状、辩证、治疗法和药物配伍之间的关系;运用改进的关联规则来挖掘处方中蕴含的药组和药对信息;运用因子分析来从整体上分析辩证和症状的关系,并得到慢性胃炎辩证和症状关系图。 结合中医药知识分析挖掘得到的关联规则和药对信息可以知道,在基本符合中医传统知识的基础上体现了该名老中医长年积累的临床经验,另外得到的辩证和症状关系图也从整体上为中医诊断提供了参考。因此挖掘结果基本达到了项目的要求,取得了较好的结果。

参考文献:

[1]. 数据挖掘技术及其在中药配伍系统中的应用研究[D]. 蔡越君. 浙江大学. 2003

[2]. 数据挖掘与复杂网络的融合及其在中医药领域应用[J]. 吕庆莉. 中草药. 2016

[3]. 闽台名医临证处方用药配伍特色研究[D]. 廖水亨. 福建中医药大学. 2017

[4]. 数据挖掘技术在中药方剂配伍中的应用研究[D]. 宋兆林. 福州大学. 2014

[5]. 中医“毒热”数据分析系统的研究与实现[D]. 王敏. 中国科学院研究生院(沈阳计算技术研究所). 2009

[6]. 中医妇科常见病医案数据挖掘方法研究[D]. 李园白. 中国中医科学院. 2006

[7]. 数据挖掘在治疗糖尿病中药方剂数据库中的应用模拟[D]. 赵丹丹. 中国海洋大学. 2006

[8]. Apriori算法改进及其在中药知识发掘中的应用[J]. 赵丹丹. 计算机与现代化. 2007

[9]. 基于KDD技术的中医药信息系统[D]. 曾萍. 贵州大学. 2007

[10]. 基于数据挖掘的中医诊疗经验方法研究[D]. 袁文婕. 南京理工大学. 2006

标签:;  ;  ;  ;  ;  ;  

数据挖掘技术及其在中药配伍系统中的应用研究
下载Doc文档

猜你喜欢