• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 19
    • 下载费用:30 金币  

    重庆时时彩不倍投赚钱: 自动挖掘配伍关系系统及其方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201510035590.6

    申请日:

    2015.01.23

    公开号:

    CN104765762A

    公开日:

    2015.07.08

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150123|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 上海中医药大学
    发明人: 文小平; 郭晶磊
    地址: 201203上海市浦东新区蔡伦路1200号
    优先权:
    专利代理机构: 上海精晟知识产权代理有限公司31253 代理人: 冯子玲
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510035590.6

    授权公告号:

    ||||||

    法律状态公告日:

    2018.02.23|||2015.08.05|||2015.07.08

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明提供的自动挖掘配伍关系系统,以基础数据总库为依托,具有这样的特征,包括:数据准备部,连接基础数据总库,对基础数据总库中的基础数据依次进行数据集成、数据选择、预处理形成新数据库;数据挖掘部,与数据准备部相连,对新数据库进行数据挖掘形成挖掘数据;以及结果表达和解释部,与数据挖掘部相连,对挖掘数据进行结果表达和解释。

    权利要求书

    权利要求书
    1.  一种自动挖掘配伍关系系统,以基础数据总库为依托,其特征在于,包括:
    数据准备部,连接所述基础数据总库,对所述基础数据总库中的基础数据依次进行数据集成、数据选择、预处理形成新数据库;
    数据挖掘部,与所述数据准备部相连,对所述新数据库进行数据挖掘形成挖掘数据;以及
    结果表达和解释部,与所述数据挖掘部相连,对所述挖掘数据进行结果表达和解释,
    其中,所述数据准备部,具有:
    检索???,根据所述基础数据总库建立,对所述基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库;
    识别阅读???,与所述检索??橄嗔?,根据所述检索??榻?,对所述检索数据库中的指定字段中阅读文本,查找出若干个关键词,并生成关键词库;
    筛选关键词???,与所述识别阅读??橄嗔?,根据所述检索??楹退鍪侗鹪亩聊?榻?,对所述关键词库中的若干个所述关键词进行筛选,并形成布尔逻辑表达式;以及
    语义数据库生成???,与所述筛选关键词??橄嗔?,根据所述检索???、所述识别阅读??楹退錾秆」丶誓?榻?,根据所述布尔逻辑表达式,在所述基础数据总库中搜索,并生成新数据库。

    2.  根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:
    其中,所述筛选关键词???,还包含:
    纳入关键词???,将若干个所述关键词通过所述检索??榻兄鸶黾焖?,选出高频或相关系数高的若干个所述关键词,计算出若干个所述关键词的组合重叠情况,分析用词习惯和语言规律;以及
    排出关键词???,与所述纳入关键词??橄嗔?,将人工识别去除的去除关键词记录下来,并生成弃用规则。

    3.  根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:
    其中,所述检索??榘阉鹘缑?,通过人工输入检索关键词。

    4.  根据权利要求1所述的自动挖掘配伍关系系统,其特征在于:
    其中,所述识别阅读??橥ü写?、断词、组词等阅读过程,生成一组所述关键词库。

    5.  一种自动挖掘配伍关系方法,以基础数据总库为依托,其特征在于,包括以下步骤:
    步骤a:根据所述基础数据总库建立检索???,对所述基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库;
    步骤b:根据所述检索??榻⑹侗鹪亩聊??,对所述检索数据库中的指定字段中阅读文本,查找出若干个关键词,并生成关键词库;
    步骤c:根据所述检索??楹退鍪侗鹪亩聊?榻⑸秆」丶誓??,对所述关键词库中的若干个所述关键词进行筛选,并形成布尔逻辑表达式;
    步骤d:根据所述检索???、所述识别阅读??楹退錾秆」丶誓?榻⒂镆迨菘馍赡??,根据所述布尔逻辑表达式,在所述基础数据总库中搜索,并生成新数据库;
    步骤e:对所述数据库进行数据挖掘形成挖掘数据;以及
    步骤f:对所述挖掘数据进行结果表达和解释。

    6.  根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:
    其中,所述步骤c,还具有:
    步骤c-1:将若干个所述关键词通过所述检索??榻兄鸶黾焖?,选出高频或相关系数高的若干个所述关键词,计算出若干个所述关键词的组合重叠情况,分析用词习惯和语言规律;以及
    步骤c-2:将人工识别去除的去除关键词记录下来,并生成弃用规则。

    7.  根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:
    其中,所述其中,所述检索??榘阉鹘缑?,通过人工输入检索关键词。

    8.  根据权利要求5所述的自动挖掘配伍关系方法,其特征在于:
    其中,所述识别阅读??橥ü写?、断词、组词等阅读过程,生成一组所述关键词库。

    说明书

    说明书自动挖掘配伍关系系统及其方法
    技术领域
    本发明涉及知识发现技术领域,尤其涉及自动挖掘配伍关系系统及其方法。
    背景技术
    随着社会信息化进程的飞速发展,人类已经进入了一个“信息爆炸”的时代,海量的数据已经远远超过了人们的分析和理解能力,于是数据库技术和人工智能技术应运而生。但是,单纯的数据库技术和人工智能技术基本上停留在对原始数据的标引和检索,并未能更深入地挖掘出数据内部隐藏的知识。
    知识发现技术是随着数据库技术和人工智能技术的发展而出现的一种新技术。它运用数据库技术对数据进行前端处理,从而利用机器学习方法从处理后的数据库中提取有用的知识。知识发现技术系统能够在用户的指令下,从数据库管理系统获取数据,经过数据聚集生成多维数据集,通过一定的知识发现技术进行模式提取,并进行模式评价,最终获得知识。此项技术涉及到机器学习、模式识别、统计学、智能数据库、知识获取、数据可视化、高性能计算、专家系统等多个领域。从数据库中发现出来的知识可以用在信息管理、过程控制、科学研究、决策支持等许多方面。
    但是,目前的知识发现技术并不能做到对相关的知识进行自动挖掘并配伍关系。
    发明内容
    本发明的目的在于提供一种将检索到的知识进行自动挖掘和配伍关系的自动挖掘配伍关系系统及其方法。
    本发明提供的自动挖掘配伍关系系统,以基础数据总库为依托,具有这样的特征,包括:数据准备部,连接基础数据总库,对基础数据总库中的基础数据依次进行数据集成、数据选择、预处理形成新数据库;数据挖掘部,与数据准备部相连,对新数据库进行数据挖掘形成挖掘数据;以及结果表达和解释部,与数据挖掘部相连,对挖掘数据进行结果表达和解释,其中,数据准备部,具有:检索???,根据基础数据总库建立,对基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库;识别阅读???,与检索??橄嗔?,根据检索??榻?,对检索数据库中的指定字段中阅读文本,查找出若干个关键词,并生成关键词库;筛选关键词???,与识别阅读??橄嗔?,根据检索??楹褪侗鹪亩聊?榻?,对关键词库中的若干个关键词进行筛选,并形成布尔逻辑表达式;以及语义数据库生成???,与筛选关键词??橄嗔?,根据检索???、识别阅读??楹蜕秆」丶誓?榻?,根据布尔逻辑表达式,在基础数据总库中搜索,并生成新数据库。
    优选的,筛选关键词???,包含:纳入关键词???,将若干个关键词通过检索??榻兄鸶黾焖?,选出高频或相关系数高的若干个关键词,计算出若干个关键词的组合重叠情况,分析用词习惯和语言规律;以及排出关键词???,与纳入关键词??橄嗔?,将人工识别去除的去除关键词记录 下来,并生成弃用规则。
    优选的,检索??榘阉鹘缑?,通过人工输入检索关键词。
    优选的,识别阅读??橥ü写?、断词、组词等阅读过程,生成一组关键词库。
    本发明还提供的自动挖掘配伍关系方法,以基础数据总库为依托,其特征在于,包括以下步骤:
    步骤a:根据基础数据总库建立检索???,对基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库,
    步骤b:根据检索??榻⑹侗鹪亩聊??,对检索数据库中的指定字段中阅读文本,查找出若干个关键词,并生成关键词库,
    步骤c:根据检索??楹褪侗鹪亩聊?榻⑸秆」丶誓??,对关键词库中的若干个关键词进行筛选,并形成布尔逻辑表达式,
    步骤d:根据检索???、识别阅读??楹蜕秆」丶誓?榻⒂镆迨菘馍赡??,根据布尔逻辑表达式,在基础数据总库中搜索,并生成新数据库,
    步骤e:对数据库进行数据挖掘形成挖掘数据,以及
    步骤f:对挖掘数据进行结果表达和解释。
    优选的,步骤c,具有:
    步骤c-1:将若干个关键词通过检索??榻兄鸶黾焖?,选出高频或相关系数高的若干个关键词,计算出若干个关键词的组合重叠情况,分析用词习惯和语言规律,以及
    步骤c-2:将人工识别去除的去除关键词记录下来,并生成弃用规则。
    优选的,检索??榘阉鹘缑?,通过人工输入检索关键词。
    优选的,识别阅读??橥ü写?、断词、组词等阅读过程,生成一组关键词库。
    发明作用和效果
    根据本发明所涉及自动挖掘配伍关系系统及其方法能够在根据基础数据总库里的基础数据依次进行数据集成、数据选择、预处理形成新数据库,对新数据库进行数据挖掘形成挖掘数据,对所述挖掘数据进行结果表达和解释。本发明提出的中医方剂自动挖掘配伍关系系统及其方法是能进行知识自动挖掘、并查找出配伍关系的自动挖掘配伍关系系统及其方法。
    附图说明
    图1是本发明在实施例中的自动挖掘配伍关系系统的结构连接框图;
    图2是本发明在实施例中的自动挖掘配伍关系方法的流程图;
    图3是本发明在实施例中的基础数据总库的数据表;
    图4是本发明在实施例中的检索数据库的数据表;
    图5是本发明在实施例中的关键词库的数据表;
    图6是本发明在实施例中的启用规则中的关键词库数据表;
    图7是本发明在实施例中的乳岩方剂数据的数据表;
    图8是本发明在实施例中的数据挖掘结果的数据表;
    图9是本发明在实施例中的通过药物关联规则方剂生成药物配伍关系的配伍关系图;
    图10是本发明在实施例中的局部放大药物关系图的关系图;以及
    图11是本发明在实施例中的数据挖掘部挖掘数据的药物分类的通用关联图。
    具体实施方式
    以下参照附图对本发明所涉及的自动挖掘配伍关系系统及其方法作详细的描述。
    实施例
    本实施例中的自动挖掘配伍关系系统及其方法用于中医古方的挖掘与配伍关系,主要是对组成、症状、功用等字段进行规范化设计,转换成多维频繁模式可挖掘数据,完成药物配伍和功效数据挖掘研究,发掘其中的规律。利用神经网络方法、聚类、关联规则的挖掘和可视化等方法,开展方药的知识发现研究,证实和发掘方药中隐含的有价值的信息,揭示方药配伍规律,为中医的新药开发提供参考依据。
    图1是本发明在实施例中的自动挖掘配伍关系系统的结构连接框图。
    如图1所示,本实例中的自动挖掘配伍关系系统以基础数据总库10为依托,具有:数据准备部20、数据挖掘部30和结果表达和解释部40。
    数据准备部20与基础数据总库10相连,包含:检索???1、识别阅读???2、筛选关键词???3和语义数据库生成???4,对基础数据总库10中的基础数据依次进行数据集成、数据选择、预处理形成新数据库。
    检索???1根据所述基础数据总库10建立,包含搜索界面,通过人工输入检索关键词对基础数据进行检索,自动生成检索表达式并存储,并 生成检索数据库。
    识别阅读???2与检索???1相连,根据检索???1建立,对检索数据库中的指定字段中阅读文本,通过切词、断词、组词等阅读过程,查找出若干个关键词,并生成一组关键词库。
    筛选关键词???3,与识别阅读???2相连,包括:纳入关键词???3a和排出关键词???3b,根据检索???1和识别阅读???2建立,对关键词库中的若干个关键词进行筛选,并形成布尔逻辑表达式。
    纳入关键词???3a将若干个关键词通过检索???1进行逐个检索,选出高频或相关系数高的若干个关键词,计算出若干个关键词的组合重叠情况,分析用词习惯和语言规律。
    排出关键词???3b与纳入关键词???3a相连,将人工识别去除的去除关键词记录下来,并生成弃用规则。
    语义数据库生成???4与筛选关键词??橄嗔?,根据检索???1、识别阅读???2和筛选关键词???3建立,根据布尔逻辑表达式,在基础数据总库10中搜索,并生成新数据库。
    数据挖掘部30与数据准备部20相连,对新数据库进行数据挖掘形成挖掘数据。
    结果表达和解释部40与数据挖掘部30相连,对所述挖掘数据进行结果表达和解释。
    图2是本发明在实施例中的自动挖掘配伍关系方法的流程图。
    如图2所示,自动挖掘配伍关系方法具有以下步骤:
    步骤a:根据基础数据总库10建立检索???1,通过人工输入检索关 键词对基础数据总库10中的基础数据进行检索,自动生成检索表达式并存储,并生成检索数据库,进入步骤b。
    步骤b:根据检索???1建立识别阅读???2,对检索数据库中的指定字段中阅读文本,通过切词、断词、组词等阅读过程查找出若干个关键词,并生成一组关键词库,进入步骤c。
    步骤c:根据检索???1和识别阅读???2建立筛选关键词???3,对关键词库中的若干个关键词进行筛选,并形成布尔逻辑表达式,进入步骤d。
    步骤d:根据检索???1、识别阅读???2和筛选关键词???3建立语义数据库生成???4,根据布尔逻辑表达式,在基础数据总库10中搜索,并生成新数据库,进入步骤e。
    步骤e:数据挖掘部30对数据库进行数据挖掘形成挖掘数据,进入步骤f。
    步骤f:结果表达和解释部40对挖掘数据进行结果表达和解释。
    其中,步骤c中还具有以下步骤:
    步骤c-1:纳入关键词???3a将若干个关键词通过检索???1进行逐个检索,选出高频或相关系数高的若干个关键词,计算出若干个关键词的组合重叠情况,分析用词习惯和语言规律,进入步骤c-2。
    步骤c-2:排出关键词???3b将人工识别去除的去除关键词记录下来,并生成弃用规则。
    图3是本发明在实施例中的基础数据总库的数据表。
    图4是本发明在实施例中的检索数据库的数据表。
    图5是本发明在实施例中的关键词库的数据表。
    图6是本发明在实施例中的启用规则中的关键词库数据表。
    图7是本发明在实施例中的乳岩方剂数据的数据表。
    图8是本发明在实施例中的数据挖掘结果的数据表。
    图9是本发明在实施例中的通过药物关联规则方剂生成药物配伍关系的配伍关系图。
    图10是本发明在实施例中的局部放大药物关系图的关系图。
    图11是本发明在实施例中的数据挖掘部挖掘数据的药物分类的通用关联图。
    以“乳腺癌”疾病为例自动挖掘配伍关系方法自动挖掘中医古方配伍关系的步骤如下:
    以基础数据总库10为依托,建立检索???1,在所建立的检索???1所提供的界面中,由人工输入要检索的关键词,即“乳腺癌”疾病的三个中医病名“乳癌”、“乳岩”和“奶岩”。
    基础数据总库10中数据以如图3所示格式保存。
    筛选关键词???3自动生成检索布尔表达式并储存:
    主治like’%乳癌%’or主治like’%乳岩%’or主治like’%奶岩%’
    根据上述布尔表达式,检索???1能在指定基础数据总库10中找到与关键词有关的条目,并自动生成符合检索条件的检索数据库如图4所示(共含55条)。
    将上述由检索模11自动生成的检索数据库导入识别阅读???2。
    识别阅读???2在指定检索数据库中的指定字段中阅读文本,并自动找出关键词。
    识别阅读???2通过断词、切词、组词等阅读过程,生成一组关键词库,具体步骤如下所示:
    根据标点来“断词”,根据词长来“切词”,根据词频来“组词”后得到最小词长为“1字”至最大词长为“16字”的词语共2894个,结果如下:

    在检索???1、识别阅读???2基础上,建立筛选关键词???3,即筛选关键词???,包括:纳入关键词???3a和排出关键词???3b。
    纳入关键词???3a所生成的关键词如图5所示(共70余个)。
    排出关键词???3b所生成的排除关键词如图6所示(共60余个)。
    纳入关键词???3a能统计各间接关键词的相关频次,并能选出高频或相关系数高的关键词,计算出各关键词的组合重叠情况,分析用词习惯和语言规律。
    排出关键词???3b能提供界面,将人工识别的去除关键词记录下来,并生成弃用规则。
    根据筛选关键词???3所生成的布尔逻辑表达式,在基础数据总库10中搜索。
    语义数据库生成???4自动生成新的数据库。
    具体乳岩方剂数据如图7所示(共334条)。
    在新数据库基础上,运用数据挖掘???0对该系统为“乳腺癌”(即中医“乳岩”病名)生成的乳岩方剂数据库进行数据挖掘得到的如下结果:
    通过症状与药物的关联分析,挖掘出“乳房肿块”、“瘰疬”、“痈疽”、“乳房胀痛”等与乳腺癌中医古方治疗数据库中最常见的主要症状和针对该症状的相应方剂中的药物配伍,从而为制定该疾病的临床治疗方案提供直接指导和参考,具体结果如图8所示。
    数据挖掘部30挖掘数据的药物分类的通用关联图如图11所示。
    结果表达和解释部40对所述挖掘数据进行结果表达和解释。
    关联规则挖掘出方剂中药物与主治症状的关联度如下:



    通过药物关联规则方剂生成药物配伍关系图如图9所示,局部放大药物关系图如图10所示,从中可以看出以“白僵蚕”为核心与之最相关的药物配伍。
    实施例的作用与效果
    本实施例所涉及的自动挖掘配伍关系系统及其方法能够在根据基础数据总库里的基础数据的中医古方依次进行数据集成、数据选择、预处理形成新数据库,对新数据库进行数据挖掘形成挖掘数据,对所述挖掘数据进行结果表达和解释,通过创建目标数据集合,去掉噪声,根据目标压缩和优化数据量,形成新数据库,利用正则表达式和SQL查询结合C#进行数据库字段的语义处理,主要是对组成、症状、功用等字段进行规范化设计, 转换成多维频繁模式可挖掘数据,完成药物配伍和功效数据挖掘研究,发掘其中的规律,利用神经网络方法、聚类、关联规则的挖掘和可视化等方法,开展方药的知识发现研究,证实和发掘方药中隐含的有价值的信息,揭示方药配伍规律,为中医的新药开发提供参考依据。本发明提出的自动挖掘配伍关系系统及其方法是能进行中药古方自动挖掘、并查找出配伍关系的自动挖掘配伍关系系统及其方法。
    上述实施方式为本发明的优选案例,并不用来限制本发明的?;し段?。

    关 键 词:
    自动 挖掘 配伍 关系 系统 及其 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:自动挖掘配伍关系系统及其方法.pdf
    链接地址://www.4mum.com.cn/p-5894861.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03