• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 19
    • 下载费用:30 金币  

    重庆时时彩开奖助: 一种农业领域本体有效性评估方法.pdf

    关 键 词:
    一种 农业 领域 本体 有效性 评估 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201610534240.9

    申请日:

    2016.07.07

    公开号:

    CN106372099A

    公开日:

    2017.02.01

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20160707|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 安徽农业大学
    发明人: 李绍稳; 章丽; 张筱丹; 刘超; 赵会园; 许高建; 徐济成; 耿凡凡; 孔晨; 李景霞; 孙靓
    地址: 230000 安徽省合肥市蜀山区长江西路130号
    优先权:
    专利代理机构: 合肥市长远专利代理事务所(普通合伙) 34119 代理人: 程笃庆;黄乐瑜
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610534240.9

    授权公告号:

    |||

    法律状态公告日:

    2017.03.01|||2017.02.01

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明公开了一种农业领域本体有效性评估方法,结合查全率R、查准率P和F1指数对农业领域本体概念进行评估,结合概念间的语义相似度对农业领域本体概念间分类关系的一致性、准确性、简洁性进行评估,根据评估指标对农业领域本体概念间对象属性关系进行评估。如此,重点解决了农业领域本体有效性评估中存在的三个重要问题——本体概念的有效性评估、本体分类关系的有效性评估和本体非分类关系的有效性评估。本发明提出的农业领域本体有效性评估方法体系以农业领域本体为研究对象,可有效地评估农业领域本体的质量,提升农业本体构建效率。

    权利要求书

    1.一种农业领域本体有效性评估方法,其特征在于,包括以下步骤:
    S1、评估农业领域本体概念;
    S2、评估农业领域本体概念间分类关系;
    S3、评估农业领域本体概念间非分类关系;
    步骤S1具体包括以下分步骤:
    S11、将待评估的农业领域本体按照概念进行解析,得到概念集合;
    S12、设置概念评估指标,概念评估指标包括查全率R、查准率P和F1指数,其中,


    定义在查全率和查准率会出现矛盾的情况下,对这查全率和查准率进行加权调和平均
    获得的值为F指数,
    <mrow> <mi>F</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>P</mi> <mo>+</mo> <mi>R</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>
    F1指数为α=1时的F指数,
    <mrow> <mi>F</mi> <mn>1</mn> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mo>&times;</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <mi>P</mi> <mo>+</mo> <mi>R</mi> </mrow> </mfrac> </mrow>
    S13、根据待评估本体的学科领域范围,选择或构建相应的领域词典;
    S14、根据概念评估指标即查全率、查准率和F1指数对概念进行评估,获得正确概念数;
    S15、输出查全率、查准率及F1指数的评估结果;
    步骤S2具体包括以下分步骤:
    S21、将待评估的农业领域本体按照概念间的subClassOf关系进行解析,并将其保存为
    数据结构为图G=<V,E>的数据文件,V为本体概念集合,E为分类关系集合;
    S22、设置分类关系评估的三项评估指标,分别是一致性、准确性和简洁性;
    S23、计算概念间的语义相似度,并设置最佳阈值ε;
    S24、建立概念语义相似度集合S(s1,s2,...,sn)和一致性、准确性及简洁性判断结果集
    合T(t1,t2,...,tn),Si=Sim(vi,vj),i、j都是自然数,概念vi为概念vj上位词,且vi≠vj;
    S25、判断概念vi上位词个数是否大于1,是,则判断概念vi分类错误并存入判断结果集
    合T(t1,t2,...,tn);
    S26、将Sim(vi,vj)与最佳阈值ε比较,并根据比较结果判断概念vi和概念vj是否符合分
    类关系,符合,则将Si存入概念语义相似度集合S(s1,s2,...,sn);不符合则判断概念vi分类
    错误并将判断结果存入判断结果集合T(t1,t2,...,tn);
    S27、判断是否存在Sim(vi,vj)=Sim(vi,vk),如果存在,则判断概念vj和概念vk发生冗
    余错误并存入判断结果集合T(t1,t2,...,tn);
    S28、重复步骤S25至S27,直到将本体概念集合V和分类关系集合E全部计算判断完毕;
    S29、输出相似度计算结果集合S和一致性、准确性及简洁性判断结果集合T;
    步骤S3具体包括以下分步骤:
    S31、按照对象属性关系对农业领域本体进行解析,将解析得到的属性关系图保存为数
    据结构为的数据文件,并用邻接矩阵A表示;V为本体概念集合、E为属性关系
    集合、为属性关系概念对;
    S32、设置农业领域本体概念间对象属性关系的评估指标,并根据评估指标设置判定集
    合Q;
    S33、根据评估指标对农业领域本体概念间对象属性关系进行评估,并将评估结果记录
    在判定集合Q中;
    S34、输出农业领域本体中的属性关系集合E、属性关系概念对以及判定结果集合Q。
    2.如权利要求1所述的农业领域本体有效性评估方法,其特征在于,步骤S13中领域词
    典的构建包括以下步骤:
    S131、确定主题领域范围,并收集领域词汇;
    S132、确定词汇的分类特点,组织词汇和词汇间相互关系,形成词表结构,并指定定语
    词典;
    S133、对词典的词汇和关系进行审核校订。
    3.如权利要求2所述的农业领域本体有效性评估方法,其特征在于,步骤S131中,从文
    献、学科经典著作、百度百科、已有的词典及专家经验途径获得领域词汇。
    4.如权利要求1所述的农业领域本体有效性评估方法,其特征在于,步骤S23中,概念C1
    和C2间的语义相似度Sim(C1,C2)计算公式如下:
    Sim(C1,C2)=[Sim_dist(C1,C2)]α×[Sim_depth(C1,C2)]β×[Sim_width(C1,C2)]γ,
    其中,Sim_dist(C1,C2)为语义相似度与语义距离的对应关系,Sim_depth(C1,C2为语义
    相似度与语义深度的对应关系,Sim_width(C1,C2)为语义相似度与语义节点密度的对应关
    系;α表示语义距离的权重,β表示层次深度的权重,γ表示节点密度的权重,α、β、γ为调节
    参数,且α、β、γ之和为1。
    5.如权利要求4所述的农业领域本体有效性评估方法,其特征在于,
    其中,Dist(C1,C2)表示语义距离,a为调节参数;Dist
    (C1,C2)=Len(C1,C2),Len(C1,C2)表示概念C1和C2之间的路径长度。
    6.如权利要求4所述的农业领域本体有效性评估方法,其特征在于,
    Depth(C)表示概念C的深度,Depth(C)=
    Depth(Parent(C))+1,Parent(C)表示概念C的父节点,优选地,根节点的深度Depth(Root)
    =1。
    7.如权利要求4所述的农业领域本体有效性评估方法,其特征在于,概念C的密度表示
    为Width(C),其与分类细化程度成正比,当Width(C1)≤Width(C2),
    <mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>w</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>.</mo> </mrow>
    8.如权利要求1所述的农业领域本体有效性评估方法,其特征在于,步骤S26中,若ε<
    Sim(vi,vj)<1,则概念vi和概念vj符合分类关系要求;若0≤Sim(vi,vj)<ε,则判定概念vi
    和概念vj存在分类错误并存入判断结果集合T。
    9.如权利要求1所述的农业领域本体有效性评估方法,其特征在于,判断结果集合T中,
    tn与概念vn对应,如果概念vn符合评估指标,则对应tn进行标注;如果概念vn不符合评估指
    标,则对应tn标注判断出的错误类型。
    10.如权利要求1所述的农业领域本体有效性评估方法,其特征在于,农业领域本体概
    念间对象属性关系的评估指标包括:
    可逆性:当概念A与概念B之间存在关系R,同时,概念B与概念A之间存在关系R-1,则称R
    具有可逆性;
    关系继承性:概念A与父概念B之间存在关系R,同时,概念A与子概念C之间也存在关系
    R,则称关系R具有关系继承性;
    反向关系继承性:当父概念与概念A之间存在关系R,同时,其子概念与概念A之间也存
    在关系R,则称关系R具有反向关系继承性;
    传递性:若概念A与概念B之间存在关系R,概念B与概念C之间存在关系R,同时,概念A与
    概念C之间存在关系R,则称关系R具有传递性;
    对称性:若概念A和概念B有关系R,记作A=R(B),则概念B和概念A有关系R,记作B=R
    (A);
    自反性:概念A具有关系R,若R具有自反性,则A=R(A)。

    说明书

    一种农业领域本体有效性评估方法

    技术领域

    本发明涉及计算机信息技术在农业领域的应用,尤其涉及一种农业领域本体有效
    性评估方法。

    背景技术

    本体作为一种能在语义层面上表示知识的共享概念模型,已日渐成为知识管理、
    信息检索和语义Web等多个领域的重要组成部分。特别是自语义Web提出以来,本体正逐渐
    成为人工智能和知识工程领域中一个重要的研究方向,在知识的获取、表示、分析和应用等
    方面具有深远的意义。本体按照详细程度和领域依赖度两个指标,可分为4个类别:顶级本
    体、领域本体、任务本体和应用本体。其中,领域本体是专业性的本体,描述的是某一特定学
    科领域中概念的词表以及概念之间的关系,或者该学科领域的重要理论。由于领域本体的
    知识具有显著的领域特性,所以领域本体能够更为合理而有效地进行知识的表示。

    领域本体的构建使得领域知识的共享和重用成为可能。在众多的领域知识中,农
    业领域知识是一种高质量的生产要素,可以使农业劳动力和资本生产的效率大幅度提高;
    农业领域知识也是农业信息应用的基础,像农业信息系统、农业决策系统、农业专家系统、
    农业智能控制系统等都离不开农业知识。农业领域本体是一个包含农业术语、定义以及术
    语间规范关系说明的体系,是农业学科领域内概念、概念与概念间的相互关系的形式化表
    达。它可以表示为四元组,包括本体基本信息,如本体名称、创建者、设计时间、修改时间、目
    的和知识来源等本体的元数据信息;农业知识概念的集合;农业知识概念间的分类关系和
    非分类关系集合;本体中存在的公理集合。

    农业领域本体能在语义层面上描述与农业相关的数据、信息和知识,可以提供病
    虫害防治、农业生产决策支持、智能诊断和控制等本体服务。自从联合国粮农组织2000年提
    出农业本体服务研究计划以来,不同规模的农业领域本体数量正呈爆炸式增长,如何有效
    评估这些农业领域本体的构建质量,是否真正符合领域知识状况,可否真正体现知识组织
    的功能,能否实现农业知识服务的功效,自动或半自动本体学习方法是否科学合理,如何帮
    助用户选择更合适的农业本体,成为当前农业本体研究中亟待解决的问题。因此,需要对农
    业领域本体进行有效性评估。

    本体评估作为评估本体质量的一个重要手段,通过运用科学的方法,遵循统一的
    指标体系,评估本体在特定应用领域或特定环境下的性能和适用性,是影响本体是否能在
    语义网中大规模应用的一个重要影响因素。建立一套科学有效的本体评估理论和评估方
    法,有助于衡量本体构建方法是否具有效用,有利于对现有本体进行有效的管理、更新和维
    护,帮助指导本体构建过程和提升本体建设效率,从而形成更科学合理的领域本体和更好
    地提供相关本体服务。

    国内外相关专家学者在本体评估方面做了大量的研究,并提出了很多本体评估方
    法。总体来说,本体评估方法主要有七种,它们分别是:基于用户的评估方法、基于任务的评
    估方法、基于原则的评估方法、基于“黄金准则”的评估方法、基于应用的评估方法、基于语
    料库的评估方法和基于复合标准的评估方法。随着本体评估方法的不断完善,本体的自动
    化评估也得到了迅速发展,并开发出了一些本体评估工具,其中ODEval、OntoQA、CORE、
    OntoManager、AEON等是其中应用比较广泛的本体评估工具。

    现有的本体评估方法和评估工具虽然取得了一些成果,可以从某些方面对本体进
    行评估,但针对中文本体及适用于复杂学科领域本体如农业领域本体的 有效性评估方法
    还是极少的,而且现有的本体评估方法比较片面化,没有形成一整套科学全面的本体评估
    理论和方法体系。

    发明内容

    基于背景技术存在的技术问题,本发明提出了一种农业领域本体有效性评估方
    法。

    本发明提出的一种农业领域本体有效性评估方法,包括以下步骤:

    S1、评估农业领域本体概念;

    S2、评估农业领域本体概念间分类关系;

    S3、评估农业领域本体概念间非分类关系;

    步骤S1具体包括以下分步骤:

    S11、将待评估的农业领域本体按照概念进行解析,得到概念集合;

    S12、设置概念评估指标,概念评估指标包括查全率R、查准率P和F1指数,其中,



    定义在查全率和查准率会出现矛盾的情况下,对这查全率和查准率进行加权调和
    平均获得的值为F指数,

    <mrow> <mi>F</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>P</mi> <mo>+</mo> <mi>R</mi> <mo>)</mo> </mrow> </mrow> </mfrac> </mrow>

    F1指数为α=1时的F指数,

    <mrow> <mi>F</mi> <mn>1</mn> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mo>&times;</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <mi>P</mi> <mo>+</mo> <mi>R</mi> </mrow> </mfrac> </mrow>

    S13、根据待评估本体的学科领域范围,选择或构建相应的领域词典;

    S14、根据概念评估指标即查全率、查准率和F1指数对概念进行评估,获得正确概
    念数;

    S15、输出查全率、查准率及F1指数的评估结果;

    步骤S2具体包括以下分步骤:

    S21、将待评估的农业领域本体按照概念间的subClassOf关系进行解析,并将其保
    存为数据结构为图G=<V,E>的数据文件,V为本体概念集合,E为分类关系集合;

    S22、设置分类关系评估的三项评估指标,分别是一致性、准确性和简洁性;

    S23、计算概念间的语义相似度,并设置最佳阈值ε;

    S24、建立概念语义相似度集合S(s1,s2,...,sn)和一致性、准确性及简洁性判断结
    果集合T(t1,t2,...,tn),Si=Sim(vi,vj),i、j都是自然数,概念vi为概念vj上位词,且vi≠
    vj;

    S25、判断概念vi上位词个数是否大于1,是,则判断概念vi分类错误并存入判断结
    果集合T(t1,t2,...,tn);

    S26、将Sim(vi,vj)与最佳阈值ε比较,并根据比较结果判断概念vi和概念vj是否符
    合分类关系,符合,则将Si存入概念语义相似度集合S(s1,s2,...,sn);不符合则判断概念vi
    分类错误并将判断结果存入判断结果集合T(t1,t2,...,tn);

    S27、判断是否存在Sim(vi,vj)=Sim(vi,vk),如果存在,则判断概念vj和概念vk发
    生冗余错误并存入判断结果集合T(t1,t2,...,tn);

    S28、重复步骤S25至S27,直到将本体概念集合V和分类关系集合E全部计算判断完
    毕;

    S29、输出相似度计算结果集合S和一致性、准确性及简洁性判断结果集合 T;

    步骤S3具体包括以下分步骤:

    S31、按照对象属性关系对农业领域本体进行解析,将解析得到的属性关系图保存
    为数据结构为的数据文件,并用邻接矩阵A表示;V为本体概念集合、E为属性
    关系集合、为属性关系概念对;

    S32、设置农业领域本体概念间对象属性关系的评估指标,并根据评估指标设置判
    定集合Q;

    S33、根据评估指标对农业领域本体概念间对象属性关系进行评估,并将评估结果
    记录在判定集合Q中;

    S34、输出农业领域本体中的属性关系集合E、属性关系概念对以及判定结果集合
    Q。

    优选地,步骤S13中领域词典的构建包括以下步骤:

    S131、确定主题领域范围,并收集领域词汇;

    S132、确定词汇的分类特点,组织词汇和词汇间相互关系,形成词表结构,并指定
    定语词典;

    S133、对词典的词汇和关系进行审核校订。

    优选地,步骤S131中,从文献、学科经典著作、百度百科、已有的词典及专家经验途
    径获得领域词汇。

    优选地,步骤S23中,概念C1和C2间的语义相似度Sim(C1,C2)计算公式如下:

    Sim(C1,C2)=[Sim_dist(C1,C2)]α×[Sim_depth(C1,C2)]β×[Sim_width(C1,C2)
    ]γ,

    其中,Sim_dist(C1,C2)为语义相似度与语义距离的对应关系,Sim_depth(C1,C2
    为语义相似度与语义深度的对应关系,Sim_width(C1,C2)为语义相似度与语义节点密度的
    对应关系;α表示语义距离的权重,β表示层次深度的权重,γ表示节点密度的权重,α、β、γ
    为调节参数,且α、β、γ之和为1。

    优选地,其中,Dist(C1,C2)表示语义距离,a
    为调节参数;Dist(C1,C2)=Len(C1,C2),Len(C1,C2)表示概念C1和C2之间的路径长度。

    优选地,Depth(C)表示概念C的
    深度,Depth(C)=Depth(Parent(C))+1,Parent(C)表示概念C的父节点,优选地,根节点的
    深度Depth(Root)=1。

    优选地,概念C的密度表示为Width(C),其与分类细化程度成正比,当Width(C1)≤
    Width(C2),

    <mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>w</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>.</mo> </mrow>

    优选地,步骤S26中,若ε<Sim(vi,vj)<1,则概念vi和概念vj符合分类关系要求;
    若0≤Sim(vi,vj)<ε,则判定概念vi和概念vj存在分类错误并存入判断结果集合T。

    优选地,判断结果集合T中,tn与概念vn对应,如果概念vn符合评估指标,则对应tn
    进行标注;如果概念vn不符合评估指标,则对应tn标注判断出的错误类型。

    优选地,农业领域本体概念间对象属性关系的评估指标包括:

    可逆性:当概念A与概念B之间存在关系R,同时,概念B与概念A之间存 在关系R-1,
    则称R具有可逆性;

    关系继承性:概念A与父概念B之间存在关系R,同时,概念A与子概念C之间也存在
    关系R,则称关系R具有关系继承性;

    反向关系继承性:当父概念与概念A之间存在关系R,同时,其子概念与概念A之间
    也存在关系R,则称关系R具有反向关系继承性;

    传递性:若概念A与概念B之间存在关系R,概念B与概念C之间存在关系R,同时,概
    念A与概念C之间存在关系R,则称关系R具有传递性;

    对称性:若概念A和概念B有关系R,记作A=R(B),则概念B和概念A有关系R,记作B
    =R(A);

    自反性:概念A具有关系R,若R具有自反性,则A=R(A)。

    本发明提供的一种农业领域本体有效性评估方法,结合查全率R、查准率P和F1指
    数对农业领域本体概念进行评估,结合概念间的语义相似度对农业领域本体概念间分类关
    系的一致性、准确性、简洁性进行评估,根据评估指标对农业领域本体概念间对象属性关系
    进行评估。如此,重点解决了农业领域本体有效性评估中存在的三个重要问题——本体概
    念的有效性评估、本体分类关系的有效性评估和本体非分类关系的有效性评估。

    本发明提出的农业领域本体有效性评估方法体系以农业领域本体为研究对象,可
    有效地评估农业领域本体的质量,提升农业本体构建效率。

    附图说明

    图1为本发明提出的一种农业领域本体有效性评估方法流程图;

    图2为评估农业领域本体概念方法流程图;

    图3为评估农业领域本体概念间分类关系方法流程图;

    图4为评估农业领域本体概念间非分类关系方法流程图;

    图5为茶树虫害本体评估原型系统总体框架图。

    具体实施方式

    参照图1,本发明提出的一种农业领域本体有效性评估方法,包括以下步骤。

    S1、评估农业领域本体概念;

    S2、评估农业领域本体概念间分类关系;

    S3、评估农业领域本体概念间非分类关系。

    概念作为本体模型的基本元素,是表达领域知识的核心。因此对领域本体概念的
    评估是完成本体评估的重要部分。

    参照图2,本实施方式中,评估农业领域本体概念即步骤S1具体包括以下分步骤。

    S11、将待评估的农业领域本体按照概念进行解析,得到概念集合。本步骤是对输
    入的待评估的农业领域本体进行本体预处理,具体可通过本体解析工具将待评估的农业领
    域本体按照概念进行解析。

    S12、设置概念评估指标,概念评估指标包括查全率R、查准率P和F1指数。

    查全率R是指本体中的正确概念数与领域词典中的概念总数的比值,


    查准率P是指本体中的正确概念数与本体中的概念总数的比值,


    定义在查全率和查准率会出现矛盾的情况下,对这查全率和查准率进行加权调和
    平均获得的值为F指数,F1指数是F指数的特定取值。F指数与F1指数具体计算如下:

    <mrow> <mi>F</mi> <mo>=</mo> <mfrac> <mrow> <mo>(</mo> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mo>+</mo> <mn>1</mn> <mo>)</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <msup> <mi>&alpha;</mi> <mn>2</mn> </msup> <mrow> <mo>(</mo> <mi>P</mi> <mo>+</mo> <mi>R</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>

    F1指数为α=1时的F指数,

    <mrow> <mi>F</mi> <mn>1</mn> <mo>=</mo> <mfrac> <mrow> <mn>2</mn> <mo>&times;</mo> <mi>P</mi> <mo>&times;</mo> <mi>R</mi> </mrow> <mrow> <mi>P</mi> <mo>+</mo> <mi>R</mi> </mrow> </mfrac> <mo>.</mo> </mrow>

    一组科学合理的概念的评估指标应能够评估出所构建本体中概念的覆盖程度、概
    念术语的正确率,即待评估的本体中的概念集合应最大程度地包含该领域内的重要术语。
    而且本体中定义的概念不但需要具有完整性,还需要保证本体概念的正确性。

    查全率、查准率和F指数作为反映概念评估效果的重要指标,F指数能够综合这两
    个评估指标,用于综合反映整体的指标,F1指数是对F指数的明确。本实施方式中,以查全
    率、查准率和F1指数作为概念评估指标,有利于概念评估的精确程度。

    S13、根据待评估本体的学科领域范围,选择或构建相应的领域词典。

    领域词典是指特定领域的术语或词汇的集合,能够反映某个具体领域内的信息、
    概念等元素,其中的元素可以从相关的语料库中抽取和提炼。与传统词典只是简单的将词
    汇按照词形或字母顺序组织起来相比,现代词典不仅要包含概念,更要在词典当中考虑概
    念与概念之间的关系。概念评估结果的准确性依赖于领域词典的选择,因此,领域词典的选
    定非常重要。

    步骤S13中领域词典的构建包括以下步骤:

    S131、确定主题领域范围,并收集领域词汇;具体地,领域词汇可从文献、学科经典
    著作、百度百科、已有的词典及专家经验途径获得。

    S132、确定词汇的分类特点,组织词汇和词汇间相互关系,形成词表结构,并指定
    定语词典;

    S133、对词典的词汇和关系进行审核校订。

    S14、根据概念评估指标即查全率、查准率和F1指数对概念进行评估,获得正确概
    念数。

    S15、输出查全率、查准率及F1指数的评估结果,获得概念评估结果。

    关系是本体中概念与概念之间的一种联系,农业领域本体概念间的分类关系具体
    表现为subClassOf关系,描述的是父概念和子概念之间的关系。分类关系体系作为组织概
    念的基础,是本体的骨干结构。因此,研究如何对分类关系进行有效的评估是非常有必要
    的。

    参照图3,本实施方式中,评估农业领域本体概念间分类关系即步骤S2具体包括以
    下分步骤。

    S21、通过本体解析工具将待评估的农业领域本体按照概念间的subClassOf关系
    进行解析,并将其保存为数据结构为图G=<V,E>的数据文件,V为本体概念集合,E为分类关
    系集合。

    S22、设置分类关系评估的三项评估指标,分别是一致性、准确性和简洁性。

    本实施方式中,三项评估指标针对了分类关系中常见的三种典型错误——分类不
    一致、分类错误和冗余错误。一致性主要用来检测本体中出现了相互冲突的分类关系;准确
    性主要针对本体分类体系中出现的概念分类错误问题;简洁性主要是针对在本体分类体系
    中发现存在相同概念的冗余错误。

    S23、计算概念间的语义相似度,并设置最佳阈值ε。本实施方式中,最佳阈值ε可结
    合传统经验和专家分析经试验获得。

    本体中的分类关系体系是将概念按照subClassOf以树状结构排列,传统的基于语
    义距离的概念语义相似度算法可以合理地利用这种组织形式。在传统的基于语义距离的概
    念语义相似度算法的基础之上,本发明进行了一定的优化和 调整,将层次深度、节点密度
    考虑在内,并设置了调节参数,采用一种改进的概念语义相似度算法。

    概念间的语义相似度采用概念语义相似度算法进行计算。概念C1和C2间的语义相
    似度Sim(C1,C2)计算公式如下:

    Sim(C1,C2)=[Sim_dist(C1,C2)]α×[Sim_depth(C1,C2)]β×[Sim_width(C1,C2)
    ]γ,

    其中,Sim_dist(C1,C2)为语义相似度与语义距离的对应关系,Sim_depth(C1,C2为
    语义相似度与语义深度的对应关系,Sim_width(C1,C2)为语义相似度与语义节点密度的对
    应关系;α表示语义距离的权重,β表示层次深度的权重,γ表示节点密度的权重,α、β、γ为
    调节参数,且α、β、γ之和为1。

    概念语义相似度值与语义距离成反比。

    其中,Dist(C1,C2)表示语义距离,a为调节
    参数;若每条边的权重一样,权重都设为1,则

    Dist(C1,C2)=Len(C1,C2),

    Len(C1,C2)表示概念C1和C2之间的路径长度。

    概念语义相似度值与层次深度差成正比,与层次深度和成反比。

    Depth(C)表示概念C的深度,
    Depth(C)=Depth(Parent(C))+1,Parent(C)表示概念C的父节点。根节点的深度Depth
    (Root)=1。

    概念语义相似度值与节点密度成反比。在分类关系体系中,密度越高指分类越细
    致,细化程度越高,概念与概念之间相似程度越低。概念C的密度表示为Width(C),其与分类
    细化程度成正比,当Width(C1)≤Width(C2),

    <mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>w</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>.</mo> </mrow>

    故而:

    <mrow> <mtable> <mtr> <mtd> <mrow> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>d</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mi>&alpha;</mi> </msup> <mo>&times;</mo> <msup> <mrow> <mo>&lsqb;</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>d</mi> <mi>e</mi> <mi>p</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mi>&beta;</mi> </msup> <mo>&times;</mo> <msup> <mrow> <mo>&lsqb;</mo> <mi>S</mi> <mi>i</mi> <mi>m</mi> <mo>_</mo> <mi>w</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>&rsqb;</mo> </mrow> <mi>&gamma;</mi> </msup> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>=</mo> <msup> <mrow> <mo>&lsqb;</mo> <mfrac> <mi>a</mi> <mrow> <mi>a</mi> <mo>+</mo> <mi>D</mi> <mi>i</mi> <mi>s</mi> <mi>t</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>,</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&rsqb;</mo> </mrow> <mi>&alpha;</mi> </msup> <mo>&times;</mo> <msup> <mrow> <mo>&lsqb;</mo> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <mo>|</mo> <mi>D</mi> <mi>e</mi> <mi>p</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>-</mo> <mi>D</mi> <mi>e</mi> <mi>p</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> <mo>|</mo> </mrow> <mrow> <mi>D</mi> <mi>e</mi> <mi>p</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>e</mi> <mi>p</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&rsqb;</mo> </mrow> <mi>&beta;</mi> </msup> <mo>&times;</mo> <msup> <mrow> <mo>&lsqb;</mo> <mfrac> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>1</mn> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <mi>W</mi> <mi>i</mi> <mi>d</mi> <mi>t</mi> <mi>h</mi> <mrow> <mo>(</mo> <msub> <mi>C</mi> <mn>2</mn> </msub> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>&rsqb;</mo> </mrow> <mi>&gamma;</mi> </msup> </mrow> </mtd> </mtr> </mtable> <mo>.</mo> </mrow>

    S24、建立概念语义相似度集合S(s1,s2,...,sn)和一致性、准确性及简洁性判断结
    果集合T(t1,t2,...,tn),Si=Sim(vi,vj),i、j都是自然数,概念vi为概念vj上位词,且vi≠
    vj。

    判断结果集合T中,tn与概念vn对应,如果概念vn符合评估指标,则对应tn进行标
    注,具体可标注符号“√”;如果概念vn不符合评估指标,则对应tn标注判断出的错误类型,
    错误类型为分类错误或者冗余错误。

    S25、如果概念vi上位词个数大于1,则判断概念vi分类错误并在判断结果集合T
    (t1,t2,...,tn)中对应ti记录分类错误。

    S26、将Sim(vi,vj)与最佳阈值ε比较,并根据比较结果判断概念vi和概念vj是否符
    合分类关系,符合,则将Si存入概念语义相似度集合S(s1,s2,...,sn);不符合则判断概念vi
    分类错误并将判断结果存入判断结果集合T(t1,t2,...,tn)。

    具体地,若ε<Sim(vi,vj)<1,则概念vi和概念vj符合分类关系要求,将Si=Sim
    (vi,vj)存入概念语义相似度集合S;若0≤Sim(vi,vj)<ε,则判定概念vi和概念vj存在分类
    错误,不满足准确性,在判断结果集合T中对应ti、tj记录分类错误。

    S27、判断是否存在Sim(vi,vj)=Sim(vi,vk),如果存在,则判断概念vj和概念vk是
    同义词发生冗余错误并存入判断结果集合T(t1,t2,...,tn),具体地, 在判断结果集合T中
    对应tj、t记录冗余错误。

    S28、重复步骤S25至S27,直到将本体概念集合V和分类关系集合E全部计算判断完
    毕。

    S29、输出相似度计算结果集合S和一致性、准确性及简洁性判断结果集合T。

    根据关系在本体中的不同作用,可以分为分类关系和非分类关系两种。非分类关
    系表示了因果关系、属性关系、实例关系等所有不属于分类关系的其他所有关系。非分类关
    系增强了本体知识表达的完备性和复杂性,使本体真正成为网状结构。因此,对非分类关系
    的进行有效性评估有着重要的理论意义和研究价值。

    非分类关系有很多种,在农业领域本体中,其中功能最强、使用最多的是对象属性
    关系。本发明主要对非分类关系体系中的对象属性关系进行评估,提出一种基于图理论的
    农业领域本体概念间非分类关系评估方法。

    参照图4,本实施方式中,评估农业领域本体概念间非分类关系即步骤S3具体包括
    以下分步骤。

    S31、使用解析工具按照对象属性关系对农业领域本体进行解析,将解析得到的属
    性关系图保存为数据结构为的数据文件,并用邻接矩阵A表示;其中,V为本
    体概念集合、E为属性关系集合、为属性关系概念对。

    S32、设置农业领域本体概念间对象属性关系的评估指标,并根据评估指标设置判
    定集合Q。

    S33、根据评估指标对农业领域本体概念间对象属性关系进行评估,并将评估结果
    记录在判定集合Q中。

    本实施方式中,农业领域本体概念间对象属性关系的评估指标包括以下六项。

    ①可逆性:当概念A与概念B之间存在关系R,同时,概念B与概念A之间存在关系R-1,
    则称R具有可逆性。

    “可逆性”评估指标的判定可利用图理论相关知识进行。若在邻接矩阵A=(aij)中
    找到aij=1,aji=1,且从发现aij所对应的属性关系R1与aji所对应属性关系R2是互为逆关
    系,则满足“可逆性”。将判断结果记录在矩阵集合Q中。

    ②关系继承性:概念A与父概念B之间存在关系R,同时,概念A与子概念C之间也存
    在关系R,则称关系R具有关系继承性。

    关系继承性特征的判定需要结合分类关系体系。若aij=1,aik=1,并从发现aij和
    aik对应属性关系名R也相同,且发现vj和vk在分类关系体系中属于父子类关系,则满足“关
    系继承性”;若aij=1,aik≠1,则不满足“关系继承性”。并将判断结果记录在矩阵集合Q中。

    ③反向关系继承性:当父概念与概念A之间存在关系R,同时,其子概念与概念A之
    间也存在关系R,则称关系R具有反向关系继承性。

    反向关系继承性特征的判定需要结合分类关系体系。若aik=1,ajk=1,并从发现
    aik和ajk对应非分类关系名R也相同,且发现vi和vj在分类关系体系中属于父子类关系,则满
    足“关系反向继承性”;若aik=1,ajk≠1,则不满足“反向关系继承性”。并将判断结果记录在
    矩阵集合Q中。

    ④传递性:若概念A与概念B之间存在关系R,概念B与概念C之间存在关系R,同时,
    概念A与概念C之间存在关系R,则称关系R具有传递性。

    若在邻接矩阵A=(aij)中找到aij=1,ajk=1,且aik=1,并从发现属性关系名R也
    相同,即概念vi,vk之间的属性关系与“不具有传递性”这条性质相矛盾;在中找出aij,ajk,
    aik所对应的属性关系名,并将判断结果记录在矩阵集合Q中。

    ⑤对称性:若概念A和概念B有关系R,记作A=R(B),则概念B和概念A有关系R,记作
    B=R(A)。

    若在邻接矩阵A=(aij)中找到aij=1,aji=1,且从发现属性关系名也相同,即概
    念vi和vj与属性关系“不具有对称性”这条性质相矛盾,找到概念vi和vj以及它们之间所对
    应的属性关系,并将判断结果记录在矩阵集合Q中。

    ⑥自反性:概念A具有关系R,若R具有自反性,则A=R(A)。

    若在邻接矩阵A=(aij)中找到有aii=1(1≤i≤n)时,则这结果与属性关系“不具
    有自反性”这条性质相矛盾,找到aii所对应的概念和属性关系,并将判断结果记录在矩阵集
    合Q中。

    属性关系指某个概念是另一概念的属性,描述的是“事物的性质及其相互间的关
    系”。其中,对象属性关系用来关联两个概念,表达概念之间的非分类关系,属性关系具有逆
    反性、对称性、传递性等约束,其定义域和值域分别确定关联的两个类,属性名可按照实际
    情况命名。根据属性关系所具有的六项性质:具有可逆性、关系继承性、反向关系继承性和
    不具有传递性、对称性和自反性。本实施方式中,设置六项评估指标——自反性、对称性、可
    逆性、传递性、关系继承性、反向关系继承性,对非分类关系体系中的属性关系的评估的真
    实反应程度很高。

    S34、根据以上步骤将本体概念集合V和属性关系集合E中的所有概念和属性关系
    全部判定分析完成后,输出农业领域本体中的属性关系集合E、属性关系概念对以及判定
    结果集合Q。

    以下结合一种具体地采用以上农业领域本体有效性评估方法的茶树虫害本体评
    估系统对以上方法做进一步解释。

    为验证所提出的农业领域本体评估方法的可行性和有效性,具体可使用 Java语
    言,调用本体开发包Jena,在Eclipse开发平台上完成了茶树虫害本体评估的原型系统。该
    系统所使用的开发环境为Window7,开发平台为Eclipse3.3,JDK版本为1.8,Jena版本是
    Jena2.6.4。该原型系统可以对茶树虫害本体进行解析和评估。

    茶树虫害本体评估系统包括茶树虫害本体预处理???、茶树虫害本体的概念评估
    ???、茶树虫害本体的概念间分类关系评估??楹筒枋鞒婧Ρ咎宓母拍罴浞欠掷喙叵灯拦?br />???。参照图5,本系统的运行步骤包括。

    a)将已构建的茶树虫害本体导入本体评估系统。

    b)导入的茶树虫害本体进入本体预处理???,通过调用Jena包对本体中的概念、
    分类关系、非分类关系等进行解析。

    c)在茶树虫害本体的概念评估??橹?,采用步骤1)的评估农业领域本体概念方
    法,分别计算查全率、查准率和F指数,并输出查全率、查准率及F1指数的评估结果。

    d)在茶树虫害本体的概念间分类关系评估??橹?,采用步骤2)的评估农业领域本
    体概念间分类关系的方法,得到农业领域本体概念间分类关系的相似度计算结果集合S和
    一致性、准确性及简洁性判断结果,并输出。

    e)在茶树虫害本体的概念间非分类关系评估??橹?,采用步骤3)的评估农业领域
    本体概念间非分类关系的方法对属性关系的六个评估指标分别进行评估,并输出。本步骤
    具体地,茶树虫害本体中的属性关系经过解析后,以属性关系名、定义域、值域的形式显示
    在系统中,并采用基于图理论的非分类关系评估方法对属性关系的六个评估指标分别进行
    评估,并在系统中显示非分类关系评估结果。

    通过对系统的测试分析,本发明取得了良好的效果,验证了该方法的可行 性和有
    效性。茶树虫害本体评估原型系统利用基于领域词典的概念评估方法、基于概念语义相似
    度的分类关系评估方法和基于图理论的非分类关系评估方法可以有效解决农业领域本体
    评估问题,有效评估已构建的农业领域本体的质量,评估现有的自动或者半自动本体构建
    方法的可行性,指导本体工程师构建出更高质量的农业本体,为农业领域相关用户提供更
    适合的农业本体,对于深入开展农业本体评估的基础理论与关键技术研究,具有一定的现
    实意义和实际研究价值。

    以上所述,仅为本发明较佳的具体实施方式,但本发明的?;し段Р⒉痪窒抻诖?,
    任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其
    发明构思加以等同替换或改变,都应涵盖在本发明的?;し段е?。

    关于本文
    本文标题:一种农业领域本体有效性评估方法.pdf
    链接地址://www.4mum.com.cn/p-6013875.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 微信猜单双 七星彩49组码稳赚数据 pk10三码必中规律 pc加拿大怎么算技巧 pk10前三直选技巧 稳赚 领航时时计划软件免费版 幸运飞艇一期五码计划稳定 时时彩漏洞稳赚技巧 k10计划安卓免费版 我耍机选双色球 排列三组选六2468 最好用的彩票计划软件下载 幸运28全包稳赚模式 逆袭彩票计划软件官网 极速pk10计划两期计划 小鱼儿36码论坛