• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 12
    • 下载费用:30 金币  

    助赢重庆时时彩预测软件下载: 一种基于条件随机场的中文兼类词识别方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201510096284.3

    申请日:

    2015.03.04

    公开号:

    CN104750779A

    公开日:

    2015.07.01

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20150701|||实质审查的生效IPC(主分类):G06F 17/30申请日:20150304|||公开
    IPC分类号: G06F17/30; G06F17/27 主分类号: G06F17/30
    申请人: 华东师范大学
    发明人: 费凡; 徐文超; 杨雁峰; 刘云鹏; 汤俊; 杨艳琴
    地址: 200062上海市普陀区中山北路3663号
    优先权:
    专利代理机构: 上海麦其知识产权代理事务所(普通合伙)31257 代理人: 董红曼
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510096284.3

    授权公告号:

    ||||||

    法律状态公告日:

    2018.06.19|||2015.07.29|||2015.07.01

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于条件随机场的中文兼类词识别方法,包括:获取与兼类词相关的词条,从词条中获得语料;对语料进行切分生成语块,同时在语块中生成每个文字的语块特征;对文字进行词性标注,获得文字的词性特征,利用语块特征和词性特征标注文字;随机选择一部分语料进行训练,其余的语料进行测试,得到第一实验结果;根据语料的特征修改特征模板,修改后继续对语料进行训练和测试,得到第二实验结果;对第一实验结果和第二实验结果进行度量标准的性能比对,提高对于兼类词的识别。本发明对电商领域的中文兼类词用条件随机场进行识别,修改原有条件随机场特征模板的特征后,使得识别兼类词的精确率、召回率以及f值均得到提高。

    权利要求书

    权利要求书
    1.  一种基于条件随机场的中文兼类词识别方法,其特征在于,包括以下步骤:
    步骤1:在电商领域内搜索一中文兼类词,获取与所述兼类词相关的词条,从所述词条中获得具有电商领域特征的语料;
    步骤2:对所述语料进行切分生成语块,同时在所述语块中生成每个文字的语块特征;
    步骤3:对所述文字进行词性标注,获得所述文字的词性特征,利用所述语块特征和所述词性特征标注所述文字;
    步骤4:随机选择一部分语料在条件随机场中进行训练,其余的语料在所述条件随机场中进行测试,得到第一实验结果;
    步骤5:根据所述语料的特征修改所述条件随机场中的特征模板,修改后继续对所述条件随机场中的所述语料进行训练和测试,得到第二实验结果;
    步骤6:对所述第一实验结果和所述第二实验结果进行度量标准的性能比对,提高对于兼类词的识别。

    2.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤1包括如下步骤:
    步骤1a:在电商领域内,按所述兼类词的名词形式进行搜索,获得与所述名词形式相关的词条,将其中与商品名一致的词条归为语料,把不符合的词条修改成对应的商品名后归为语料;
    步骤1b:按所述兼类词的形容词形式进行搜索,获得与所述形容词形式相关的词条,将其中与商品名一致的词条归为语料,把不符合的词条修改成对应的商品名后归为语料。

    3.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤2中,根据电商领域内产品所含内容,将所述词条切分成制造商块,产地块,品牌块,商品名块,以及净含量块。

    4.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤2中,若所述语块中包含两个以上文字,则第一个文字的语块特征为初始词,其余文字的语块特征为紧随词;若所述语块包含一个文字,则所述文字的语块特征为独立的块。

    5.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤3,所述词性特征包括名词、动词、形容词。

    6.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤4包括如下步骤:
    步骤4a:从所述语料中随机选择含有一个兼类词的形容词形式或名词形式的语料归入所述条件随机场的训练集进行训练,含有所述兼类词的另一部分形容词形式所述名词形式的语 料归入所述条件随机场的测试集进行测试;
    步骤4b:完成训练和测试后,重复执行步骤4a随机选取另一个语料进行训练和测试,直至对所有语料完成训练和测试。

    7.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤5包括如下步骤:
    步骤5a:更改所述条件随机场的特征模板中词性关联的组合特征;
    步骤5b:返回步骤4重新训练每个兼类词的训练集以及测试每个兼类词的测试集,得到第二实验结果。

    8.  如权利要求1所述的基于条件随机场的中文兼类词识别方法,其特征在于,所述步骤6包括如下步骤:
    步骤6a:用基于Perl脚本语言编写的Conll 2000算法分别对所述第一实验结果和所述第二实验结果进行三个度量标准的性能比对;所述度量标准为精确率、召回率和f值;
    步骤6b:若所述第二实验结果低于所述第一实验结果,则返回步骤5对所述特征模板进行修改并重新得到第二实验结果,直至所述第二实验结果优于所述第一实验结果为止。

    关 键 词:
    一种 基于 条件 随机 中文 兼类词 识别 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种基于条件随机场的中文兼类词识别方法.pdf
    链接地址://www.4mum.com.cn/p-5894551.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03