• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 7
    • 下载费用:30 金币  

    重庆时时彩单双路珠: 文字数据“了”的语法功能机器软件分析技术.pdf

    关 键 词:
    文字 数据 语法 功能 机器 软件 分析 技术
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201010127004.8

    申请日:

    2010.03.18

    公开号:

    CN102193911A

    公开日:

    2011.09.21

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06F 17/27申请公布日:20110921|||实质审查的生效IPC(主分类):G06F 17/27申请日:20100318|||公开
    IPC分类号: G06F17/27 主分类号: G06F17/27
    申请人: 孙军堂
    发明人: 孙军堂
    地址: 222534 江苏省灌南县北陈集镇大友村四组
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201010127004.8

    授权公告号:

    ||||||

    法律状态公告日:

    2013.12.04|||2012.05.02|||2011.09.21

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    本技术是基于语法分析,对中文文字数据“了”的语法功能分析和英文词汇形式筛选的计算机程序。它能够分析出该文字数据在使用时的语法成分,判断它所表达的句子时态,并从数据库中筛选出相应的英文词汇数据。本技术通过计算机建立一个有标注属性的中英文词汇数据库、语法分析??榈?,利用分词技术把句子分成语素并对其语法分析,实现句子的时态判断和对此数据的词汇形式筛选。本技术能够让机器利用标准化的流程和程序分析中文语句的时态逻辑,以利于机器在中英文语言翻译中准确地表达语句的时态逻辑,提高文字数据的理解逻辑和词汇的正确性。

    权利要求书

    1.一种针对中文数据“了”的时态语法功能和词汇筛选的机器软件分析算法程序,基于计算机硬件平台,由词汇数据库、语法属性分析??榱鞒坦芾沓绦?、数据“了”判断??榕涮自诵?;其特征是:词汇数据库中的词汇数据“了”采用多项属性值标注,对与数据“了”有相关运算的其它词汇数据也采用此方法作出属性标注;通过数据“了”判断??槎源耸菰谟τ糜锞渲械挠锓ǔ煞址治?,完成对语句的时态判断、对部分词汇数据为动词属性的优先判断和数据“了”的英文词汇形式筛选。2.根据权利要求1所述的程序,数据“了”在词汇数据库中的特征是:同时存在多个数据“了”的条目,并且每一个数据“了”的条目有多个属性值。3.根据权利要求1所述的程序,数据“了”判断??槌绦虻奶卣魇牵阂允荨傲恕钡氖粜晕握仗?,对比A数据的属性,并赋于数据“了”的新属性。4.根据权利要求1所述的程序,数据“了”判断??槌绦虻奶卣魇牵阂允荨傲恕钡氖粜晕握仗?,查询应用语句中是否存在有特殊属性的数据,并依此赋于数据“了”的新属性。5.根据权利要求1所述的程序,数据“了”判断??樗卸系氖荨傲恕钡挠⑽氖菪问轿癶ave”、“has”或“had”。6.根据权利要求1所述的程序,数据“了”判断??樗卸系牡笔荨傲恕蔽挥诿屎笫?,如果句子中有表示过去时间的特征词汇数据时,句子时态为过去完成时;否则为现在完成时。7.根据权利要求1所述的程序,数据“了”判断??樗卸系牡笔荨傲恕蔽挥诙屎笫?,如果句子中有表示过去时间的特征词汇数据时,句子时态为过去完成时;否则为现在完成时。8.根据权利要求1所述的程序,数据“了”判断??樗卸系牡笔荨傲恕蔽挥凇案?、“经特殊标注的中文姓氏”数据后时,优先判断这些数据为动词属性。9.根据权利要求1所述的程序,数据“了”判断??樗卸系牡笔荨傲恕蔽挥凇案贝驶蛐稳荽省笔莺?,且句子中没有动词数据时,优先判断数据“了”为助词属性,英文词汇形式为“is”或“am”或“are”。

    说明书

    文字数据“了”的语法功能机器软件分析技术

    技术领域:

    本技术涉及一种基于中文文字数据“了”的流程分析算法,实现判断其表达的句子时态逻辑、应用语法属性及其应用词汇数据等功能,该算法通过语法逻辑分析,实现对此数据在实际应用中的时态逻辑功能分析和词汇筛选。

    背景技术:

    目前,语言翻译行业内基于机器对词汇数据的语法分析没有形成系统的突破,尚无成形的可应用技术。尤其是对“了”在语言应用中独有的逻辑表达功能以及它在语言翻译中客观存在的专用词汇没有明确的认识。目前的技术更多的是从抽象的、繁琐的语料训练等技术角度筛选词汇,不能有效地分析出词汇在使用时的语法成分,无法把词汇数据中尤其是中文词汇数据中一词多义和多词一义的情况识别清楚,也不能合理地体现句子中存在的时态逻辑对句子逻辑理解的重要性,无法有效地体现自然语法学的逻辑性和技术性等科学特征。

    发明内容:

    本技术通过计算机运行程序控制语法分析??榈姆治隽鞒?,针对词汇数据“了”在应用数据流中不同的情况有针对性地自动分析出数据“了”在句子中所属的语法成分,并判断句子的时态逻辑。通过数据“了”对“给”、“经特殊标注的姓氏”等文字数据的动词性语法属性影响以及对“副词”文字数据的助词性语法属性影响采用优先判断,进而实现相应的词汇筛选。

    本发明的技术方案是:

    建立一个基于PC机软件开发环境下的中英文词汇数据库,以作为应用程序运行的基??;

    然后利用分词技术并通过查表的方式从词汇数据库中读取相关数据相应的各类属性。

    根据语言类别1的要求,由语法属性分析??榱鞒坦芾沓绦蚍治龀绦虿檠莸氖粜郧榭鼍龆ㄊ欠竦饔门卸夏?樵怂闶莸氖粜?。判断??楦菔莸木咛迨褂们榭?,查询算法内部的条件表达式,分析出相关数据的语法属性。

    根据语言类别2的要求和已判断出的语法属性数据值查询数据库,并转换出相应的中文或英文词汇数据。

    附图说明:

    图1为处理器的流程控制程序;它包含:

    1-1为开始;

    1-2为语言类别1判断;

    1-3为句子分词判断;

    1-4为语法属性判断??楣芾沓绦?;

    1-5为数据“了”判断???;

    1-6为查询数据库;

    1-7为语言类别2判断;

    1-8为输出显示;

    1-9为结束;

    图2为数据1-5“了”判断??榈氖迪殖绦?;它包含下列子??椋?/p>

    2-1为数据“了”对于部分词汇数据优先的语法属性判断;

    2-2为数据“了”的时态逻辑属性判断;

    2-3为数据“了”针对代词作为宾语时的宾格属性判断的部分条件功能;

    ???为数据“了”的词汇形式筛选???。

    采用本技术显著的效果是:能够分析出数据“了”在文字数据中所体现的对句子时态逻辑的表达功能,及其对部分文字数据的语法属性的特殊影响,进而实现优先判断,并筛选出符合其特征的词汇,有利于机器在文字翻译中系统地实现对句子的动作逻辑和时态逻辑的理解和表达,提高文字翻译的准确率。

    具体实施方式:

    本发明通过在数据库中对“了”以及与其有相关运算的词汇数据的属性标注,经分词后把分词时所读取的相关词汇数据的属性,调用“了”判断???。该??橥ü欢ǖ牧鞒坦芾砗蜕杓频穆呒惴?,判断出“了”的语法属性;由所判断的属性查询数据库,并根据语言类别2的要求输出结果。

    本发明在实施时,首先要建立一个语言类别1判断的???,以便于运行相关语言的分词程序。分词的目的是把语句切割为多个词汇,以便于数据库与程序之间的数据查询和数据交换。分词时同时读取相关词汇数据的属性,当语法属性分析??榱鞒坦芾沓绦虿檠接小傲恕钡氖粜允?,运行“了”的语法判断程序。

    “了”的语法判断??槌绦虬凑丈瓒ǖ牧鞒趟承蛟怂闶荨傲恕痹谟τ镁渥又械挠锓ㄊ粜?。它包含四个子???,具体实现方式为:

    ???:“了”对于部分词汇数据优先的语法属性判断,此??橛τ糜谟锓ǚ治鍪?,由管理程序优先置于控制流程的首部运行,以分析“给、动词1、动词2、去、副词、经特殊标注的姓氏”等数据在客观应用时优先作为动词的语法属性。

    ???的技术原理为:以A数据的属性1对比B数据的属性1,并赋于B数据的新属性。实现方式为:如果查询到句子中有“了”存在,则继续查询直接位于它前面的数据属性1,如果那些数据的属性1为:

    1、“给”时,则此数据的新属性为动词;

    2、“副词或形容词”时,且句子中没有动词时,则此数据的新属性为助词;

    3、经特殊标注的“中文姓氏”数据时,则此数据的新属性为动词;

    ???:“了”的时态逻辑属性判断。此??橛τ糜诜治鼍渥拥氖碧呒?,以便于机器准确地识别和转达,从而让阅读者准确地理解句子的逻辑。

    ???的技术原理与???的技术原理相同。但需要参考几个特殊的条件。实现方式为:

    当查询句子中有“了”时,

    1、如果它位于名词的后面,并且同时查询到句子中存在有属性2值为1的代词与去(包含否定式)连用时,则“了”所表达的句子时态的逻辑为一般将来时,或者如果句子中的谓语位于句首时,也表示一般时;否则为完成时;

    2、如果它位于动词的后面,则它所表达的句子时态逻辑为一般过去时;

    3、如果句子中查询到有表示过去时间的特征数据时,当此数据的属性2的值为50时,则“了”所表达的时态逻辑为完成时;当此数据的属性2值为0时,则“了”所表达的句子的时态逻辑为过去完成时。

    ???:“了”对于代词作为宾语时的宾格属性判断的部分条件功能。它用于代词在句子中作为宾语语法属性时,判断出它的宾格属性并以此筛选出相应的词汇数据。它的技术原理与???技术原理相同,实现方式为:

    当句子中有数据“了”时,如果它后面的数据为代词数据,则它们的词汇形式为宾格。新属性为名词,且属性2为3。

    ???:数据“了”的词汇形式筛选???,用于当数据“了”所表达的时态属性为现在完成时,过去完成时,此时,数据“了”具有自己的英文词汇形式“have,has”或“had”。此??橹饕攵缘笔荨傲恕彼泶锏氖碧衷谕瓿?时,“了”的英文词汇形式因主语的语法属性而存在的词汇形式变化现象。实现方式为:

    当主语为第一、第二人称单数或复数时,它的英文词汇形式为“have”;当主语为第三人称或非第一、第二人称单数时,它的英文词汇形式为“has”。

    依据判断??榈贸龅氖粜灾挡檠菘?,视语言类别2的要求输出相应的词汇形式。

    作为软件程序运行和交换数据基础的数据库,它是利用当前计算机的硬件平台,在windows??C++软件环境下建立一个中文语法分析??槌绦?,并通过用户接口(如键盘和显示器)建立一个基于PC机软件开发环境下的中文词汇数据库,它是包含“了”的所有常规词汇数据表;并在数据的属性1、属性2等多个属性值下以可读取的代码标注它们在具体使用时客观存在的语法属性。同时视客观情况对应地给予一个与此数据含义和属性相对应的英文词汇数据。以作为应用软件调用??榉治龀绦虻囊谰?,实现分析此数据在使用时所表达的语法逻辑功能。数据库的调用是根据语法分析??榉治龀隼吹氖莸氖粜?、属性2等,调用数据库检索与属性1、属性2等相同的或与属性1、属性2等最大符合的数据,临时保存该词汇数据。当主程序需要时通过用户界面(如电脑显示屏等)输出该词汇的英文或中文形式。

    关于本文
    本文标题:文字数据“了”的语法功能机器软件分析技术.pdf
    链接地址://www.4mum.com.cn/p-5866033.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 极速11选5官网天天计划 北京十一选五走势图爱彩乐的 山东时时彩11选5 贵州十一选五预则 全民欢乐捕鱼礼包兑换码领取 股票融资费用包括哪些 浙江体彩排列三走势图 排列5走势 曾道人图库 足球分析赚钱 复式双色球多少 云南时时彩基本走势图 划水宁夏麻将有挂吗 内蒙古时时彩开奖结果 21点规则官网安卓版 今天四川快乐12推荐号