• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 15
    • 下载费用:30 金币  

    重庆时时彩360奖结果: 一种文档检查方法及装置.pdf

    关 键 词:
    一种 文档 检查 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201510420079.8

    申请日:

    2015.07.16

    公开号:

    CN106354731A

    公开日:

    2017.01.25

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20150716|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 中兴通讯股份有限公司
    发明人: 张晋
    地址: 518057 广东省深圳市南山区高新技术产业园科技南路中兴通讯大厦
    优先权:
    专利代理机构: 北京银龙知识产权代理有限公司 11243 代理人: 许静;安利霞
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201510420079.8

    授权公告号:

    |||

    法律状态公告日:

    2018.03.09|||2017.01.25

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明提供一种文档检查方法及装置,其文档检查方法包括:分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。本发明实施例利用文档结构数据和相关参数对第一文档和第二文档进行比较,进而确定第一文档和第二文档的是否差异并定位其差异的位置,提高了文档检查的效率,节省了大量人力。

    权利要求书

    1.一种文档检查方法,其特征在于,包括:
    分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所
    述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的
    至少一个;
    比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述
    第一文档和所述第二文档的是否存在差异并输出比较结果。
    2.根据权利要求1所述的文档检查方法,其特征在于,所述第二文档为利
    用预设语言对第一文档进行翻译得到的翻译文档。
    3.根据权利要求2所述的文档的检查方法,其特征在于,所述文档的段落
    数据包括:段落数目、段落序号和每一段落包含的字符数;
    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;
    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以
    及每个表格包含的字符数。
    4.根据权利要求3所述的文档检查方法,其特征在于,所述比较所述第一
    文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第
    二文档的是否存在差异并输出比较结果,具体包括:
    依次获取第一文档和第二文档中同一段落序号对应的段落包含的字符数的
    比值;
    若所述比值均在一预设范围内,确定所述第一文档和第二文档的段落数据
    不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的段
    落存在差异。
    5.根据权利要求3所述的文档检查方法,其特征在于,所述比较所述第一
    文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第
    二文档的是否存在差异并输出比较结果,具体包括:
    依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值;
    若所述比值均在一预设范围内,确定所述第一文档和第二文档的图数据不
    存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存
    在差异。
    6.根据权利要求3所述的文档检查方法,其特征在于,所述比较所述第一
    文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第
    二文档的是否存在差异并输出比较结果,具体包括:
    依次获取第一文档和第二文档中同一表格序号对应的表格包含的字符数的
    比值,并依次比较第一文档和第二文档中同一表格序号对应的表格的表格行数
    和表格列数;
    若所述比值均在一预设范围内,且对应的表格行数和表格列数均相等,确
    定所述第一文档和所述第二文档的表格数据不存在差异;否则,第一文档和第
    二文档中超出所述预设范围的比值对应的表格存在差异或者第一文档和第二文
    档中表格行数和表格列数不相等的表格存在差异。
    7.根据权利要求3所述的文档检查方法,其特征在于,若所述文档的图数
    据还包括图长度和图宽度,所述比较所述第一文档的文档结构数据和第二文档
    的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比
    较结果,具体包括:
    依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,
    并依次比较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;
    若所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所
    述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超
    出所述预设范围的比值对应的图存在差异或者第一文档和第二文档中图长度和
    图宽度不相等的图存在差异。
    8.一种文档检查装置,其特征在于,包括:
    获取???,用于分别获取第一文档的文档结构数据和第二文档的文档结构
    数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档
    的表格数据中的至少一个;
    比较???,用于比较所述第一文档的文档结构数据和第二文档的文档结构
    数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。
    9.根据权利要求8所述的文档检查装置,其特征在于,所述第二文档为利
    用预设语言对第一文档进行翻译得到的翻译文档。
    10.根据权利要求9所述的文档的检查装置,其特征在于,所述文档的段落
    数据包括:段落数目、段落序号和每一段落包含的字符数;
    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;
    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以
    及每个表格包含的字符数。
    11.根据权利要求10所述的文档检查装置,其特征在于,所述比较??榘?br />括:
    第一获取???,用于依次获取第一文档和第二文档中同一段落序号对应的
    段落包含的字符数的比值;
    第一比较子???,用于若所述比值均在一预设范围内,确定所述第一文档
    和第二文档的段落数据不存在差异;否则,第一文档和第二文档中超出所述预
    设范围的比值对应的段落存在差异。
    12.根据权利要求10所述的文档检查装置,其特征在于,所述比较??榘?br />括:
    第二获取???,用于依次获取第一文档和第二文档中同一图序号对应的图
    包含的字符数的比值;
    第二比较子???,用于若所述比值均在一预设范围内,确定所述第一文档
    和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设
    范围的比值对应的图存在差异。
    13.根据权利要求10所述的文档检查装置,其特征在于,所述比较??榘?br />括:
    第三获取???,用于依次获取第一文档和第二文档中同一表格序号对应的
    表格包含的字符数的比值,并依次比较第一文档和第二文档中同一表格序号对
    应的表格的表格行数和表格列数;
    第三比较子???,用于若所述比值均在一预设范围内,且对应的表格行数
    和表格列数均相等,确定所述第一文档和所述第二文档的表格数据不存在差异;
    否则,第一文档和第二文档中超出所述预设范围的比值对应的表格存在差异或
    者第一文档和第二文档中表格行数和表格列数不相等的表格存在差异。
    14.根据权利要求10所述的文档检查装置,其特征在于,所述比较??榘?br />括:
    第四获取???,用于若所述文档的图数据还包括图长度和图宽度,依次获
    取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,并依次比
    较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;
    第四比较子???,用于若所述比值均在一预设范围内,且对应的图长度和
    图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则,第
    一文档和第二文档中超出所述预设范围的比值对应的图存在差异或者第一文档
    和第二文档中图长度和图宽度不相等的图存在差异。

    说明书

    一种文档检查方法及装置

    技术领域

    本发明涉及通信技术领域,特别涉及一种文档检查方法及装置。

    背景技术

    随着科技的发展,信息的流通速度越来越快。文档会被翻译成其他语言在其他国家或地域发行,但是文档被翻译成其他语言后,可以由于翻译的失误导致文档翻译有错误或遗漏;而这方便的检查一直靠人工进行,没有相应的检查方法。人工检查的方法费时较多,浪费大量人力且效率不高。

    发明内容

    本发明的目的在于提供一种文档检查方法及装置,解决了人工检查文档费时多且效率不高的问题,提高了对文档检查的效率。

    为了达到上述目的,本发明提供一种文档检查方法,包括:

    分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;

    比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。

    其中,所述第二文档为利用预设语言对第一文档进行翻译得到的翻译文档。

    其中,所述文档的段落数据包括:段落数目、段落序号和每一段落包含的字符数;

    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;

    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以及每个表格包含的字符数。

    其中,所述比较所述第一文档的文档结构数据和第二文档的文档结构数据, 确定所述第一文档和所述第二文档的是否存在差异并输出比较结果,具体包括:

    依次获取第一文档和第二文档中同一段落序号对应的段落包含的字符数的比值;

    若所述比值均在一预设范围内,确定所述第一文档和第二文档的段落数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的段落存在差异。

    其中,所述比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果,具体包括:

    依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值;

    若所述比值均在一预设范围内,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异。

    其中,所述比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果,具体包括:

    依次获取第一文档和第二文档中同一表格序号对应的表格包含的字符数的比值,并依次比较第一文档和第二文档中同一表格序号对应的表格的表格行数和表格列数;

    若所述比值均在一预设范围内,且对应的表格行数和表格列数均相等,确定所述第一文档和所述第二文档的表格数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的表格存在差异或者第一文档和第二文档中表格行数和表格列数不相等的表格存在差异。

    其中,若所述文档的图数据还包括图长度和图宽度,所述比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果,具体包括:

    依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,并依次比较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;

    若所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异或者第一文档和第二文档中图长度和 图宽度不相等的图存在差异。

    本发明实施例还提供一种文档检查装置,包括:

    获取???,用于分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;

    比较???,用于比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。

    其中,所述第二文档为利用预设语言对第一文档进行翻译得到的翻译文档。

    其中,所述文档的段落数据包括:段落数目、段落序号和每一段落包含的字符数;

    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;

    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以及每个表格包含的字符数。

    其中,所述比较??榘ǎ?/p>

    第一获取???,用于依次获取第一文档和第二文档中同一段落序号对应的段落包含的字符数的比值;

    第一比较子???,用于若所述比值均在一预设范围内,确定所述第一文档和第二文档的段落数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的段落存在差异。

    其中,所述比较??榘ǎ?/p>

    第二获取???,用于依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值;

    第二比较子???,用于若所述比值均在一预设范围内,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异。

    其中,所述比较??榘ǎ?/p>

    第三获取???,用于依次获取第一文档和第二文档中同一表格序号对应的表格包含的字符数的比值,并依次比较第一文档和第二文档中同一表格序号对应的表格的表格行数和表格列数;

    第三比较子???,用于若所述比值均在一预设范围内,且对应的表格行数和表格列数均相等,确定所述第一文档和所述第二文档的表格数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的表格存在差异或者第一文档和第二文档中表格行数和表格列数不相等的表格存在差异。

    其中,所述比较??榘ǎ?/p>

    第四获取???,用于若所述文档的图数据还包括图长度和图宽度,依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,并依次比较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;

    第四比较子???,用于若所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异或者第一文档和第二文档中图长度和图宽度不相等的图存在差异。

    本发明的上述技术方案至少具有如下有益效果:

    本发明实施例的文档检查方法及装置中,利用文档结构数据和相关参数对第一文档和第二文档进行比较,进而确定第一文档和第二文档的是否差异并定位其差异的位置,提高了文档检查的效率,节省了大量人力。

    附图说明

    图1表示本发明实施例的文档检查方法的基本步骤流程图;

    图2表示本发明实施例的文档检查方法的具体实施例的详细步骤图;

    图3表示本发明实施例的文档检查装置的组成结构示意图。

    具体实施方式

    为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。

    本发明针对现有技术中人工检查文档费时多且效率不高的问题,提供一种文档检查方法及装置,利用文档结构数据和相关参数对第一文档和第二文档进行比较,进而确定第一文档和第二文档的是否差异并定位其差异的位置,提高了文档检查的效率,节省了大量人力。

    如图1所示,本发明实施例提供一种文档检查方法,包括:

    步骤11,分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;

    步骤12,比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。

    本发明的上述实施例中,文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;具体的,若一篇文档仅包括文字部分,则文档结构数据为文档的段落数据;若一篇文档包括文字部分和图表部分,则文档结构数据包括文档的段落数据、图数据以及表格数据;其具体的文档结构数据根据具体的文档具体确定。

    进一步的,步骤12中比较第一文档的文档结构数据和第二文档的文档结构数据为分别比较,即将第一文档的段落数据与第二文档的段落数据比较,或者将第一文档的图数据与第二文档的图数据比较,或者将第一文档的表格数据与第二文档的表格数据比较;进而确定第一文档和第二文档是否差异并输出比较结果,即若不存在差异,则输出第一文档与第二文档一致;若存在差异,则输出差异位置,使得检查人员能够快速找到差异位置,再次进行人工核实,避免了人工全篇核对都人工造成的浪费,提高文档的检查效率。

    具体的,本发明的上述实施例提供的文档检查方法通常用于对翻译文档的检查,即所述第二文档为利用预设语言对第一文档进行翻译得到的翻译文档。例如第一文档为英文文档,第二文档则为将上述英文文档翻译为中文后得到的中文文档。

    较佳的,实际应用中,针对原文档和翻译文档,其包含字符数应该在一合理的差值范围内,其包含的图和表格应该一致。具体的,本发明的上述实施例中所述文档的段落数据包括:段落数目、段落序号和每一段落包含的字符数;

    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;

    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以及每个表格包含的字符数。

    承续上例,本发明的上述实施例中,步骤12具体包括:

    步骤121,依次获取第一文档和第二文档中同一段落序号对应的段落包含的字符数的比值;

    步骤122,若所述比值均在一预设范围内,确定所述第一文档和第二文档的段落数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的段落存在差异。

    本发明的具体实施例中步骤121和步骤122具体描述对第一文档的段落数据和第二文档的段落数据的比较。首先比较其对应段落的字符数,其中,同一段落序号对应的段落具体指第一文档的第一段落与第二文档的第一段落比较,第一文档的第二段落与第二文档的第二段落对比,依次类推。其中预设范围是根据原语言与翻译语言预先设定,不限于一固定值,该预设范围可由系统根据原语言和翻译语言自动设定也可开放给用户,由用户进行自行设定,不限于一固定方式,可根据实际应用场景实际确定。具体的,若比值在预设范围内,则第一文档和第二文档的段落数据不存在差异,且若该文档仅有文字部分,则表明第一文档和第二文档不存在差异;若任一比值超出预设范围,则超出该预设范围的比值对应的段落存在差异,即翻译存在不正确的可能性,需进行后续的进一步检查。

    承续上例,本发明的上述实施例中,步骤12具体包括:

    步骤123,依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值;

    步骤124,若所述比值均在一预设范围内,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异。

    具体的,与上述段落数据的比较方法一致,将第一文档和第二文档中的图依次进行比较,确定第一文档和第二文档的图数据是否存在差异。需要说明的是,若第一文档中包含3幅图、第二文档中包含4幅图;当第二文档的第四幅图需要和第一文档的第四幅图进行比较时发现第一文档中不包含第四幅图,此时将第四幅图的所有数据设为0,与第二文档的第四幅图的数据进行比较,进而判定第二文档中的第四幅图存在差异。

    承续上例,本发明的上述实施例中,步骤12具体包括:

    步骤125,依次获取第一文档和第二文档中同一表格序号对应的表格包含的字符数的比值,并依次比较第一文档和第二文档中同一表格序号对应的表格的表格行数和表格列数;

    步骤126,若所述比值均在一预设范围内,且对应的表格行数和表格列数均相等,确定所述第一文档和所述第二文档的表格数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的表格存在差异或者第一文档和第二文档中表格行数和表格列数不相等的表格存在差异。

    需要说明的是,由于表格的特殊性,与上述段落数据及图数据不同的是,表格数据除了要比较对应的表格包含的字符数,还需比较对应的表格的行数和列数;当包含的字符数的比值在预设范围内,且对应的表格的行数和列数均相等的时候判定第一文档和第二文档的表格数据不存在差异;否则确定差异点,若是字符数的比值超出预设范围,则该比值对应的表格存在差异;若是表格行数或表格列数不相等,则该不相等的表格之间存在差异。

    特殊的,针对一些特定的应用场景有时候会要求原文档和翻译文档中图的长度和宽度保持一致,则在该种情况下,所述文档的图数据还包括图长度和图宽度,进而步骤12具体包括:

    步骤127,依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,并依次比较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;

    步骤128,若所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异或者第一文档和第二文档中图长度和图宽度不相等的图存在差异。

    与上述表格的比较方法类似,该场景下除了比较字符数之外还需比较图的长度和宽度,当所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则确定差异点,若是字符数的比值超出预设范围,则该比值对应的图存在差异;若是图宽度或图长度不相等,则该不相等的图之间存在差异。

    下面结合一具体实施例对本发明提供的文档检查进行详细描述,如图2所 示:

    有两篇文档需要进行比较:一篇原文,一篇是对应的译文。

    步骤1,配置翻译文档比较参数,即配置原文与译文的字符数比例范围。后续在统计出原文和译文的字符数后,如果原文与译文的字符比例范围在配置的范围内则认为是正常的;如果原文与译文的字符比例范围超过了配置的范围则认为译文和原文不符;比较参数设置如表1所示:

    原文:译文(字符比例) 1:1.5至1:2

    表1 比较参数设置表

    步骤2,统计原文中的段落数据(段落数目,段落序号,段落长度),记录入原文文档结构数据中。

    步骤3,统计原文中的表格数据(表格数目,表格序号,表格行数,表格列数,表格包含的字符数),记录入原文文档结构数据中。

    步骤4,统计原文中的图数据(图数目,图序号,图长度,图宽度,图包含的字符数),记录入原文文档结构数据中。则原文文档结构数据如表2所示:

    表2 原文的文档结构数据表

    步骤5,统计译文中的段落数据(段落数目,段落序号,段落长度),记录入译文文档结构数据中。

    步骤6:统计译文中的表格数据(表格数目,表格序号,表格行数,表格列数,表格包含的字符数),记录入译文文档结构数据中。

    步骤7:统计译文中的图数据(图数目,图序号,图长度,图宽度,图包含的字符数),记录入译文文档结构数据中。译文文档结构数据如表3所示。

    表3 译文的文档结构数据表

    步骤8:分析统计数据,比较原文和译文是否有差异;得到原文与译文的字符比例,如表4所示(其他的比较结果的表不一一示出):

    表4 原文与译文的段落字符数比

    步骤9:输出比较结果。其中:译文中段落3的问题是原文译文的字符比例超出正常范围;译文中图3的问题是原文没有这张图。

    需要说明的是,其比较结果的呈现形式可预先设定,例如在表2和表3上 将存在差异的地方用不同颜色示出,或者通过软件代码等将其转换为文字直观的输出,在此不作具体说明。

    为了更好的实现上述目的,如图3所示,本发明实施例还提供一种文档检查装置,包括:

    获取???1,用于分别获取第一文档的文档结构数据和第二文档的文档结构数据;其中,所述文档结构数据包括文档的段落数据、文档的图数据以及文档的表格数据中的至少一个;

    比较???2,用于比较所述第一文档的文档结构数据和第二文档的文档结构数据,确定所述第一文档和所述第二文档的是否存在差异并输出比较结果。

    具体的,本发明的上述实施例中,所述第二文档为利用预设语言对第一文档进行翻译得到的翻译文档。

    具体的,本发明的上述实施例中,所述文档的段落数据包括:段落数目、段落序号和每一段落包含的字符数;

    所述文档的图数据包括:图数目、图序号以及每幅图包含的字符数;

    所述文档的表格数据包括:表格数目、表格序号、表格行数、表格列数以及每个表格包含的字符数。

    具体的,本发明的上述实施例中,所述比较???2包括:

    第一获取???,用于依次获取第一文档和第二文档中同一段落序号对应的段落包含的字符数的比值;

    第一比较子???,用于若所述比值均在一预设范围内,确定所述第一文档和第二文档的段落数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的段落存在差异。

    具体的,本发明的上述实施例中,所述比较???2包括:

    第二获取???,用于依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值;

    第二比较子???,用于若所述比值均在一预设范围内,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异。

    具体的,本发明的上述实施例中,所述比较???2包括:

    第三获取???,用于依次获取第一文档和第二文档中同一表格序号对应的表格包含的字符数的比值,并依次比较第一文档和第二文档中同一表格序号对应的表格的表格行数和表格列数;

    第三比较子???,用于若所述比值均在一预设范围内,且对应的表格行数和表格列数均相等,确定所述第一文档和所述第二文档的表格数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的表格存在差异或者第一文档和第二文档中表格行数和表格列数不相等的表格存在差异。

    具体的,本发明的上述实施例中,所述比较???2包括:

    第四获取???,用于若所述文档的图数据还包括图长度和图宽度,依次获取第一文档和第二文档中同一图序号对应的图包含的字符数的比值,并依次比较所述第一文档和第二文档中同一图序号对应的图的图长度和图宽度;

    第四比较子???,用于若所述比值均在一预设范围内,且对应的图长度和图宽度均相等,确定所述第一文档和第二文档的图数据不存在差异;否则,第一文档和第二文档中超出所述预设范围的比值对应的图存在差异或者第一文档和第二文档中图长度和图宽度不相等的图存在差异。

    需要说明的是,本发明实施例提供的文档检查装置的应用上述文档检查方法的装置,则上述文档检查方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。

    以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明所述原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的?;し段?。

    关于本文
    本文标题:一种文档检查方法及装置.pdf
    链接地址://www.4mum.com.cn/p-6027171.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 大乐透规则及中奖规则 玩电子竞技吗 全天北京pk赛车计划 福彩七乐彩下载 北京pk拾计划网站 河内时时彩计划软件安卓 天机神算网站 欢乐生肖最精准人工计划 双色球2019080期机选投注 11选5前二万能7码 幸运快三免费计划软件 大乐透带坐标的走势图 销售单打印软件免费版 北京pk10直播现场 官方pk10app 模拟摇奖机软件