• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 7
    • 下载费用:30 金币  

    重庆时时彩平台登录: 一种对二维表格进行特征分析和数据提取的方法.pdf

    关 键 词:
    一种 二维 表格 进行 特征 分析 数据 提取 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201010123219.2

    申请日:

    2010.03.11

    公开号:

    CN102193940A

    公开日:

    2011.09.21

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20110921|||实质审查的生效IPC(主分类):G06F 17/30申请日:20100311|||公开
    IPC分类号: G06F17/30; G06F17/24 主分类号: G06F17/30
    申请人: 龙旗科技(上海)有限公司
    发明人: 黄晓东
    地址: 200233 上海市徐汇区漕河泾新兴技术开发区漕宝路401号
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201010123219.2

    授权公告号:

    ||||||

    法律状态公告日:

    2013.07.31|||2011.11.23|||2011.09.21

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    本发明公开了一种对二维表格进行特征分析和数据提取的方法,该方法可以对符合所述特征的示例表格进行特征分析和根据指定的关键进行数据提取,组成字典数据,然后根据这份数据字典对示例表进行数据更新。本发明方法可以应用于将一份表格的数据按字段导入到另一份表格中的需求,比如:根据客户提供的翻译文件导入数据到手机平台上的翻译文件。

    权利要求书

    1.一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的该方法包括符合某种特征的表格,可视化的程序窗口,特征分析算法,数据提取算法,数据导入算法。2.根据权利要求1所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的符合某种特征的表格主要表格中包含多行多列文本,每行之间以回车换行符分隔,每列之间以制表符分隔,表格在逻辑上可以分为表格头和表格体,表格头包含一些字段,表格体中包含了对应的数据。3.根据权利要求1所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的可视化程序窗口主要负责接受用户输入的参数,进行特征分析,将分析出来的字段以列表的形式显示出来,并要求用户选定匹配关键字(keyword),然后进行数据提取,将提取出来的数据导入到另一份表格文件中,完成数据导入工作。4.根据权利要求3所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的用户输入的参数的文件路径以及用户指定的相匹配关键字。5.根据权利要求1所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的特征分析算法主要负责自动识别表格头,分析出表格的字段并组成列表。6.根据权利要求1所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的数据提取算法主要根据用户指定的关键字,对表格体进行数据提取,组成一种字典数据结构。7.根据权利要求6所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的字典数据结构是一种{key:value}形式的定义,key是(key1,key2)形式的元组,vlaue是[v1,v2…]形式的列表,当提取数据时遇到key一样的数据时,将其对应的数据添加到value列表中。8.根据权利要求1所述的一种对二维表格进行特征分析和数据提取的方法,其特征在于:所述的数据导入算法对(图5)表进行特征分析并以每行数据进行数据提取,然后从(图3)表的字典数据中以关键字取出相应的值,更新到(图5)表的字典数据中,然后将此更新过的一维数据再还原成(图5)表的文本数据。

    说明书

    一种对二维表格进行特征分析和数据提取的方法

    技术领域

    本发明涉及信息技术领域,具体涉及一种对二维表格进行特征分析和数据提取的方法。

    背景技术

    在实际的工作过程中,?;嵊龅浇环荼砀竦氖莅醋侄嗡承虻既氲搅硪环荼砀裰械男枨?,如果更新的记录比较少,可以通过手工进行,但是如果记录达上万条,这时就要通过工具自动化的进行更新操作。本发明研究出的方法,能够较好的处理上述的问题,并且允许用户自由选择匹配关键字,使得工作效率极大提高,目前已应用于手机嵌入式平台翻译文件的数据更新。

    发明内容

    针对已有技术的不足,本发明的目的是提供一种对二维表格进行特征分析和数据提取的方法,该方法可以大幅提高工作效率,并且可以应用于多种场合。

    一种对二维表格进行特征分析和数据提取的方法,该方法包括符合某种特征的表格,可视化的程序窗口,特征分析算法,数据提取算法,数据导入算法。

    所述的符合某种特征的表格主要特征是表格中包含多行多列文本,每行之间以回车换行符分隔,每列之间以制表符分隔。表格在逻辑上可以分为表格头和表格体,表格头包含一些字段,表格体中包含了对应的数据。

    所述的可视化程序窗口主要负责接受用户输入的参数,进行特征分析,将分析出来的字段以列表的形式显示出来,并要求用户选定匹配关键字,然后进行数据提取,再将提取的数据导入到另一张表格,完成数据导入工作。

    所述的用户输入的参数包括两张表格(A表和B表)的文件路径以及用户指定的匹配关键字。

    所述的特征分析算法主要负责自动识别表格头,分析出表格的字段并组成列表。

    所述的数据提取算法主要根据用户指定的关键字,对表格体进行数据提取,组成一种字典数据结构。

    所述的字典数据结构是一种{key:value}形式的定义,key是(key1,key2)形式的元组,vlaue是[v1,v2…]形式的列表,当提取数据时遇到key一样的数据时,将其对应的数据添加到value列表中。完整的数据结构形式为:{(key1,key2):[v1,v2,v3…]}

    所述的数据导入算法对B表进行特征分析并以每行数据进行数据提取,然后从A表的字典数据中以关键字取出相应的值,更新到B表的字典数据中,然后再还原成B表的文本数据

    附图说明

    图1是本发明进行表头特征分析时的数据结构示意图;

    图2是本发明用于提取数据时的一维数据结构示意图;

    图3是示例表格;

    图4本发明提取数据的示意图;

    图5是示例表格;

    图6是图5表第一行提取数据的示意图;

    图7是图5表第一行导入数据的示意图。

    具体实施方式

    下面结合附图对本发明作进一步描述。

    从一张表格进行特征分析并提取数据后再导入到另一张表格中需要三个步骤:

    第一步,程序窗口首先接收用户输入的表格文件路径参数,根据这些参数预读取两份文件的开始若干行数据,对这些数据进行制表符分割,组成如图1所示的数据结构,然后将两份数据进行比对,找出相同名称的字段,这些字段显示给用户作为可选的关键字。

    第二步,用户选定关键字后选择程序窗口中的下一步按钮,程序会按如图2所示的数据结构提取表格数据,图3和图4是示例表格及示例提取数据,此提取算法及数据结构的作用是将二维的表格数据转换成一维数据,简化数据结构,方便导入到另一张二维表格中。

    第三步,数据生成后选择程序窗口中的导入按钮,程序会对另一张表中的每一条记录按上述算法提取数据,示例表格及示例数据如表格5和图6所示,根据每一条一维记录的key值,图4的数据中查找同样存在key的记录,找到则将相应的value值替换原来的value值,完成数据导入,示例见图7,当所有的记录导入后,将一维数据还原成二维表格,然后用同样的方法处理下一行数据,直至处理完表格的所有数据。

    关于本文
    本文标题:一种对二维表格进行特征分析和数据提取的方法.pdf
    链接地址://www.4mum.com.cn/p-5875308.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 诚信彩苹果 捕鸟达人电脑游戏 25选7开奖 北单7串1过滤设置 海南麻将秘籍 上证指数的点位 天津快乐十分开奖结果 鸿利彩票首页 黑龙江22选5中奖复式规则 山西11选5推荐即时 足球比分直播即时比分 地下城勇士游戏下载 澳洲幸运8计划 河北十一选五走助手 南京麻将三打四包规则 快乐十分彩票投注技巧