• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 13
    • 下载费用:30 金币  

    重庆时时彩技巧独胆: 基于图像检测和切割的电子文档屏幕显示方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201410209178.7

    申请日:

    2014.05.16

    公开号:

    CN103970723A

    公开日:

    2014.08.06

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):G06F 17/21申请公布日:20140806|||实质审查的生效IPC(主分类):G06F 17/21申请日:20140516|||公开
    IPC分类号: G06F17/21 主分类号: G06F17/21
    申请人: 山西大学
    发明人: 翟岩慧; 张晶; 陈红星
    地址: 030006 山西省太原市小店区坞城路92号
    优先权:
    专利代理机构: 山西五维专利事务所(有限公司) 14105 代理人: 张福增
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410209178.7

    授权公告号:

    ||||||

    法律状态公告日:

    2017.07.07|||2014.09.03|||2014.08.06

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本发明提供了一种基于图像检测和切割的电子文档屏幕显示方法,步骤包括:利用文档的图像信息检测文档的格式信息;估算最佳缩放比例并根据最佳缩放比对文档进行缩放;通过目标设备的分辨率来估算可放置行文本图像的宽度,并根据该宽度生成适合屏幕显示的电子文档。本发明能够有效解决由于电子文档中的字体偏大或偏小,而不适合屏幕显示的问题,节约了手工制作电子文档屏幕显示的人力和时间。

    权利要求书

    权利要求书
    1.  一种基于图像检测和切割的电子文档屏幕显示方法,其特征在于包括如下步骤:
    步骤1:利用图像信息检测电子文档信息,包括电子文档的背景颜色、行间距、行高、行首缩进和段落;
    步骤2:通过公式:像素大?。阶趾?96/72,来计算最终字号的像素大小,再通过公式:最佳缩放比=像素大小/行高,来计算最佳缩放比;
    步骤3:根据最佳缩放比对电子文档进行缩放处理;
    步骤4:根据最佳缩放比对行间距进行更新:新行间距=旧行间距*最佳缩放比;
    步骤5:通过获取目标设备的分辨率来估算可放置的行文本图像的宽度,并依据该宽度生成适合屏幕显示的电子文档。

    2.  根据权利要求1所述的一种基于图像检测和切割的电子文档屏幕显示方法,其特征在于:步骤1中所述的利用图像信息检测电子文档信息,是按照如下子步骤实现的:
    (1)对电子文档的图像进行采样,并根据采样结果计算最有可能的背景颜色;
    (2)通过对电子文档进行水平图像扫描,得到行间距分布、行高分布和左页边距分布,并估计行间距、行高和行首缩进;
    (3)综合行间距和行首缩进的信息得到段落划分。

    3.  根据权利要求1所述的一种基于图像检测和切割的电子文档屏幕显示方法,其特征在于:步骤5中所述的生成适合屏幕显示的电子文档,是按照如下子步骤实现的:
    (1)获取目标设备的分辨率,并估算可放置的行文本图像的宽度;
    (2)根据更新后的新行间距对电子文档图像按行进行切割得到行文本图像;
    (3)根据估算得到的行文本图像宽度对行文本图像进行切割,要保证切割点位于单词和单词或汉字和汉字之间;
    (4)根据切割结果编排成最终的电子文档,需要保证段间距大于或等于1.5倍的新行间距,行间距调整为1.3~1.5倍的新行间距。

    说明书

    说明书基于图像检测和切割的电子文档屏幕显示方法
    技术领域
    本发明涉及电子信息技术,具体属于一种基于图像检测和切割的电子文档屏幕显示方法。
    背景技术
    计算机的迅速发展,引发了信息存储的重大变革;而电子文档的出现,也改变了人类的阅读习惯。电子书以其低碳环保(无需木材、煤、化工原料)、简单易携(容量为4G存储器可以存储1000本电子图书)、时间利用率高(可以利用各种零碎时间进行阅读学习)、查找搜索方便(可以利用索引链接、目录链接、模糊查询等快速查找手段)、价廉(电子书的销售价格远低于纸质书)、易复制存储、无损耗等优点迅速吸引了消费者。
    然而,由于各种原因,许多不能编辑的电子文档(如PDF、CAJ、PDG、Djvu等格式)的屏幕显示效果并不好。例如,16开本和32开本的电子扫描书的字体并不一致,屏幕阅读体验也不同;有些书籍的字体可能偏大或偏小,需要读者缩放显示。特别是当这些电子文档需要屏幕显示时(如播放幻灯片),这种矛盾尤其突出。专家建议,当使用幻灯片进行电子投影时,所选字体的字号一般要大于28号,而且要设置1.3~1.5倍的行间距。为了达到这一要求,最方便有效的方式是对电子文档进行缩放显示,然而,缩放后的页面宽度和高度一般会远大于屏幕宽度和高度,尤其是字体偏小的电子文档,这一缺点尤其明显。一般来说,页面的高度大于屏幕高度并不会造成阅读的不便,因为演讲者可以通过上下拖动鼠标来调整可视部分;但如果页面的宽度大于屏幕宽度,则演讲者需要每行都来回拖动鼠标来调整可视部分,严重地中断了演讲者和听讲者的思路,影响了演讲或阅读效果。而通过电子文档手工制作幻灯片的方法费时费力,造成了极大的人力浪费。
    发明内容
    本发明的目的在于,针对电子文档中的字体偏大或偏小,不适合屏幕显示或播放,而手工制作电子幻灯片又造成了极大的人力浪费,提供一种基于图像检测和切割的电子文档屏幕显示方法。
    本发明提供的一种基于图像检测和切割的电子文档屏幕显示方法,包括如下步骤:
    步骤1:利用图像信息检测电子文档信息,包括电子文档的背景、行间距、行高、行首缩进和段落:
    (1)对电子文档的图像进行采样,并根据采样结果计算最有可能的背景颜色。所述的电子文档图像可以通过打印、另存或屏幕截图得到。采样数越多,估算的结果就越准确。该步 骤基于假设:电子文档图像中颜色重复出现最多的是背景颜色;
    (2)通过对电子文档进行水平图像扫描,得到行间距分布、行高分布和左页边距分布,并估计行间距、行高和行首缩进。此处需注意,行间距可能会在标题、段落前后、甚至含有公式的行表现出显著差异。该步骤基于假设:(1)通过对文档图像中连续出现的相同宽度的背景色块进行检测,可以得到行间距分布和左页边距分布。一般来说,可能的行间距为满足如下条件的块的高度:块的宽度等于文档图像宽度。重复出现次数最多的可能行间距应该为真实行间距??赡艿囊潮呔辔闳缦绿跫目榈目矶龋嚎榈目矶刃∮谖牡低枷竦囊话肟矶?。重复出现次数最多的可能页边距应该为真实页边距,重复出现次数次多的应该为真实的行首缩进;(2)通过对文档图像中连续出现的相同宽度的非背景色块进行检测,可以得到行高分布。一般来说,重复出现次数最多的可能行高应该为真实行高。
    (3)综合行间距分布和行首缩进信息得到段落划分。该步骤基于假设:如果行间距的分布不均匀,就表明该电子文档可能是通过段间距来划分段落的(有些英文文档是通过段间距而非行首缩进来划分段落的);如果行间距的分布均匀,就需要通过行首缩进来划分段落(一些英文文档和大部分中文文档都是通过行首缩进来划分段落的)。
    步骤2:通过公式:像素大?。阶趾?96/72,来计算最终字号的像素大小,再通过公式:最佳缩放比=像素大小/行高,来计算最佳缩放比;
    步骤3:根据最佳缩放比对文档图像进行缩放处理,必要时可以对图像进行平滑处理,以强化显示效果;
    步骤4:根据最佳缩放比对行间距进行更新:新行间距=旧行间距*最佳缩放比;
    步骤5:通过获取目标设备的分辨率来估算可放置的行文本图像的宽度,并依据该宽度生成适合屏幕显示的电子文档,具体子步骤为:
    (1)获取目标设备的分辨率,并估算可放置的行文本图像的宽度;
    (2)根据更新后的新行间距对电子文档图像按行进行切割得到行文本图像;
    (3)根据估算得到的行文本图像宽度对行文本图像进行切割,要保证切割点位于单词和单词或汉字和汉字之间;
    (4)根据切割结果编排成最终的电子文档,需要保证段间距大于等于1.5倍的新行间距,行间距调整为1.3~1.5倍的新行间距。
    与现有技术相比本发明的优点在于:
    (1)因为该发明采用了图像检测和切割的方式来生成最终的电子文档,因此最终生成的电子文档不失真;
    (2)该发明基于电子文档图像来生成最终的电子文档,因此能处理任何可以在屏幕上显 示的电子文档,包括但不局限于PDF、CAJ、PDG、Djvu等文档格式;
    (3)该发明最终生成了基于图像的电子文档,因此可以嵌入到各种支持图像插入的软件中,包括Word、PowerPoint、Photoshop、Excel等软件。
    附图说明
    图1 为本发明具体实施方式流程图
    图2 为本发明具体实施方式采用的实验电子文档
    图3 为本发明具体实施方式的文档背景颜色检测
    图4 为本发明具体实施方式的行间距检测结果
    图5 为本发明具体实施方式的行高检测结果
    图6 为本发明具体实施方式的行首缩进检测结果
    图7 为本发明具体实施方式的最终显示效果
    具体实施方式
    下面将结合实例给出具体的实施方案。
    步骤1:利用图像信息检测电子文档信息:
    (1)对电子文档的图像进行采样,并根据采样结果计算最有可能的背景颜色。电子文档图像如图2所示,其分辨率为2776×1831。我们采样100个点,并计算采样结果。结果表明,100个采样点中有96个点的颜色为白色(255,255,225),因此该电子文档的背景色为白色。部分采样结果如图3所示,为了演示效果,我们对采样点进行了圆圈标注。
    (2)通过对电子文档进行水平图像扫描,得到行间距分布、行高分布和左页边距分布,并估计行间距、行高和行首缩进。算法运行表明:该电子文档共有45个可能的行间距(均为宽度等于1831像素的背景色块):
    139 13 45 11 12 12 12 12 12 12 12 11 11 12 12 12 12 12 12 11 37 11 1212 12 12 12 12 12 11 37 12 12 12 12 12 12 11 11 11 117 73 55 66 139
    其中,可能行间距为12像素的色块占57.78%,为11像素的色块占20.8%,因此该文档的可能行间距为12像素??赡苄屑渚嘣谕?中进行了标注,图中并没有对取值为12像素和11像素的行间距进行标注。计算还发现,该电子文档有44个可能的行高:
    31 5 39 39 38 38 38 38 38 38 39 39 39 38 38 38 38 38 39 39 39 39 3838 38 38 38 38 39 39 39 38 38 38 38 38 39 39 39 39 30 39 38 41
    其中,可能行高为38像素的文字块占52.27%,为39像素的文字块占38.64%,因此该文档可能行高为38像素??赡苄懈咴谕?中进行了标注,图中并没有对取值为38像素和39像素的行高进行标注。另外,宽度小于文档图像的一半宽度的块主要分布在218像素和270像素, 这说明页边距应该为218像素,行首缩进应该为270像素,如图6所示。
    (3)综合行间距分布和行首缩进信息得到段落划分。对行间距的分布进行分析发现,行间距的变化主要集中在文档的开头和结尾,这说明该电子文档是使用行首缩进来划分段落的。因此可以根据行首缩进得到段落划分。注意图6中对编号文本的缩进检测结果与段落的缩进检测结果一致,为了防止将编号项认定为段落,可以尝试记录含有数字编号行的缩进,并与后续的文本缩进进行对比。如果后续多行文本的缩进基本相等,并且大于数字编号行的缩进,就可以判定这些文本行属于项目编号项或项目符号项。
    步骤2:通过公式:像素大?。阶趾?96/72,来计算最终字号的像素大小,再通过公式:最佳缩放比=像素大小/行高,来计算最佳缩放比。我们需要42号字体,因此需要42*96/72≈56像素大小的字体,而56/38≈1.5即为最佳缩放比。
    步骤3:根据最佳缩放比对文档图像进行缩放处理。我们需要对该电子文档图像放大1.5倍。
    步骤4:根据最佳缩放比对行间距进行更新:新行间距=旧行间距*1.5。我们得到新行间距为12*1.5=18像素。
    步骤5:通过获取目标设备的分辨率来估算可放置的行文本图像的宽度,并依据该宽度生成适合屏幕显示的电子文档:
    (1)获取目标设备的分辨率,并估算可放置的行文本图像的宽度。我们设备的分辨率为:1024×768。为了演示效果,我们添加了左右页边距各50像素,因此使用1024-50*2=924像素作为可放置的行文本图像的宽度;
    (2)根据更新后的新行间距对电子文档图像按行进行切割得到行文本图像;
    (3)根据估算得到的行文本图像宽度对行文本图像进行切割;
    (4)根据切割结果编排成最终的电子文档,需要保证段间距大于等于1.5倍的新行间距,行间距调整为1.3~1.5倍的新行间距。我们将段间距设置为1.5倍的新行间距:1.5*18=27像素,将行间距设置为1.3倍的新行间距:1.3*18≈23像素。我们将切割后的图像嵌入到MicrosoftPowerPoint中,部分编排结果如图7所示,其中的图像边框是为了演示切割效果而加上的。
    以上所述仅为本发明的主要实施方式而已,对于含有干扰信息的电子文档(如文档含有水印、文档含有边注、文档为双栏或多栏),我们可以对这些情况进行额外处理。上述实施方式并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

    关 键 词:
    基于 图像 检测 切割 电子 文档 屏幕 显示 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:基于图像检测和切割的电子文档屏幕显示方法.pdf
    链接地址://www.4mum.com.cn/p-6142863.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03