• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 6
    • 下载费用:30 金币  

    重庆时时彩哪天开始: 一种基于互联网的数据处理系统.pdf

    关 键 词:
    一种 基于 互联网 数据处理系统
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201610778955.9

    申请日:

    2016.08.30

    公开号:

    CN106372168A

    公开日:

    2017.02.01

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的撤回 IPC(主分类):G06F 17/30申请公布日:20170201|||实质审查的生效IPC(主分类):G06F 17/30申请日:20160830|||公开
    IPC分类号: G06F17/30; G06F17/27 主分类号: G06F17/30
    申请人: 湖北银速物联网科技有限公司
    发明人: 梁好
    地址: 430223 湖北省武汉市东湖新技术开发区华工科技园创新企业基地2栋D单元
    优先权:
    专利代理机构: 代理人:
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610778955.9

    授权公告号:

    ||||||

    法律状态公告日:

    2019.03.12|||2017.03.01|||2017.02.01

    法律状态类型:

    发明专利申请公布后的撤回|||实质审查的生效|||公开

    摘要

    本发明涉及一种基于互联网的数据处理系统,包括:采集???,用于采集互联网中的至少一个信息源上发布的至少一个文本信息;主题筛选???,用于将包含有需求主题的相关词语的文本信息作为目标文本;需求筛选???,用于通过每个所述目标文本中的情感词语,确定该目标文本对于所述需求主题的需求方向,或者对于所述需求主题的需求方向及需求程度。本发明通过从互联网上获取大量的文本信息作为语料样本,并通过需求主题筛选对数据进行滤除,进而保证获取到的目标文本的可靠性。

    权利要求书

    1.一种基于互联网的数据处理系统,包括:
    采集???,用于采集互联网中的至少一个信息源上发布的至少一个文本信息;
    主题筛选???,用于将包含有需求主题的相关词语的文本信息作为目标文本;
    需求筛选???,用于通过每个所述目标文本中的情感词语,确定该目标文本对于所述
    需求主题的需求方向,或者对于所述需求主题的需求方向及需求程度。
    2.根据权利要求1所述的一种基于互联网的数据处理系统,其特征在于:所述主题筛选
    ??榘ň卣蠼⒛??、特征词获取???、第一匹配??楹椭魈馍秆∽幽??。
    所述矩阵建立???,找出每个所述文本信息中至少一个关键词,构建文本信息-关键词
    的分布矩阵的;
    所述特征词获取???,通过卡方检验,确定每个所述文本信息的至少一个关键词中的
    特征词,获得每个所述文本信息的特征词集;
    所述第一匹配???,将所述需求主题的相关词语与每个所述文本信息的特征词集中的
    特征词进行匹配的第一匹配???;
    所述主题筛选子???,将所述特征词与所述需求主题的相关词语匹配成功的所述文本
    信息作为所述目标文本的主题筛选子???。
    3.根据权利要求1所述的一种基于互联网的数据处理系统,其特征在于:所述需求筛选
    ??榘ǖ诙ヅ淠??、需求筛选子??楹屠嘈褪侗鹉??。
    所述第二匹配???,以需求词库中的每个需求词与每个所述目标文本在所述分布矩阵
    中的形容词词性的关键词进行匹配;
    所述需求筛选子???,在匹配成功后,将该需求词对应的需求方向及需求程度作为该
    目标文本对于所述需求主题的需求方向,或者对于所述需求主题的需求方向及需求程度。
    所述类型识别???,判断所述目标文本在所述分布矩阵中对应的关键词中是否具有反
    映需求类型的描述。

    说明书

    一种基于互联网的数据处理系统

    技术领域

    本发明涉及互联网领域,尤其涉及一种基于互联网的数据处理系统。

    背景技术

    随着互联网时代的到来,信息已经公开化和分享化,许多用户通过网上就能查询
    所需要的信息,但是传统的数据信息筛选,一般都是以关键词在整个文本信息中进行扫描
    匹配的方式进行数据查找,进而实现筛??;但选取的关键词对于整个文本信息来言,仅仅是
    文本信息中的一个词语,但扫描针对于文本信息全部内容,因此扫描整个文本信息的过程
    中,有许多的扫描是无用扫描,占据了大量的处理时间,以下提出一种可选的实施例,以节
    省处理时间,提高处理效率。

    发明内容

    鉴于以上所述,本发明提供了一种基于互联网的数据处理系统,有效地解决了上
    述问题中的至少一个方面。

    为了实现本发明的目的所采用的技术方案是:一种基于互联网的数据处理系统,
    包括:

    采集???,用于采集互联网中的至少一个信息源上发布的至少一个文本信息;

    主题筛选???,用于将包含有需求主题的相关词语的文本信息作为目标文本;

    需求筛选???,用于通过每个所述目标文本中的情感词语,确定该目标文本对于
    所述需求主题的需求方向,或者对于所述需求主题的需求方向及需求程度。

    在一些实施方式中,所述主题筛选??榘ň卣蠼⒛??、特征词获取???、第一
    匹配??楹椭魈馍秆∽幽??。

    所述矩阵建立???,找出每个所述文本信息中至少一个关键词,构建文本信息-关
    键词的分布矩阵的;

    所述特征词获取???,通过卡方检验,确定每个所述文本信息的至少一个关键词
    中的特征词,获得每个所述文本信息的特征词集;

    所述第一匹配???,将所述需求主题的相关词语与每个所述文本信息的特征词集
    中的特征词进行匹配的第一匹配???;

    所述主题筛选子???,将所述特征词与所述需求主题的相关词语匹配成功的所述
    文本信息作为所述目标文本的主题筛选子???。

    在一些实施方式中,所述关键词的词性为名词、动词或形容词。

    在一些实施方式中,所述需求筛选??榘ǖ诙ヅ淠??、需求筛选子??楹屠?br />型识别???。

    所述第二匹配???,以需求词库中的每个需求词与每个所述目标文本在所述分布
    矩阵中的形容词词性的关键词进行匹配;

    所述需求筛选子???,在匹配成功后,将该需求词对应的需求方向及需求程度作
    为该目标文本对于所述需求主题的需求方向,或者对于所述需求主题的需求方向及需求程
    度。

    所述类型识别???,判断所述目标文本在所述分布矩阵中对应的关键词中是否具
    有反映需求类型的描述。

    本发明通过从互联网上获取大量的文本信息作为语料样本,并通过需求主题筛选
    对数据进行滤除,进而保证获取到的目标文本的可靠性;同时通过线上信息采集也可以使
    分析效率得到大大的提升;采用分析目标文本中的情感词语,进而判断出用户对主题的需
    求方向是正是负,以及需求程度的强烈程度,得到大量的可靠性高的用户需求信息,进而分
    析出用户需求。

    附图说明

    图1为本发明的流程图。

    具体实施方式

    下面结合附图和具体实施方式对本发明作进一步说明。

    如图1所示,一种基于互联网的数据处理系统,包括采集???、主体筛选??楹托?br />求筛选???。

    所述采集???,采集互联网中的至少一个信息源上发布的至少一个文本信息;其
    中,信息源上发布的文本信息,可以是电商网站的评论栏中的评论文本,也可以是在论坛、
    微博、贴吧、相关网站的评论版块上发布的自由言论;另外,采集文本信息可以通过网络爬
    虫进行数据抓取获得,本领域的技术人员应该可以了解的是通过网络爬虫对数据进行抓取
    只是本说明性实施例所采用的优选方法,还可以通过其他数据采集/抓取方法获取文本信
    息。

    所述主题筛选???,将包含有需求主题的相关词语的文本信息作为目标文本的主
    题筛选???;所述主题筛选??榘?找出每个所述文本信息中至少一个关键词,构建文本
    信息-关键词的分布矩阵的矩阵建立???;通过卡方检验,确定每个所述文本信息的至少一
    个关键词中的特征词,获得每个所述文本信息的特征词集的特征词获取???;将所述需求
    主题的相关词语与每个所述文本信息的特征词集中的特征词进行匹配的第一匹配???;将
    所述特征词与所述需求主题的相关词语匹配成功的所述文本信息作为所述目标文本的主
    题筛选子???。

    所述需求筛选???,通过每个所述目标文本中的情感词语,确定该目标文本对于
    所述需求主题的需求方向,或者对于所述需求主题的需求方向及需求程度;所述需求筛选
    ??榘ǎ阂孕枨蟠士庵械拿扛鲂枨蟠视朊扛鏊瞿勘晡谋驹谒龇植季卣笾械男稳荽蚀?br />性的关键词进行匹配的第二匹配???;在匹配成功后,将该需求词对应的需求方向及需求
    程度作为该目标文本对于所述需求主题的需求方向,或者对于所述需求主题的需求方向及
    需求程度的需求筛选子???;判断所述目标文本在所述分布矩阵中对应的关键词中是否具
    有反映需求类型的描述;若是,则将该描述对应的需求类型作为所述目标文本对于需求主
    题的需求类型的类型识别???。

    本发明的工作流程如下:

    S11、采集互联网中的至少一个信息源上发布的至少一个文本信息;

    S12、将包含有需求主题的相关词语的文本信息作为目标文本;

    S13、通过每个所述目标文本中的情感词语,确定该目标文本对于所述需求主题的
    需求方向,或者,通过每个所述目标文本中的情感词语,确定该目标文本对于所述需求主题
    的需求方向及需求程度。

    以上仅为本发明的一些实施方式,对于本领域普通技术人员来说,在不脱离本发
    明创造构思的前提下还可进行若干变形和改进,这些都属于本发明的?;し段е?。

    关于本文
    本文标题:一种基于互联网的数据处理系统.pdf
    链接地址://www.4mum.com.cn/p-6013862.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 老虎机怎么玩稳赚 pk10前三杀号技巧 黄金pk10全能计划软件 七星彩预测计划网址 500元 倍投方案 稳赚 福彩七乐彩下载 必赢客吉林快三标准版 彩票大小单双玩法 天津时时购买平台 特马资料最准三肖三码 百度 彩票店利润有多大 1分pk10走势技巧规律 快速时时官网 黑客能破解黑博彩吗 快速时时走势图 pk10大小正确倍投方案稳赚