• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 10
    • 下载费用:30 金币  

    重庆时时彩gt娱乐平台: 一种信息发布方法及系统.pdf

    关 键 词:
    一种 信息 发布 方法 系统
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201310719698.8

    申请日:

    2013.12.20

    公开号:

    CN103838819A

    公开日:

    2014.06.04

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06F 17/30申请日:20131220|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 深圳指掌时代网络科技有限公司
    发明人: 王刚; 陈伟; 杨志坚; 谢奥林
    地址: 518000 广东省深圳市南山区深南大道10128号南山软件园东塔楼605
    优先权:
    专利代理机构: 广东广和律师事务所 44298 代理人: 刘敏
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201310719698.8

    授权公告号:

    |||

    法律状态公告日:

    2017.01.18|||2014.06.04

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明公开了一种信息发布方法及系统,该信息发布方法包括:预先采集全量用户的基础数据、关注数据和微博数据,并对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据,根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格,并根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从博主库中筛选相应的博主;将所筛选出的相应博主发送至客户端。实施本发明的技术方案,在客户需要相应博主发布相关信息时,根据客户需求,在博主库中进行筛选,使得客户能精准识别出合适的博主,达到良好的发布效果。

    权利要求书

    权利要求书
    1.  一种信息发布方法,其特征在于,包括:
    A.预先采集全量用户的基础数据、关注数据和微博数据,并对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据,根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;
    B.从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格,并根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主;
    C.将所筛选出的相应博主发送至客户端。

    2.  根据权利要求1所述的信息发布方法,其特征在于,在所述步骤A之后,还包括:
    D.从客户端接收指定博主和待发布的特定信息的属性信息,并根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;
    E.将分析所得到的发布效果发送至客户端。

    3.  根据权利要求1所述的信息发布方法,其特征在于,在所述步骤A中,使用MapReduce并行计算框架,对所采集的全量用户的关注数据进行倒排以获得全量粉丝数据。

    4.  根据权利要求1所述的信息发布方法,其特征在于,所述基础数据包括下列中的至少一个:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数;
    所述用户特性数据、粉丝特性数据包括下列中的至少一个:所属行业、影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线、历史单条微博传播效果。

    5.  根据权利要求1所述的信息发布方法,其特征在于,在所述步骤A中,采集全量用户的微博数据的步骤为:
    根据用户平均每天发微博的数量,将全量用户划分为多个优先级队列,并按优先级采集用户的微博数据。

    6.  一种信息发布系统,其特征在于,包括通过网络连接的服务器及多个客户端,所述服务器包括:
    采集???,用于采集全量用户的基础数据、关注数据和微博数据;
    分析???,用于对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据;
    库构建???,用于根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;
    接收???,用于从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格;
    筛选???,用于根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主;
    发送???,用于将所筛选出的相应博主发送至客户端。

    7.  根据权利要求6所述的信息发布系统,其特征在于,所述服务器还包括预估???,而且,
    所述接收???,还用于从客户端接收指定博主和待发布的特定信息的属性信息;
    预估???,用于根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;
    所述发送???,还用于将分析所得到的发布效果发送至客户端。

    8.  根据权利要求6所述的信息发布系统,其特征在于,所述分析??槭褂肕apReduce并行计算框架对所采集的全量用户的关注数据进行倒排以获得全量粉丝数据。

    9.  根据权利要求6所述的信息发布系统,其特征在于,所述基础数据包括下列中的至少一个:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数;
    所述用户特性数据、粉丝特性数据包括下列中的至少一个:所属行业、影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线、历史单条微博传播效果。

    10.  根据权利要求6所述的信息发布系统,其特征在于,所述服务器为分布式集群服务器。

    说明书

    说明书一种信息发布方法及系统
    技术领域
    本发明涉及网络技术领域,尤其涉及一种信息发布方法及系统。
    背景技术
    随着网络技术的发展,越来越多的用户开始使用微博。微博,即微博客(MicroBlog)的简称,是一个基于用户关系的信息分享、传播以及获取平台,用户可以通过WEB、WAP以及各种客户端组件个人社区,以较少的文字(例如140字以内)更新信息,并实现即时分享。微博最大的优点就是即时、高效和灵活。
    但是现有的信息发布方法大多只是针对社交信息流传播的端不同,基本上都是针对信息接收端进行功能改进或提升的,对博主的详细挖掘较少,因此,无法需要针对一些目标群体发布相应的公开信息。
    发明内容
    本发明要解决的技术问题在于,提供一种信息发布方法及系统,能够针对目标群体发布相应信息。
    本发明解决其技术问题所采用的技术方案是:构造一种信息发布方法,包括:
    A.预先采集全量用户的基础数据、关注数据和微博数据,并对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数 据和传播价格数据,根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;
    B.从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格,并根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主;
    C.将所筛选出的相应博主发送至客户端。
    在本发明所述的信息发布方法中,在所述步骤A之后,还包括:
    D.从客户端接收指定博主和待发布的特定信息的属性信息,并根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;
    E.将分析所得到的发布效果发送至客户端。
    在本发明所述的信息发布方法中,在所述步骤A中,使用MapReduce的并行计算框架,对所采集的全量用户的关注数据进行倒排以获得全量粉丝数据。
    在本发明所述的信息发布方法中,所述基础数据包括下列中的至少一个:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数;
    所述用户特性数据、粉丝特性数据包括下列中的至少一个:所属行业、影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线、历史单条微博传播效果。
    在本发明所述的信息发布方法中,在所述步骤A中,采集全量用户的微博数据的步骤为:
    根据用户平均每天发微博的数量,将全量用户划分为多个优先级队列,并按优先级采集用户的微博数据。
    本发明还构造一种信息发布系统,包括通过网络连接的服务器及多个客户端,所述服务器包括:
    采集???,用于采集全量用户的基础数据、关注数据和微博数据;
    分析???,用于对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据;
    库构建???,用于根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;
    接收???,用于从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格;
    筛选???,用于根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主;
    发送???,用于将所筛选出的相应博主发送至客户端。
    在本发明所述的信息发布系统中,所述服务器还包括预估???,而且,
    所述接收???,还用于从客户端接收指定博主和待发布的特定信息的属性信息;
    预估???,用于根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;
    所述发送???,还用于将分析所得到的发布效果发送至客户端。
    在本发明所述的信息发布系统中,所述分析??槭褂肕apReduce并行计算框架对所采集的全量用户的关注数据进行倒排以获得全量粉丝数据。
    在本发明所述的信息发布系统中,所述基础数据包括下列中的至少一个:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数;
    所述用户特性数据、粉丝特性数据包括下列中的至少一个:所属行业、 影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线、历史单条微博传播效果。
    在本发明所述的信息发布系统中,所述服务器为集群服务器。
    实施本发明的技术方案,通过预先对微博博主的详细数据进行挖掘、分析并建立博主库。在客户需要相应博主发布相关信息时,根据客户需求,在博主库中进行筛选,使客户能精准识别出合适的博主,达到良好的发布效果。
    附图说明
    下面将结合附图及实施例对本发明作进一步说明,附图中:
    图1是本发明信息发布方法实施例一的流程图;
    图2是本发明信息发布方法实施例二的流程图;
    图3是本发明信息发布系统实施例一的逻辑图;
    图4是本发明信息发布系统实施例二的逻辑图。
    具体实施方式
    图1是本发明本发明信息发布方法实施例一的流程图,该信息发布方法包括:
    A.预先采集全量用户的基础数据、关注数据和微博数据,并对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据,根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库,在该步骤中,对于新浪微博用户,通过新浪API所采集的基础数据可包括:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数、微博相关信息等。分析所获得的用户特性数据、粉丝特性 数据可包括:所属行业、影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线;
    B.从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格,并根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主;
    C.将所筛选出的相应博主发送至客户端。
    图2是本发明本发明信息发布方法实施例二的流程图,该信息发布方法包括:
    A.预先采集全量用户的基础数据、关注数据和微博数据,并对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据,根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库;
    D.从客户端接收指定博主和待发布的特定信息的属性信息,并根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;
    E.将分析所得到的发布效果发送至客户端。
    在此需说明的是,步骤B和步骤D并无顺序关系,只需在步骤A之后即可。
    在信息发布方法的步骤A中,在通过分析获取粉丝特性数据时,首先要获取全量粉丝数据,而由于API接口只能获取全量用户的关注数据,而粉丝数据不能全部获取,例如,知名博主的粉丝数可能达到千万级别,所以,应首先使用MapReduce并行计算框架,对所采集的全量用户的关注数据进行倒排以获得全量粉丝数据。
    在信息发布方法的步骤A中,在采集全量用户的微博数据时,可根据用户平均每天发微博的数量,将全量用户划分为多个优先级队列,并按优先级采集用户的微博数据。在此需说明的是,这里的用户分类适用于微博采集,而与用户真实性分类(僵尸号、机器号、企业用户、普通用户)不同的是,用于微博采集的用户分类操作比较容易,而用户真实性分类需要通过机器学习来判别。
    在信息发布方法的步骤A中,在通过分析获取影响力时,首先,根据所采集的关注数据及分析所获得的粉丝特性数据使用改进的PageRank算法计算出每个用户的排名值;其次,分别对每个用户的排名值取对数;根据长尾分布理论,对取对数后的值进行调整以满足长尾分布或者幂率分布,且调整后的值为影响力。
    在信息发布方法的步骤A中,在通过分析获取年龄时,可通过已有的标签(例如,80后、90后等)指定样本数据集,使用Navie Bayes算法计算出用户的年龄分布段。
    在信息发布方法的步骤A中,在通过分析获取预设时间段内(例如24小时)的活跃曲线时,主要通过历史微博的发布、转发、评论等活动时间来统计出该用户的活跃曲线。
    在信息发布方法的步骤A中,在通过分析获取活跃度时,可基于线性关系的算法和非线性关系的算法进行计算,例如,在通过线性关系的算法计算活跃度时,可通过公式1来计算普通活跃度,通过公式2来计算有效活跃度:
    A=a1BTRRmax·(Blog+Trans+Review+Reply)]]>
    +a2APAmax·(Attention+Private+At)]]>公式1
    A1=a1RTRRmax1·(Blog1+Trans1+Review1+Reply1)]]>
    +a2APAmax1·(Attention1+Private1+At1)]]>公式2
    其中,A为普通活跃度,A1为有效活跃度,a1、a2均为小于1的加权系数,且a1+a2=1,Blog、Trans、Review、Reply分别为微博主发微博数量、转发数量、评论数量和回复数量,Blog1、Trans1、Review1、Reply1分别为微博主原创发微博数量、转发数量、评论数量和回复数量,Attention、Private、At分别为关注增量、私信增量、@增量,Attention1、Private1、At1分别为原创关注增量、私信增量、@增量,BTRRmax为预设时间段内可能最大的发微博数量、转发数量、评论数量、回复数量之和,APAmax为预设时间段内可能最大的关注增量、私信增量、@增量之和,为预设时间段内可能最大的原创发微博数量、转发数量、评论数量、回复数量之和,为预设时间段内可能最大的原创关注增量、私信增量、@增量之和。
    在信息发布方法的步骤A中,在通过分析获取历史单条微博传播效果时,可通过API采集以及爬虫获取某条微博的历史转评数据(又称之为传播数据),因而我们可以采集某个用户的历史微博的传播数据,然后对获取的数据进行汇总分析传播效果,如曝光量、转评量、传播情感值、关键词、水军等?;谡庑┯没⒉┑睦肥?,可以比较量化地透析某个用户(或博主)的历史微博传播(或信息发布)效果。
    在信息发布方法的步骤A中,在通过分析获取传播价格数据时,可先抓取博主在全网的历史交易数据及参考价格,然后根据参考价格,预测出其它用户的微博传播价格。具体为:历史交易数据是微博用户或博主已经与企业政府机构等合伙合作进行广告投放、信息发布的交易数据。参考价格是在交 易过程中双方认可的微博软文直发、软文转发、硬文直发、硬文转发价格数据。这些数据使用垂直搜索技术来采集,即只针对行业内的各类网站、社交导航页面、社交网络进行数据抓取。然后采用线性回归和神经网络进行预测微博用户或者博主的上述四类报价(软文直发、软文转发、硬文直发、硬文转发)。
    通过上面的分析获取到用户特性数据、粉丝特性数据和传播价格数据后,对这些数据进行汇总,以用户ID为主建存放到博主库中,并提供筛选条件,筛选条件是根据信息发布的需求来确定的,例如,客户(例如为企业政府机构等)需要发布一条软文信息,要求该条信息最终的转发量在20万、目标用户群覆盖量为1亿、女性覆盖比例为60%、总预算20万,那么就可根据转发量、覆盖量、女性比例和软文直发价格筛选出几组博主候选方案,供客户参考??突范ú┲?,并根据所确定的传播价格或双反协调出一个都认可的价格向博主支付一定的金额,使博主在其微博或其他社交网站上发布信息,以达到发布效果。
    另外,客户还可以查看自己指定几个博主的发布效果,根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析特定消息的发布效果,以供客户参考。
    图3是本发明信息发布系统实施例一的逻辑图,该信息发布系统包括通过网络连接的服务器及多个客户端,服务器优选为分布式集群服务器。其中,服务器包括:采集???1、分析???2、库构建???3、接收???4、筛选???5和发送???6,其中,采集???1用于采集全量用户的基础数据、关注数据和微博数据,例如,基础数据包括下列中的至少一个:用户名、昵称、性别、联系方式、区域、标签、微博数、粉丝数、关注数。分析???2 用于对所采集的基础数据、关注数据和微博数据进行分析以得到用户特性数据、粉丝特性数据和传播价格数据,例如,用户特性数据、粉丝特性数据包括下列中的至少一个:所属行业、影响力、年龄、用户活跃度、粉丝活跃度、用户预设时间段内的活跃曲线、粉丝预设时间段内的活跃曲线、历史单条微博传播效果。在获取粉丝特性数据之前,先获取全量粉丝数据,而全量粉丝数据可通过分析???2使用MapReduce并行计算框架对所采集的全量用户的关注数据进行倒排而获得??夤菇??3用于根据所得到的用户特性数据、粉丝特性数据和传播价格数据构建博主库。接收???4用于从客户端接收待发布的特定信息的属性信息、期望的发布效果信息和预算价格。筛选???5用于根据待发布的特定信息的属性信息、期望的发布效果信息和预算价格从所述博主库中筛选相应的博主。发送???6用于将所筛选出的相应博主发送至客户端。
    图4是本发明信息发布系统实施例二的逻辑图,相比图3所示的实施例,所不同的是,该信息发布系统中的服务器还包括预估???7,而且,接收???4还用于从客户端接收指定博主和待发布的特定信息的属性信息。预估???7用于根据指定博主和待发布的特定信息的属性信息,在所述博主库中分析所述特定消息的发布效果;发送???6还用于将分析所得到的发布效果发送至客户端。
    以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内?!  ∧谌堇醋宰ɡ鴚ww.www.4mum.com.cn转载请标明出处

    关于本文
    本文标题:一种信息发布方法及系统.pdf
    链接地址://www.4mum.com.cn/p-6147470.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 极速安全vnp在哪下载 福建十一选五走势图十一选五前三 买nba篮彩哪个软件好 街机电玩捕鱼手机版下载 快乐双彩2018218开奖结果 星空棋牌台州游戏大厅 捕鸟达人凤凰 极速6合开奖怎么看 群英会开奖走势图 秒速飞艇教学 福建11选5杀号技巧 北京快3 快乐飞艇首页 山东十一选五最大遗漏 澳门赛马会官方网 什么杭州麻将app可以一起玩