• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 10
    • 下载费用:30 金币  

    怎样玩重庆时时彩能赚钱: 一种个性化微博信息推荐系统和方法.pdf

    关 键 词:
    一种 个性化 信息 推荐 系统 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201410074943.9

    申请日:

    2014.03.03

    公开号:

    CN103778260A

    公开日:

    2014.05.07

    当前法律状态:

    撤回

    有效性:

    无权

    法律详情: 发明专利申请公布后的视为撤回IPC(主分类):G06F 17/30申请公布日:20140507|||实质审查的生效IPC(主分类):G06F 17/30申请日:20140303|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 哈尔滨工业大学
    发明人: 张宇; 宋巍; 刘挺
    地址: 150001 黑龙江省哈尔滨市南岗区西大直街92号
    优先权:
    专利代理机构: 哈尔滨市松花江专利商标事务所 23109 代理人: 杨立超
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410074943.9

    授权公告号:

    ||||||

    法律状态公告日:

    2017.11.24|||2014.06.04|||2014.05.07

    法律状态类型:

    发明专利申请公布后的视为撤回|||实质审查的生效|||公开

    摘要

    一种个性化微博信息推荐系统和方法,它涉及个性化信息推荐系统和方法,属于社交媒体信息服务技术领域。本发明要解决现有微博平台存在用户获取信息的质量与效率低、信息的有效传播速度较低的问题。本发明中一种个性化微博信息推荐系统,包括:微博特征抽取???、用户兴趣模型???、微博信息推荐???、微博信息展示??榧笆菽??。本发明中一种个性化微博信息推荐方法,主要包括以下几个步骤:a、用户访问系统时,获取当前实时的微博列表、用户的偏好及相关设置信息;b、抽取当前微博列表中每一条微博的统计、文本特征;c、按照微博信息推荐??樗黾际醵杂没Щ袢〉奈⒉┙信判?,将相关度大的微博优先排序。本发明适用于互联网交互与共享平台。

    权利要求书

    权利要求书
    1.  一种个性化微博信息推荐系统,其特征在于它包括:微博特征抽取??椋?)、用户兴趣模型??椋?)、微博信息推荐??椋?)、微博信息展示??椋?)和数据???,其中:数据??榘ㄎ⒉┬畔⒛?椋?)、用户信息数据库(1)和用户浏览设置??椋?);
    微博特征抽取??椋?):根据用户历史信息与行为,对微博进行语义分析与建模,每一篇微博被表示为一个词向量的形式,记为Vd,其中每一个词具有一个权重,权重的计算公式为:
    weight(w,d)=tf(w,d)logNdf(w)]]>
    其中,其中weight(w,d)表示微博d中词w的权重,tf(w,d)表示词w在微博d中出现的频率,df(w)表示词w出现在多少篇不同的微博中,N为微博的总数,df(w)和N的值都基于不断爬取的微博数据进行统计;
    用户兴趣模型??椋?):计算、存储能体现用户兴趣偏好的特征,并在预定时间内根据用户访问系统的行为更新相应用户的特征信息,用户模型为一个具有权重的词向量,记为Vu,其中每一个词的权重按照如下公式进行计算:
    weight(w,u)=tf(w,u)logMuf(u)]]>
    其中,其中weight(w,u)表示针对用户u中词w的权重,tf(w,u)表示词w在该用户发表过的所有微博中中出现的频率,uf(w)表示词w曾被多少个不同用户使用,M为微博用户的总数,同样,uf(w)和M的值都基于不采集的微博数据进行统计;
    微博信息推荐??椋?):根据当前实时微博列表及用户的特征信息,基于微博特征抽取??橛胗没巳つP湍?榈氖涑?,即微博模型与用户兴趣模型,进行相关度的计算,按照计算结果将微博列表排序,该??槟谥枚嘀指鲂曰耐萍龇绞?,并行计算结果;
    所述多种个性化的推荐方式分别为:
    方式1:圈中热语,将用户关注的用户中具有较大转发量的微博优先排序,每一个微博被赋予一个评分代表其优先级,计算公式为:
    p(d|u)=Σf∈Fp(d|f)p(f|u)]]>
    其中p(d|u)表示对于用户u微博d的打分,F为用户u关注的用户集合,p(d|f)表示用户u关注的一个用户f对微博d的打分,如果f发表、转发或评论了微博d,则将其置为 1,否则置为0,p(f|u)为用户u对用户f的关注程度根据两者之间的交互频率计算,按照这一公式对所有微博候选进行由高到低排序推荐给用户;
    方式2:密友寻踪,将用户关注的用户按照交互频率进行排序,将排在前面的用户发表的微博优先显示;
    方式3:相似口味,计算用户模型Vu与微博模型Vd之间的相似度,计算方式如下:
    Sim(Vu,Vd)=Vu·Vd|Vu||Vd|]]>
    即两个词向量的内积与它们各自模的乘积的比值,成为余弦相似度,根据公式对所有的微博候选进行排序并推荐;
    微博信息展示??椋?):根据推荐??橹屑扑愕呐判蚪峁?,将微博信息呈现给用户;
    数据??椋?BR>用于数据的获取和储存,包括:
    微博信息??椋?):实时地获取、存储用户能接收到的所有微博信息;
    用户信息数据库(1):静态地存储微博用户的文本、社交方面信息;
    用户浏览设置??椋?):用户可自主地选择接收微博个性化推荐服务的方式。

    2.  如权利要求1所述的一种个性化微博信息推荐系统,其特征在于用户信息数据库(1),该??榇娲⒂没ё⒉嵯低呈钡木蔡粜?;同时,该??榛勾娲⒂没褂梦⒉┓窈罄刍奈谋炯吧缃还叵盗礁鑫鹊男畔?;此外,该??榛垢涸鸫娲⒂没褂猛萍鱿低骋岳吹耐缧形僮?。

    3.  如权利要求1所述的一种个性化微博信息推荐系统,其特征在于利用用户浏览设置??椋?),用户可自主地选择推荐算法,从而浏览到不同排序的微博内容,当用户首次使用推荐系统时,系统可设置一默认选项。

    4.  一种个性化微博信息推荐方法,其特征在于它包括以下步骤:
    a、用户登入推荐系统时,获取其关注者近期发布的所有微博信息,即实时微博列表,同时获取用户偏好信息;
    b、抽取实时微博列表中每条微博的特征;
    c、计算用户偏好信息与实时微博列表中每一条微博的相关度,将相关度大的微博即用户最有可能感兴趣的微博优先展示;
    d、用户对微博进行操作时,服务器记录其操作行为;
    e、用户退出系统后,在预定时间内,更新用户在文本、社交上的偏好,用于其下一次登入的微博信息推荐。

    说明书

    说明书一种个性化微博信息推荐系统和方法
    技术领域
    本发明涉及个性化信息推荐系统和方法,属于社交媒体信息服务技术领域。
    背景技术
    近年来,社会媒体作为互联网新兴的交互与共享平台发展迅速。大量用户通过社会媒体进行信息的消费与共享。例如,社交网络网站Facebook全球注册用户超过5亿,新浪微博的注册用户超过2亿。
    微博平台是最典型的社交媒体之一,如:Twitter和新浪微博。用户可以同时关注微博平台上的其他用户来读取其他用户发布的信息。在微博平台,用户允许发布长度不超过140个字的短文本。由于微博文本短小,与手机、即时通信服务软件的连接使得微博发布门槛很低,用户可以随时随地进行更新。用户发布的信息包含多种主题,可能包括日常琐事、心情记录、产业资讯等等。现有的微博服务,通常将用户关注的人群发布的所有信息按照时间排序返回给用户浏览。随着关注人数的增多,用户每天将接收到大量的微博信息,已经超出用户可以有效处理的限度,称之为“信息过载”的问题,即用户浏览到的大量微博并非自己真正需要的、感兴趣的,这将严重耗费用户的时间与精力。因此,十分有必要考虑用户个性化因素,自动识别不同用户的兴趣偏好,优先呈现用户最想看到的信息内容,提高用户获取信息的质量与效率,加快信息的有效传播。
    发明内容
    本发明要解决现有微博平台存在没有很好地考虑微博信息受众的兴趣偏好差异,致使用户获取信息的质量与效率低、信息的有效传播速度较低的问题,而提出一种个性化微博信息推荐系统和方法。
    本发明中的一种个性化微博信息推荐系统,包括:微博特征抽取???、用户兴趣模型???、微博信息推荐???、微博信息展示???和数据???,其中:数据??榘ㄎ⒉┬畔⒛??、用户信息数据库1和用户浏览设置???;
    微博特征抽取???:根据用户历史信息与行为,对微博进行语义分析与建模,每一篇微博被表示为一个词向量的形式,记为Vd,其中每一个词具有一个权重,权重的计算公式为:
    weight(w,d)=tf(w,d)logNdf(w)]]>
    其中weight(w,d)表示微博d中词w的权重,tf(w,d)表示词w在微博d中出现的频率,df(w)表示词w出现在多少篇不同的微博中,N为微博的总数,df(w)和N的值都基于不断获取的微博数据进行统计;
    用户兴趣模型???:计算、存储能体现用户兴趣偏好的特征,并在预定时间内根据用户访问系统的行为更新相应用户的特征信息,用户模型为一个具有权重的词向量,记为Vu,其中每一个词的权重按照如下公式进行计算:
    weight(w,u)=tf(w,u)logMuf(u)]]>
    其中weight(w,u)表示针对用户u中词w的权重,tf(w,u)表示词w在该用户发表过的所有微博中中出现的频率,uf(w)表示词w曾被多少个不同用户使用,M为微博用户的总数,同样,uf(w)和M的值都基于不采集的微博数据进行统计;
    微博信息推荐???:根据当前实时微博列表及用户的特征信息,基于微博特征抽取??橛胗没巳つP湍?榈氖涑?,即微博模型与用户兴趣模型,进行相关度的计算,按照计算结果将微博列表排序,该??榭赡谥枚嘀指鲂曰耐萍龇绞?,并行计算结果;
    方式1:圈中热语,将用户关注的用户中具有较大转发量的微博优先排序,每一个微博被赋予一个评分代表其优先级,计算公式为:
    p(d|u)=Σf∈Fp(d|f)p(f|u)]]>
    其中p(d|u)表示对于用户u微博d的打分,F为用户u关注的用户集合,p(d|f)表示用户u关注的一个用户f对微博d的打分,如果f发表、转发或评论了微博d,则将其置为1,否则置为0,p(f|u)为用户u对用户f的关注程度根据两者之间的交互频率计算,因此,这个公式的意义在于有越多的用户u关注的,关系密切的用户对一条微博感兴趣,这条微博应该与用户u更相关,按照这一公式对所有微博候选进行排序推荐给用户;
    方式2:密友寻踪,将用户关注的用户按照交互频率进行排序,将排在前面的用户发表的微博优先显示;
    方式3:相似口味,计算用户模型Vu与微博模型Vd之间的相似度,计算方式如下:
    Sim(Vu,Vd)=Vu·Vd|Vu||Vd|]]>
    即两个词向量的内积与它们各自模的乘积的比值,成为余弦相似度,这里假设包含用 户模型中重要的词的微博与用户兴趣更贴近,应被优先推荐。根据该公式对所有的微博候选进行排序并推荐;
    微博信息展示???:根据推荐??橹屑扑愕呐判蚪峁?,将微博信息呈现给用户,在考虑用户兴趣偏好的同时,为进一步降低用户获取信息的时间成本,该??榻峁┮恢中掠钡某氏址绞剑和ü⒉┕丶时昵?、文本内容摘要等极其简短的文字,使用户在极短的时间内了解当前微博信息的主题,同时用户可有选择地点击链接查看详细内容;
    数据??椋?
    用于数据的获取和储存,包括:
    微博信息???:实时地获取、存储用户能接收到的所有微博信息;
    用户信息数据库1:静态地存储微博用户的文本、社交等方面信息;
    用户浏览设置???:用户可自主地选择接收微博个性化推荐服务的方式;
    一种个性化微博信息推荐方法,包括以下步骤:
    a、用户登入推荐系统时,获取其关注者近期发布的所有微博信息,即实时微博列表,同时获取用户偏好信息;
    b、抽取实时微博列表中每条微博的特征;
    c、计算用户偏好信息与实时微博列表中每一条微博的相关度,将相关度大的微博即用户最有可能感兴趣的微博优先展示;
    d、用户对微博进行操作时,服务器记录其操作行为;
    e、用户退出系统后,在预定时间内,更新用户在文本、社交上的偏好,用于其下一次登入的微博信息推荐。
    本发明充分考虑了用户个性化因素,自动识别不同用户的兴趣偏好,优先呈现用户最想看到的信息内容,提高用户获取信息的质量与效率,加快信息的有效传播。与现有技术相比,本发明中的一种个性化微博信息推荐方法的优点是:自动地识别微博用户在文本、社交上的偏好信息,实现个性化的微博信息服务,使得用户优先浏览到最关注、最感兴趣的微博内容;同时,新颖的呈现方式,能进一步降低用户获取信息的时间成本。本发明适用于互联网交互与共享平台。
    附图说明
    图1为本发明实施例的个性化微博信息推荐系统的结构框图;
    图2为本发明实施例的个性化微博信息推荐方法的流程图。
    具体实施方式
    为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。图1所示为本发明实施例的个性化微博信息推荐系统结构框图。
    具体实施方式一、本发明中一种个性化微博信息推荐系统.包括以下??椋何⒉┨卣鞒槿∧??、用户兴趣模型???、微博信息推荐???、微博信息展示???和数据???,其中:数据??榘ㄎ⒉┬畔⒛??、用户信息数据库1和用户浏览设置???;
    微博特征抽取???:根据用户历史信息与行为,对微博进行语义分析与建模,每一篇微博被表示为一个词向量的形式,记为Vd,其中每一个词具有一个权重,权重的计算公式为:
    weight(w,d)=tf(w,d)logNdf(w)]]>
    其中weight(w,d)表示微博d中词w的权重,tf(w,d)表示词w在微博d中出现的频率,df(w)表示词w出现在多少篇不同的微博中,N为微博的总数,df(w)和N的值都基于不断获取的微博数据进行统计;
    用户兴趣模型???:计算、存储能体现用户兴趣偏好的特征,并在预定时间内根据用户访问系统的行为更新相应用户的特征信息,用户模型为一个具有权重的词向量,记为Vu,其中每一个词的权重按照如下公式进行计算:
    weight(w,u)=tf(w,u)logMuf(u)]]>
    其中weight(w,u)表示针对用户u中词w的权重,tf(w,u)表示词w在该用户发表过的所有微博中中出现的频率,uf(w)表示词w曾被多少个不同用户使用,M为微博用户的总数,同样,uf(w)和M的值都基于不采集的微博数据进行统计;
    微博信息推荐???:根据当前实时微博列表及用户的特征信息,基于微博特征抽取??橛胗没巳つP湍?榈氖涑?,即微博模型与用户兴趣模型,进行相关度的计算,按照计算结果将微博列表排序,该??榭赡谥枚嘀指鲂曰耐萍龇绞?,并行计算结果;
    方式1:圈中热语,将用户关注的用户中具有较大转发量的微博优先排序,每一个微博被赋予一个评分代表其优先级,计算公式为:
    p(d|u)=Σf∈Fp(d|f)p(f|u)]]>
    其中p(d|u)表示对于用户u微博d的打分,F为用户u关注的用户集合,p(d|f)表示用户u关注的一个用户f对微博d的打分,如果f发表、转发或评论了微博d,则将其置为1,否则置为0,p(f|u)为用户u对用户f的关注程度根据两者之间的交互频率计算,因此,这个公式的意义在于有越多的用户u关注的,关系密切的用户对一条微博感兴趣,这条微博应该与用户u更相关,按照这一公式对所有微博候选进行排序推荐给用户;
    方式2:密友寻踪,将用户关注的用户按照交互频率进行排序,将排在前面的用户发表的微博优先显示;
    方式3:相似口味,计算用户模型Vu与微博模型Vd之间的相似度,计算方式如下:
    Sim(Vu,Vd)=Vu·Vd|Vu||Vd|]]>
    即两个词向量的内积与它们各自模的乘积的比值,成为余弦相似度,这里假设包含用户模型中重要的词的微博与用户兴趣更贴近,应被优先推荐。根据公式对所有的微博候选进行排序并推荐;
    微博信息展示???:根据推荐??橹屑扑愕呐判蚪峁?,将微博信息呈现给用户,在考虑用户兴趣偏好的同时,为进一步降低用户获取信息的时间成本,该??榻峁┮恢中掠钡某氏址绞剑和ü⒉┕丶时昵?、文本内容摘要等极其简短的文字,使用户在极短的时间内了解当前微博信息的主题,同时用户可有选择地点击链接查看详细内容;
    数据??椋?
    用于数据的获取和储存,包括:
    微博信息???:实时地获取、存储用户能接收到的所有微博信息;
    用户信息数据库1:静态地存储微博用户的文本、社交等方面信息;
    用户浏览设置???:用户可自主地选择接收微博个性化推荐服务的方式;
    具体实施方式二、本实施方式是对具体实施方式一中用户信息数据库1的进一步说明,用户信息数据库1,该??榇娲⒂没ё⒉嵯低呈钡木蔡粜?;同时,该??榛勾娲⒂没褂梦⒉┓窈罄刍奈谋炯吧缃还叵盗礁鑫鹊男畔?;此外,该??榛垢涸鸫娲⒂没褂猛萍鱿低骋岳吹耐缧形僮?。
    具体实施方式三、本实施方式是对具体实施方式一中用户浏览设置???的进一步说明,用户可自主地选择推荐算法,从而浏览到不同排序的微博内容,当用户首次使用推荐 系统时,系统可设置一默认选项。
    具体实施方式四、本发明中一种个性化微博信息推荐方法包括下述步骤:
    步骤101,用户登入推荐系统时,获取其关注者近期发布的所有微博信息,即实时微博列表,同时获取用户偏好信息。其中,包括用户文本及社交上的偏好??梢酝ü杂没Ч⒈?、转发、收藏的微博以及发表的评论的文本分析,得到带有权重的关键词向量;通过粉丝与用户、用户与关注之间的互动,得到用户最关注的人群、最关注用户的人群以及与用户互动最密切的人群列表。
    步骤102,抽取实时微博列表中每条微博的特征。对微博文本进行分析,计算得出代表该微博的文本向量,同时抽取该微博作者及原创作者的信息。
    步骤103,计算用户偏好信息与实时微博列表中每一条微博的相关度,将相关度大的微博即用户最有可能感兴趣的微博优先展示??梢约扑阌没谋酒糜胛⒉┪谋炯涞南嗨贫?,并查看该微博的作者或原创微博的作者是否在用户社交上的偏好人群列表中,若在,则将该作者相应的权重与文本相似度线性组合,得出最终的相似度。
    步骤104,用户对微博进行操作时,服务器记录其操作行为。用户的兴趣可能随着时间而产生便宜。而用户对微博列表的点击、图片的浏览、链接的点击、作者页面的浏览等都能在一定程度上体现用户的偏好。因此,将其记录下来,用于更精准地计算用户的兴趣模型。
    步骤105,用户退出系统后,在预定时间内,更新用户在文本、社交上的偏好,用于其下一次登入的微博信息推荐。

    关于本文
    本文标题:一种个性化微博信息推荐系统和方法.pdf
    链接地址://www.4mum.com.cn/p-6185376.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 500彩票极速快三网址 11选5稳赚任选3计划 青朋棋牌游戏官方下载 信用卡中介赚钱 天天棋牌ios下载安装 阿里度能赚钱么 pk10技巧345678定位 pk10冠军定位公式 5分快三精准计划网址 重庆快乐十分爱彩乐走势图 极品飙车怎么玩 五码倍投 新69棋牌 scp-823 恐怖嘉年华 彩客网官方首页 波克棋牌旧版下载