• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 6
    • 下载费用:30 金币  

    重庆时时彩稳赚400计划: 一种融合社交信息的推荐系统解决方法.pdf

    关 键 词:
    一种 融合 社交 信息 推荐 系统 解决方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201610810501.5

    申请日:

    2016.09.08

    公开号:

    CN106384259A

    公开日:

    2017.02.08

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06Q 30/06申请日:20160908|||公开
    IPC分类号: G06Q30/06(2012.01)I; G06Q30/02(2012.01)I 主分类号: G06Q30/06
    申请人: 天津大学
    发明人: 成石; 王宝亮; 毛陆虹; 常鹏
    地址: 300072 天津市南开区卫津路92号
    优先权:
    专利代理机构: 天津市北洋有限责任专利代理事务所 12201 代理人: 程毓英
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610810501.5

    授权公告号:

    |||

    法律状态公告日:

    2017.03.08|||2017.02.08

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明涉及一种融合社交信息的推荐系统解决方法,包括:选取一段时间内的用户对商品的评分,以这些用户对这些商品的评分,用户好友关系信息和用户的自身特性作为数据集;统计出全部用户数和全部商品数,构建用户?商品真实评分矩阵,随机选取一部分评分数据作为训练集同时构建用户好友矩阵,用户自身特性矩阵;计算用户和其好友之间的相似度;采用隐语义模型,生成用户特征矩阵和商品特征矩阵,矩阵相乘得到预测评分;计算预测评分跟真实评分之间的均方根误差RMSE,并加入用户之间相似度作为社交信息对误差的权重。采用梯度下降算法对的用户特征和商品特征进行迭代更新。本发明有效提高对新用户的推荐准确度。

    权利要求书

    1.一种融合社交信息的推荐系统解决方法,包括下列步骤:
    (1)选取一段时间内的用户对商品的评分,以这些用户对这些商品的评分,用户好友关
    系信息和用户的自身特性作为数据集;
    (2)统计出全部用户数和全部商品数,构建用户-商品真实评分矩阵,随机选取一部分
    评分数据作为训练集,另一部分%的评分数据作为测试集,同时构建用户好友矩阵,用户自
    身特性矩阵;
    (3)根据(2)中得到的训练数据,按照下述公式计算用户和其好友之间的相似度:
    <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>+</mo> <mfrac> <msqrt> <msup> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>D</mi> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> <mrow> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>i</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>f</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> </mrow>
    I(i)为用户i评分的商品集,I(f)用户i的好友f评分的商品集,I(i)∩I(f)为用户i和
    其好友f都进行过评分的商品集,Rij为用户i对商品j的评分,Rfj为用户i的好友f对商品j的
    评分,为用户i的全部评分均值,为用户i的好友f的全部评分均值,Di为用户i的自身特
    性,Df为用户i的好友f的自身特性;
    (4)采用隐语义模型,提取用户和商品数量相同的潜在特征,生成用户特征矩阵和商品
    特征矩阵,矩阵相乘得到预测评分;计算预测评分跟真实评分之间的均方根误差RMSE,并加
    入用户之间相似度作为社交信息对误差的权重。最终整合的误差函数如下:
    <mrow> <mi>min</mi> <mi>&xi;</mi> <mrow> <mo>(</mo> <mi>R</mi> <mo>,</mo> <mi>U</mi> <mo>,</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mi>&alpha;</mi> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&Sigma;</mi> <mrow> <mi>f</mi> <mo>&Element;</mo> <mi>F</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </msub> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>U</mi> <mi>f</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>U</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>V</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>
    Ui为用户i的特征,Vj为商品j的特征,U为用户特征矩阵,V为商品特征矩阵。M为用户总
    数,N为商品总数。α为用户好友相似度权重,λ1,λ2为防止产生过拟合的正则化权重,F(i)为
    用户i的好友集,f为用户i的好友,Uf为好友f的特征,‖·‖2为欧式距离。
    (5)采用梯度下降算法对步骤(4)的用户特征和商品特征进行迭代更新,如果误差函数
    minξ(R,U,V)小于预设误差值或迭代次数达到预设次数则停止迭代,否则返回(4)继续计
    算。
    (6)采用测试集数据,进行算法评估,计算预测分数和真实分数的均方根误差RMSE,
    RMSE越小推荐结果越好,根据预测分数,对于目标用户,根据预测分数从大到小对商品进行
    排序,如果目标用户喜欢的商品集中在排序的靠前部分,则证明算法有效,反之说明算法无
    效。

    说明书

    一种融合社交信息的推荐系统解决方法

    技术领域

    本发明涉及个性化推荐技术,具体涉及一种融合社交信息的推荐系统方法。

    背景技术

    随着互联网的快速发展,随之产生的数据也在成指数型增加。用户在选择自己想
    要的信息或商品时花费越来越多的时间,反而导致用户体验降低。针对信息过载,目前有搜
    索和个性化推荐两种解决方法。

    个性化推荐系统是根据用户的历史行为和购买记录等信息,构建针对具体用户的
    个性化用户特征和商品特征。根据用户特征对商品进行筛选,推荐给与用户特征相近的商
    品。目前,个性化推荐系统已经在互联网的各个领域得到了广泛的应用,例如Amazon的商品
    推荐,iTunes的音乐推荐,Netflix的电影推荐等等。近年来,随着Facebook、微博、微信等社
    交网站的兴起,如何利用用户与用户之间的社交关系进行个性化推荐成为了研究的热点。
    社交关系中包含了大量信息,如果能充分挖掘并利用好这些信息??梢栽谝欢ǔ潭壬匣航?br />传统推荐系统存在的问题,对推荐系统是一个有效的补充,可以改善推荐的效果。

    个性化推荐系统的整体流程主要包括:收集并整理用户的历史记录和行为反馈构
    建数据集;根据数据集运用相应的算法得到用户特征;根据用户特征选取相对应的商品,并
    将商品推荐给用户;记录用户对推荐商品的反馈,评价推荐效果并更新数据集。

    发明内容

    本发明的目的是,提供一种融合社交信息的推荐系统解决方法。将社交好友之间
    的共性和差异有效的添加到用户特征之中。对传统的特征提取推荐算法进行一个社交化修
    正,从而能够更加快速准确的对每个用户提供个性化推荐。本发明的技术方案如下。

    一种融合社交信息的推荐系统解决方法,包括以下几个技术步骤:

    (1)选取一段时间内的用户对商品的评分,以这些用户对这些商品的评分,用户好
    友关系信息和用户的自身特性作为数据集;

    (2)统计出全部用户数和全部商品数,构建用户-商品真实评分矩阵,随机选取一
    部分评分数据作为训练集,另一部分%的评分数据作为测试集,同时构建用户好友矩阵,用
    户自身特性矩阵;

    (3)根据(2)中得到的训练数据,按照下述公式计算用户和其好友之间的相似度:

    <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>+</mo> <mfrac> <msqrt> <msup> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>D</mi> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> <mrow> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>i</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>f</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> </mrow>

    I(i)为用户i评分的商品集,I(f)用户i的好友f评分的商品集,I(i)∩I(f)为用户
    i和其好友f都进行过评分的商品集,Rij为用户i对商品j的评分,Rfj为用户i的好友f对商品
    j的评分,为用户i的全部评分均值,为用户i的好友f的全部评分均值,Di为用户i的自
    身特性,Df为用户i的好友f的自身特性;

    (4)采用隐语义模型,提取用户和商品数量相同的潜在特征,生成用户特征矩阵和
    商品特征矩阵,矩阵相乘得到预测评分;计算预测评分跟真实评分之间的均方根误差RMSE,
    并加入用户之间相似度作为社交信息对误差的权重。最终整合的误差函数如下:

    <mrow> <mi>min</mi> <mi>&xi;</mi> <mrow> <mo>(</mo> <mi>R</mi> <mo>,</mo> <mi>U</mi> <mo>,</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mi>&alpha;</mi> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&Sigma;</mi> <mrow> <mi>f</mi> <mo>&Element;</mo> <mi>F</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </msub> <mi>sin</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>U</mi> <mi>f</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>U</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>V</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>

    Ui为用户i的特征,Vj为商品j的特征,U为用户特征矩阵,V为商品特征矩阵。M为用
    户总数,N为商品总数。α为用户好友相似度权重,λ1,λ2为防止产生过拟合的正则化权重,F
    (i)为用户i的好友集,f为用户i的好友,Uf为好友f的特征,||·||2为欧式距离。

    (5)采用梯度下降算法对步骤(4)的用户特征和商品特征进行迭代更新,如果误差
    函数minξ(R,U,V)小于预设误差值或迭代次数达到预设次数则停止迭代,否则返回(4)继续
    计算。

    (6)采用测试集数据,进行算法评估,计算预测分数和真实分数的均方根误差
    RMSE,RMSE越小推荐结果越好,根据预测分数,对于目标用户,根据预测分数从大到小对商
    品进行排序,如果目标用户喜欢的商品集中在排序的靠前部分,则证明算法有效,反之说明
    算法无效。

    本发明针对于推荐系统数据稀疏和准确度不高的问题,融合用户社交网络数据有
    效提高对新用户的推荐准确度。

    具体实施方式

    本发明的基本思想是:在整个推荐系统中,对于某一具体用户i来说,其对商品的
    评分数据可能非常少,并且如果该用户为新用户,则无法有效的根据历史评分数据进行推
    荐。所以在推荐系统中增加社交网络信息,这样可用数据来源不仅仅是用户对商品的评分
    数据,还包括用户的个人信息,社交网络(好友、个人动态、最近关注等)信息。通过社交网络
    积累的信息,对用户进行更加全面详细的特征提取,通过提取的用户社交网络特征对目标
    用户进行特征修正。并引入用户好友的历史评分数据 作为对用户进行商品推荐的参考数
    据。下面对本发明做进一步说明。

    (1)构建数据集

    在本发明中,假设我们有一组用户对商品的历史评分数据,评分是从1到5的整数,
    1代表很不喜欢,5代表非常喜欢。并且除了评分数据之外,我们还有用户自身特征数据,如
    用户的年龄、性别、地区、学历、民族等信息,并将这些用户自身特征数据进行数值化离散化
    处理。在社交信息方面,假设我们有上述数据用户的好友网络,并且用户好友也各自对商品
    进行过评分;这里的好友为与某一具体用户i有相互交互的好友,也可以是用户i关注的热
    门人物。总体来说我们有三大块数据:用户对商品的评分数据,用户自身的特征数据,用户
    之间的社交网络关系数据。

    (2)构造训练数据和测试数据

    根据本发明的基本思想,首先需要对数据集清洗处理,对于数据集中的重复数据
    和异常数据进行删除,并将数据进行归一化结构化处理。将数据进行预处理之后,将全部的
    用户自身特征数据,全部的用户社交网络数据和随机选择75%的评分数据作为训练数据。
    随机选择25%的评分数据作为测试数据。

    根据本发明的基本思想,先统计出全部的用户数(用M表示)和全部的商品数(用N
    表示),构建用户-商品训练评分矩阵R和测试评分矩阵评分矩阵的行数为M,评分矩阵的
    列数为N。构建用户-用户好友关系矩阵F,矩阵F的行数和列数都为M;如果用户i和用户j为
    好友,则Fij=1,否则为0。在此用户自身默认为好友关系,易知,矩阵F为主对角线值全为1的
    对称矩阵。构建用户-自身特性矩阵D,矩阵D的行数为M,列数为前文提到的用户自身特性总
    数。

    最后,构建用户特征矩阵U,其行数为M,列数为提取出的特征数,本发明默认该值
    为20。构建商品特征矩阵V,其行数为N,列数为提取出的特征数,其值要与用户特征数一致,
    故也为20。矩阵U和V中数字的初始值为0-1之间的随机数。

    (3)计算用户与好友相似度

    对于每一个用户都需要计算其与其每个好友之间的相似度,相似度计算方式如下
    所示。

    <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> </mrow> <mrow> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>&Element;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> <mo>&cap;</mo> <mi>I</mi> <mrow> <mo>(</mo> <mi>f</mi> <mo>)</mo> </mrow> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>f</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msub> <mover> <mi>R</mi> <mo>&OverBar;</mo> </mover> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> <mo>+</mo> <mfrac> <msqrt> <msup> <mrow> <mo>(</mo> <msub> <mi>D</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>D</mi> <mi>f</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </msqrt> <mrow> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>i</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> <mo>&CenterDot;</mo> <msqrt> <mrow> <msup> <msub> <mi>D</mi> <mi>f</mi> </msub> <mn>2</mn> </msup> </mrow> </msqrt> </mrow> </mfrac> </mrow>

    其中:

    1)I(i)为用户i评分的商品集,I(f)用户i的好友f评分的商品集。I(i)∩I(f)为用
    户i和其好友f都进行过评分的商品集。

    2)Rij为用户i对商品j的评分,Rfj为用户i的好友f对商品j的评分;为用户i的全
    部评分均值,为用户i的好友f的全部评分均值。

    3)Di为用户i的自身特性,Df为用户i的好友f的自身特性。

    通过上式计算得到的好友相似度值填入在5.2节中构造的好友关系矩阵F中,替换
    矩阵中的原有值,得到更新后的好友关系矩阵F。

    (4)提取用户、商品特征

    在(3)中已经计算用户与好友之间的相似度,这个相似度在拟合用户、商品特征时
    起到一个约束作用。本发明采用隐语义模型提取用户和商品的潜在特征,拟合误差函数如
    下所示。

    <mrow> <mi>min</mi> <mi>&xi;</mi> <mrow> <mo>(</mo> <mi>R</mi> <mo>,</mo> <mi>U</mi> <mo>,</mo> <mi>V</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mn>1</mn> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <munderover> <mi>&Sigma;</mi> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <msup> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> <mo>+</mo> <mfrac> <mi>&alpha;</mi> <mn>2</mn> </mfrac> <munderover> <mi>&Sigma;</mi> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <msub> <mi>&Sigma;</mi> <mrow> <mi>f</mi> <mo>&Element;</mo> <mi>F</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </msub> <mi>sin</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>U</mi> <mi>f</mi> </msub> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>U</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <mo>|</mo> <mo>|</mo> <mi>V</mi> <mo>|</mo> <msup> <mo>|</mo> <mn>2</mn> </msup> </mrow>

    其中:

    (1)Ui为(2)中构建的用户特征矩阵U的第i行,即用户i的特征向量,初始值为0-1
    之间的浮点数。

    (2)Vj为(2)中构建的商品特征矩阵V的第j行,即商品j的特征向量,初始值为0-1
    之间的浮点数。

    (3)α为用户好友相似度权重,λ为防止产生过拟合的正则化权重。

    (4)F(i)为用户i的好友集。

    (5)||·||2为欧式距离。

    由上式可知,加入社交权重之后,为了让误差值更小,要使好友之间的特征更加接
    近。而相似度越高的两个好友,其特征值应该越接近。这样也符合好友之间有共通爱好的特
    点,体现了社交对用户进行商品选择和评分的影响。

    (5)更新用户、商品特征

    根据(4)中的误差函数,我们可以得到用户特征和商品特征相乘值与真实评分的
    差别。根据本发明的思想,相乘值与真实评分的差别越小越好,所以采用梯度下降算法对用
    户特征和商品特征迭代更新。迭代公式如下。

    <mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>:</mo> <mo>=</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>-</mo> <mi>&beta;</mi> <mfrac> <mrow> <mo>&part;</mo> <mi>&xi;</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> </mrow> </mfrac> </mrow>

    <mrow> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>:</mo> <mo>=</mo> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>-</mo> <mi>&beta;</mi> <mfrac> <mrow> <mo>&part;</mo> <mi>&xi;</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>V</mi> <mi>j</mi> </msub> </mrow> </mfrac> </mrow>

    <mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>&xi;</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>N</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>+</mo> <msub> <mi>&alpha;&Sigma;</mi> <mrow> <mi>f</mi> <mo>&Element;</mo> <mi>F</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>)</mo> </mrow> </mrow> </msub> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>f</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>-</mo> <msub> <mi>U</mi> <mi>f</mi> </msub> <mo>|</mo> <mo>|</mo> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>1</mn> </msub> <msub> <mi>U</mi> <mi>i</mi> </msub> </mrow>

    <mrow> <mfrac> <mrow> <mo>&part;</mo> <mi>&xi;</mi> </mrow> <mrow> <mo>&part;</mo> <msub> <mi>V</mi> <mi>j</mi> </msub> </mrow> </mfrac> <mo>=</mo> <mo>-</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>M</mi> </munderover> <mrow> <mo>(</mo> <msub> <mi>R</mi> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <msub> <mi>U</mi> <mi>i</mi> </msub> <mo>+</mo> <msub> <mi>&lambda;</mi> <mn>2</mn> </msub> <msub> <mi>V</mi> <mi>j</mi> </msub> </mrow>

    其中:

    (1)β为梯度下降的迭代步长。

    (2)为误差函数对用户i取偏导,为误差函数对商品j取偏导。

    更新得到的用户特征和商品特征,代回到(4)的误差函数中,计算新的误差值,当
    误差值达到预设的阈值或者迭代达到一定次数停止,否则一直在(4)和(5)交替进行计算。

    (6)进行误差评估

    对于推荐算法,一般会得到目标商品对潜在用户的预测评分。对于一个用户,根据
    得到的评分的从大到小对商品进行排名,根据实际业务需求,截取排名靠前的商品推荐给
    用户。通过上述(2)、(3)、(4)、(5)我们已经得到预测评分,在评价算法的时候,采用两种评
    价指标:

    1、均方根误差(RMSE),用预测分数和真实分数的均方根误差(RMSE)来衡量推荐结
    果的好坏,RMSE越小推荐结果越好。RMSE公式如下所示:

    <mrow> <mi>R</mi> <mi>M</mi> <mi>S</mi> <mi>E</mi> <mo>=</mo> <msqrt> <mrow> <mfrac> <mn>1</mn> <mrow> <mi>M</mi> <mi>N</mi> </mrow> </mfrac> <munder> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>,</mo> <mi>j</mi> </mrow> </munder> <msup> <mrow> <mo>(</mo> <msub> <mover> <mi>R</mi> <mo>^</mo> </mover> <mrow> <mi>i</mi> <mi>j</mi> </mrow> </msub> <mo>-</mo> <msubsup> <mi>U</mi> <mi>i</mi> <mi>T</mi> </msubsup> <msub> <mi>V</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> </msqrt> </mrow>

    2、根据预测分数,对于目标用户,根据预测分数从大到小对商品进行排序,如果目
    标用户喜欢的商品集中在排序的靠前部分,则证明算法有效,反之说明算法无效。

    综上所示,本发明提出一种利用社交网络信息增加推荐系统准确性方法,引入社
    交信息中的数据,对用户数据进行更加全面的挖掘。并选择目前主流的隐语义模型提取用
    户、商品特征,增加推荐系统可靠性。

    关于本文
    本文标题:一种融合社交信息的推荐系统解决方法.pdf
    链接地址://www.4mum.com.cn/p-6014016.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 赛车pk10走势图 快速时时官网 福建时时怎么玩 tt时时彩计划软件 北京pk拾稳赚技巧公式 福彩3d组三全包稳赚吗 北京福彩pk10前三走势图 p飞艇计划软件免费版 北京pk10提前一期开奖 福彩快3计划软件下载 极速16稳赚不翻倍挂机模式 2019女篮总决赛直播 北京pk赛车走势经验 福利彩票江苏快3开奖计划软件 11选5丹惠计划软件 江苏时时计划软件破解版