• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 15
    • 下载费用:30 金币  

    重庆时时彩预测软件喜羊羊版: 一种用户关系预测方法及装置.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201610986113.2

    申请日:

    2016.11.09

    公开号:

    CN106570764A

    公开日:

    2017.04.19

    当前法律状态:

    实审

    有效性:

    审中

    法律详情: 实质审查的生效IPC(主分类):G06Q 50/00申请日:20161109|||公开
    IPC分类号: G06Q50/00(2012.01)I; G06F17/30 主分类号: G06Q50/00
    申请人: 广州杰赛科技股份有限公司
    发明人: 杜翠凤
    地址: 510310 广东省广州市海珠区新港中路381号31分箱
    优先权:
    专利代理机构: 广州三环专利代理有限公司 44202 代理人: 麦小婵;郝传鑫
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610986113.2

    授权公告号:

    |||

    法律状态公告日:

    2017.05.17|||2017.04.19

    法律状态类型:

    实质审查的生效|||公开

    摘要

    本发明公开了一种用户关系预测方法,包括:分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度;分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每个移动用户与所述目标用户的用户关系。另外,本发明还公开了一种用户关系预测装置。采用本发明实施例,能够提高用户关系预测的精确度。

    权利要求书

    1.一种用户关系预测方法,其特征在于,包括:
    分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹数据
    包括用户终端发生业务的时间戳和基站识别码;
    根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似
    度;
    分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;
    根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预测每
    个移动用户与所述目标用户的用户关系。
    2.如权利要求1所述的用户关系预测方法,其特征在于,所述根据所述轨迹数据,分别
    计算每个移动用户与所述目标用户在地理位置上的位置相似度,具体包括:
    根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户的区
    域分布;
    根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用户在
    地理位置上的位置相似度。
    3.如权利要求2所述的用户关系预测方法,其特征在于,所述区域分布算法如下:
    <mrow> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mi>&delta;</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基
    站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区
    域分布;
    所述位置相似度算法如下:
    <mrow> <mi>S</mi> <mi>C</mi> <mi>o</mi> <mi>S</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>r</mi> <mo>&Element;</mo> <mi>L</mi> <mi>o</mi> <mi>c</mi> </mrow> </munder> <mfrac> <mrow> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <mo>&times;</mo> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)
    为用户u与用户v的位置相似度。
    4.如权利要求3所述的用户关系预测方法,其特征在于,所述关系预测模型如下:
    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,
    v)为用户u与用户v的用户关系。
    5.如权利要求1至4任一项所述的用户关系预测方法,其特征在于,在所述根据所述轨
    迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置相似度之前,还包括:
    将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;
    根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标用
    户在工作时段的时间和地理位置的第一重合度;
    根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目标
    用户在非工作时段的时间和地理位置的第二重合度;
    将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用户在
    时间和地理位置上的实际重合度;
    去除所述实际重合度小于预设阈值的移动用户;
    所述重合度算法如下:
    <mrow> <mi>C</mi> <mi>o</mi> <mi>L</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>&Delta;</mi> <mi>T</mi> <mo>-</mo> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>v</mi> <mo>)</mo> <mo>|</mo> <mo>)</mo> </mrow> <mo>(</mo> <mi>&delta;</mi> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>&Delta;</mi> <mi>T</mi> <mo>-</mo> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>v</mi> <mo>)</mo> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户
    终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)
    为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,
    li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作
    时段的权重。
    6.一种用户关系预测装置,其特征在于,包括:
    数据提取???,用于分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹
    数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;
    位置相似度计算???,用于根据所述轨迹数据,分别计算每个移动用户与所述目标用
    户在地理位置上的位置相似度;
    社交相似度计算???,用于分别计算每个移动用户与所述目标用户在社交网络上的社
    交相似度;以及,
    预测???,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模
    型,分别预测每个移动用户与所述目标用户的用户关系。
    7.如权利要求6所述的用户关系预测装置,其特征在于,所述位置相似度计算??榫咛?br />包括:
    区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目标用
    户和每个移动用户的区域分布;以及,
    位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每个移
    动用户与所述目标用户在地理位置上的位置相似度。
    8.如权利要求7所述的用户关系预测装置,其特征在于,所述区域分布算法如下:
    <mrow> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>n</mi> </munderover> <mfrac> <mrow> <mi>&delta;</mi> <mrow> <mo>(</mo> <mi>r</mi> <mo>,</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>)</mo> </mrow> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务的基
    站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u的区
    域分布;
    所述位置相似度算法如下:
    <mrow> <mi>S</mi> <mi>C</mi> <mi>o</mi> <mi>S</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <munder> <mo>&Sigma;</mo> <mrow> <mi>r</mi> <mo>&Element;</mo> <mi>L</mi> <mi>o</mi> <mi>c</mi> </mrow> </munder> <mfrac> <mrow> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>&times;</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> </mrow> <mrow> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> <mo>&times;</mo> <mo>|</mo> <mo>|</mo> <mi>G</mi> <mi>P</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>,</mo> <mi>r</mi> <mo>)</mo> </mrow> <mo>|</mo> <mo>|</mo> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS(u,v)
    为用户u与用户v的位置相似度。
    9.如权利要求8所述的用户关系预测装置,其特征在于,所述关系预测模型如下:
    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);
    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,MR(u,
    v)为用户u与用户v的用户关系。
    10.如权利要求6至9任一项所述的用户关系预测装置,其特征在于,所述用户关系预测
    装置还包括:
    数据划分???,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段
    轨迹数据;
    第一重合度计算???,用于根据所述工作时段轨迹数据,采用重合度算法,分别计算每
    个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;
    第二重合度计算???,用于根据所述非工作时段轨迹数据,采用重合度算法,分别计算
    每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;
    实际重合度计算???,用于将所述第一重合度和所述第二重合度进行累加,获得每个
    移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,
    过滤???,用于去除所述实际重合度小于预设阈值的移动用户;
    所述重合度算法如下:
    <mrow> <mi>C</mi> <mi>o</mi> <mi>L</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>,</mo> <mi>v</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfrac> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>&Delta;</mi> <mi>T</mi> <mo>-</mo> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>v</mi> <mo>)</mo> <mo>|</mo> <mo>)</mo> </mrow> <mo>(</mo> <mi>&delta;</mi> <mo>(</mo> <mrow> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> <mo>,</mo> <msub> <mi>l</mi> <mi>i</mi> </msub> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> <mo>)</mo> </mrow> <mrow> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>i</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>u</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <msubsup> <mo>&Sigma;</mo> <mrow> <mi>j</mi> <mo>=</mo> <mn>1</mn> </mrow> <mrow> <mi>n</mi> <mrow> <mo>(</mo> <mi>v</mi> <mo>)</mo> </mrow> </mrow> </msubsup> <mi>&theta;</mi> <mrow> <mo>(</mo> <mi>&Delta;</mi> <mi>T</mi> <mo>-</mo> <mo>|</mo> <msub> <mi>T</mi> <mi>i</mi> </msub> <mo>(</mo> <mi>u</mi> <mo>)</mo> <mo>-</mo> <msub> <mi>T</mi> <mi>j</mi> </msub> <mo>(</mo> <mi>v</mi> <mo>)</mo> <mo>|</mo> <mo>)</mo> </mrow> </mrow> </mfrac> <mo>;</mo> </mrow>
    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的用户
    终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj(v)
    为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别码,
    li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工作
    时段的权重。

    说明书

    一种用户关系预测方法及装置

    技术领域

    本发明涉及移动通信技术领域,尤其涉及一种用户关系预测方法及装置。

    背景技术

    随着移动应用的发展,以QQ和微信为代表的基于社交网络和位置融合的移动应用
    已经成为用户在现实世界活动的镜像。用户通过相互通信形成了一种复杂的社会网络,该
    网络在一定程度上体现了用户的交友偏好、用户之间的关系和用户的行为模式。因此,越来
    越多的商家开始关注信息如何在复杂的社会网络进行有效扩散,以便商家或者运营商实现
    个性化的位置、好友和广告推荐。

    用户关系的预测起源于“六度理论”,即任意两个陌生人之间只需要6个中间人即
    可产生联系,随着互联网和移动通信的发展、交通方式的进步,人们的社交圈也会越来越广
    泛,当今社会网络两个人认识的中间人甚至更少,例如Facebook社交网站的统计己经将这
    一数字变为了4.7。Lambiotte提出,移动用户双方的社交关系紧密程度和他们之间的距离
    的平方成反比,用户会优先选择与他距离较小的人交朋友。Newman用用户间的相似度证明
    了用户共同好友的个数与他们在将来会成为好友的可能性存在正相关的关系。Adamic和
    Adar通过统计共同好友的好友情况来分析用户关系,在考虑社交关系的基础上,通过
    Adamic-Adar系数来衡量用户之间社交关系。Lu考虑到用户关系的差异性,将用户间的关系
    赋予不同的权值,提出一种结合用户关系权重的用户关系分析方法。然而上述的方法仅仅
    从社交网络或者地理位置单一的角度来挖掘用户之间的关系,没有综合他们现实世界和虚
    拟世界两方面的特性来考虑问题而导致挖掘出来的用户关系精确度不高。

    发明内容

    本发明实施例提出一种用户关系预测方法及装置,能够提高用户关系预测的精确
    度。

    本发明实施例提供一种用户关系预测方法,包括:

    分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述轨迹
    数据包括用户终端发生业务的时间戳和基站识别码;

    根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的位置
    相似度;

    分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;

    根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别预
    测每个移动用户与所述目标用户的用户关系。

    进一步地,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地
    理位置上的位置相似度,具体包括:

    根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户
    的区域分布;

    根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用
    户在地理位置上的位置相似度。

    进一步地,所述区域分布算法如下:


    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务
    的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u
    的区域分布;

    所述位置相似度算法如下:


    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS
    (u,v)为用户u与用户v的位置相似度。

    进一步地,所述关系预测模型如下:

    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);

    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,
    MR(u,v)为用户u与用户v的用户关系。

    进一步地,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在
    地理位置上的位置相似度之前,还包括:

    将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;

    根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目
    标用户在工作时段的时间和地理位置的第一重合度;

    根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述
    目标用户在非工作时段的时间和地理位置的第二重合度;

    将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用
    户在时间和地理位置上的实际重合度;

    去除所述实际重合度小于预设阈值的移动用户;

    所述重合度算法如下:


    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的
    用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj
    (v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别
    码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工
    作时段的权重。

    相应地,本发明实施例还提供一种用户关系预测装置,包括:

    数据提取???,用于分别提取每个移动用户和预设的目标用户在预设时间段内的
    轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;

    位置相似度计算???,用于根据所述轨迹数据,分别计算每个移动用户与所述目
    标用户在地理位置上的位置相似度;

    社交相似度计算???,用于分别计算每个移动用户与所述目标用户在社交网络上
    的社交相似度;以及,

    预测???,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预
    测模型,分别预测每个移动用户与所述目标用户的用户关系。

    进一步地,所述位置相似度计算??榫咛灏ǎ?br />

    区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目
    标用户和每个移动用户的区域分布;以及,

    位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每
    个移动用户与所述目标用户在地理位置上的位置相似度。

    进一步地,所述区域分布算法如下:


    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务
    的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u
    的区域分布;

    所述位置相似度算法如下:


    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS
    (u,v)为用户u与用户v的位置相似度。

    进一步地,所述关系预测模型如下:

    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);

    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,
    MR(u,v)为用户u与用户v的用户关系。

    进一步地,所述用户关系预测装置还包括:

    数据划分???,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作
    时段轨迹数据;

    第一重合度计算???,用于根据所述工作时段轨迹数据,采用重合度算法,分别计
    算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;

    第二重合度计算???,用于根据所述非工作时段轨迹数据,采用重合度算法,分别
    计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;

    实际重合度计算???,用于将所述第一重合度和所述第二重合度进行累加,获得
    每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,

    过滤???,用于去除所述实际重合度小于预设阈值的移动用户;

    所述重合度算法如下:


    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的
    用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj
    (v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别
    码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工
    作时段的权重。

    实施本发明实施例,具有如下有益效果:

    本发明实施例提供的用户关系预测方法及装置,能够从移动用户和目标用户的用
    户终端发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与
    目标用户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标
    用户的用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测
    的精确度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过
    滤,降低其后用户关系预测的误差。

    附图说明

    图1是本发明提供的用户关系预测方法的一个实施例的流程示意图;

    图2是本发明提供的用户关系预测装置的一个实施例的结构示意图。

    具体实施方式

    下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完
    整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例?;?br />本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他
    实施例,都属于本发明?;さ姆段?。

    参见图1,本发明提供的用户关系预测方法的一个实施例的流程示意图,包括:

    S1、分别提取每个移动用户和预设的目标用户在预设时间段内的轨迹数据;所述
    轨迹数据包括用户终端发生业务的时间戳和基站识别码;

    S2、根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地理位置上的
    位置相似度;

    S3、分别计算每个移动用户与所述目标用户在社交网络上的社交相似度;

    S4、根据所述位置相似度和所述社交相似度,采用预先建立的关系预测模型,分别
    预测每个移动用户与所述目标用户的用户关系。

    需要说明的是,移动用户和目标用户在移动的过程中,其用户终端会发生各种业
    务或进行小区切换,这些信息都会记录在用户的轨迹数据中。在预测前,需先提取移动用户
    和目标用户在预设时间段内的轨迹数据。其中,轨迹数据包括业务的发起ID、开始时间、结
    束时间、开始基站识别码、接收基站识别码和接收ID。例如,对某市的某运营商的10万移动
    用户在一个月的全部轨迹数据进行提取,其中,轨迹数据的数据表如表1所示。

    发起ID
    开始时间
    结束时间
    开始站点
    结束站点
    接收ID
    156**
    20140801213209
    20140803352024
    20656
    23201
    186****
    156**
    20140802122342
    20140802352919
    23201
    20656
    156****
    156**
    。。。
    。。。
    。。。
    。。。

    156**
    20140806114635
    20140806114711
    23201
    20656
    156****

    表1

    在分别提取每个移动用户和目标用户的轨迹数据后,通过对用户的“时空切片”求
    余弦相似性即可得到用户在地理移动上的相关程度,从而计算出每个移动用户与目标用户
    在地理位置上的位置相似度。对于用户在社交网络上的社交相似度可采用现有技术中的社
    交相似度算法来进行计算,例如,采用A-A系数的算法。社交网络的链接预测最常见的预测
    方法为基于节点相似度的算法,在无向网络中,设任意节点u和v,节点u的邻居集合为F(u),
    节点v的邻居集合为F(v),则u和v的共同邻居为F(u)和F(v)的交集,记F(u)∩F(v)。经过归
    一化处理之后,u和v共同邻居占所有用户的比例为在考虑
    社交关系的基础上,A-A系数的算法对该公式进行改进提出A-A系数,链接预测中,一个兴趣
    被越少的人拥有,则拥有此兴趣的人越可能成为朋友,而大众兴趣的人之间成为朋友的可
    能性要低一些,因此该算法给度数较少的节点分配较高的相似度值,则用户在社交网络上
    的社交相似度计算为其中,t为u和v的共同邻居,dt为共
    同邻居t的度,即与共同邻居t直接连接的用户数量。

    在计算每个移动用户与目标用户在地理位置和社交网络上的相似度后,结合位置
    相似度和社交相似度,采用预先建立的关系预测模型,即可预测每个移动用户与目标用户
    的用户关系。在本实施例中,基于运营商的轨迹数据很容易通过运营商获取,使得轨迹数据
    的获取便利,而且本发明考虑了用户交往网络的动态性和地理位置的动态性变化,贴合运
    营商进行市场推广的特点。同时,结合社交网络和地理位置的相似度对用户关系进行预测,
    相对于现有技术中仅仅考虑社交网络的相似度来说,提高了用户关系预测的准确性。

    进一步地,所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在地
    理位置上的位置相似度,具体包括:

    根据所述轨迹数据,采用区域分布算法,分别计算所述目标用户和每个移动用户
    的区域分布;

    根据所述区域分布,采用位置相似度算法,分别计算每个移动用户与所述目标用
    户在地理位置上的位置相似度。

    需要说明的是,与基于社会网络研究社交关系类似,基于地理位置相似度来研究
    空间位置的相似性来描述用户关系的紧密程度。一般来说,在地理轨迹上相似程度高的用
    户成为好友的可能性也非常高。在提取用户的轨迹数据后,用户轨??赏ü旒J葜械?br />时间戳和基站识别码的组合来表示,根据用户轨迹即可获取用户的区域分布。例如,假设用
    户u的轨迹为<t1,l1>,<t2,l2>…<tn,ln>,其中,t为时间戳,l为基站识别码,n为用户的用户
    终端发生业务的次数,则用户u的区域分布为GP(u,r)。其中,按照小时颗粒度划分,用户的
    区域分布为用户在每个时间段出现在每个基站的概率分布。例如,某用户在每个时刻出现
    在每个基站的情况如表2所示。

    时间段
    基站ID1
    基站ID2
    基站IDj

    基站IDm
    1
    0.20

    0

    0.1
    ti

    0.8






    0


    24

    0.34
    1

    表2

    在获取用户的区域分布后,采用位置相似度算法,即通过对用户的“时空切片”求
    余弦相似性即可得到用户在地理移动上的相似度。

    进一步地,所述区域分布算法如下:


    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务
    的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u
    的区域分布。

    其中,当r=li(u)时,δ(r,li(u))=1,否则为0。

    进一步地,所述位置相似度算法如下:


    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS
    (u,v)为用户u与用户v的位置相似度。

    进一步地,所述关系预测模型如下:

    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);

    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,
    MR(u,v)为用户u与用户v的用户关系。

    基于地理位置和社交网络的重合度来构建关系预测模型,计算复杂度不高,省去
    了传统考虑多种社会因素进行建模的麻烦。

    进一步地,在所述根据所述轨迹数据,分别计算每个移动用户与所述目标用户在
    地理位置上的位置相似度之前,还包括:

    将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作时段轨迹数据;

    根据所述工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述目
    标用户在工作时段的时间和地理位置的第一重合度;

    根据所述非工作时段轨迹数据,采用重合度算法,分别计算每个移动用户与所述
    目标用户在非工作时段的时间和地理位置的第二重合度;

    将所述第一重合度和所述第二重合度进行累加,获得每个移动用户与所述目标用
    户在时间和地理位置上的实际重合度;

    去除所述实际重合度小于预设阈值的移动用户;

    所述重合度算法如下:


    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的
    用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj
    (v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别
    码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工
    作时段的权重。

    需要说明的是,在提取用户的轨迹数据后,还需结合地理位置和时间的重合度算
    法对数据进行去噪。先将提取的轨迹数据划分为工作时间段(8点-17点)的轨迹数据和非
    工作时间段(19点-24点)的轨迹数据。结合时间因素,以△T为时间精度(一般设为1个小
    时),反应所有用户在邻近时间在相同的地理位置的比例。同时,考虑工作时间段与非工作
    时间段的影响因素,在工作时间段和非工作时间段设置不同权重,由于本发明的重点是识
    别朋友关系,因此可设置非工作时间段的权重较大,而工作时间段的权重较小。设置好权重
    后,采用重合度算法,分别计算每个移动用户与目标用户在工作时间段的第一重合度,以及
    在非工作时间段的第二重合度。例如,设置非工作时间段的权重为0.7,工作时间段的权重
    为0.3,以便通过计算出的实际重合度来剔除在工作时间段与目标用户关系紧密的同事。通
    过地理位置和时间的重合度过滤掉大部分的同事关系,降低其后用户关系预测的误差。

    例如,对提取的某市某运营商的10万移动用户在一个月的全部轨迹数据进行去噪
    后,得到与目标用户的实际重合度满足一定阈值的移动用户仅有17302个。再把过滤后的用
    户的轨迹数据按照日期分为两部分,前20天作为训练集,后10天作为测试集。设置γ=0.2,
    根据预测关系??槎匝盗芳性げ?,得到一系列移动用户与目标用户之间的MR值(基于
    关系预测模型)和A-A值(基于A-A系数的算法)。再分别将MR值和A-A值按照大小排序,选择
    MR值大于0.25和A-A值大于0.5的用户关系作为候选集。最后与测试集进行比较,得到训练
    集中基于关系预测模型进行预测的正确率为0.82,基于A-A系数的算法进行预测的正确率
    为0.76,而测试集中基于关系预测模型进行预测的正确率为0.77,基于A-A系数的算法进行
    预测的正确率为0.68??杉?,仅考虑社交网络的关系预测方法在预测用户关系上的准确率
    较低。因此,结合社交网络和地理位置的重合度来进行用户关系预测能够提升用户关系预
    测的准确度。

    本发明实施例提供的用户关系预测方法,能够从移动用户和目标用户的用户终端
    发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与目标用
    户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标用户的
    用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测的精确
    度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过滤,降
    低其后用户关系预测的误差。

    相应的,本发明还提供一种用户关系预测装置,能够实现上述实施例中的用户关
    系预测方法的所有流程。

    参见图2,是本发明提供的用户关系预测装置的一个实施例的结构示意图,包括:

    数据提取???,用于分别提取每个移动用户和预设的目标用户在预设时间段内
    的轨迹数据;所述轨迹数据包括用户终端发生业务的时间戳和基站识别码;

    位置相似度计算???,用于根据所述轨迹数据,分别计算每个移动用户与所述目
    标用户在地理位置上的位置相似度;

    社交相似度计算???,用于分别计算每个移动用户与所述目标用户在社交网络
    上的社交相似度;以及,

    预测???,用于根据所述位置相似度和所述社交相似度,采用预先建立的关系预
    测模型,分别预测每个移动用户与所述目标用户的用户关系。

    进一步地,所述位置相似度计算??榫咛灏ǎ?br />

    区域分布计算单元,用于根据所述轨迹数据,采用区域分布算法,分别计算所述目
    标用户和每个移动用户的区域分布;以及,

    位置相似度计算单元,用于根据所述区域分布,采用位置相似度算法,分别计算每
    个移动用户与所述目标用户在地理位置上的位置相似度。

    进一步地,所述区域分布算法如下:


    其中,u为用户,r为用户终端发生业务的基站,li(u)为用户u的用户终端发生业务
    的基站识别码,n(u)为用户u的用户终端在预设时间段内发生业务的次数,GP(u,r)为用户u
    的区域分布;

    所述位置相似度算法如下:


    其中,Loc为用户终端发生业务的基站的集合,GP(v,r)为用户v的区域分布,SCoS
    (u,v)为用户u与用户v的位置相似度。

    进一步地,所述关系预测模型如下:

    MR(u,v)=γSimilarity(u,v)+(1-γ)SCoS(u,v);

    其中,Similarity(u,v)为用户u与用户v的社交相似度,γ为社交相似度的权重,
    MR(u,v)为用户u与用户v的用户关系。

    进一步地,所述用户关系预测装置还包括:

    数据划分???,用于将所述轨迹数据按照时间划分为工作时段轨迹数据和非工作
    时段轨迹数据;

    第一重合度计算???,用于根据所述工作时段轨迹数据,采用重合度算法,分别计
    算每个移动用户与所述目标用户在工作时段的时间和地理位置的第一重合度;

    第二重合度计算???,用于根据所述非工作时段轨迹数据,采用重合度算法,分别
    计算每个移动用户与所述目标用户在非工作时段的时间和地理位置的第二重合度;

    实际重合度计算???,用于将所述第一重合度和所述第二重合度进行累加,获得
    每个移动用户与所述目标用户在时间和地理位置上的实际重合度;以及,

    过滤???,用于去除所述实际重合度小于预设阈值的移动用户;

    所述重合度算法如下:


    其中,n(u)为用户u的用户终端在预设时间段内发生业务的次数,n(v)为用户v的
    用户终端在预设时间段内发生业务的次数,Ti(u)为用户u的用户终端发生业务的时间戳,Tj
    (v)为用户v的用户终端发生业务的时间戳,li(u)为用户u的用户终端发生业务的基站识别
    码,li(v)为用户v的用户终端发生业务的基站识别码,ΔT为时间精度,θ为工作时段或非工
    作时段的权重。

    本发明实施例提供的用户关系预测装置,能够从移动用户和目标用户的用户终端
    发生业务的信息中提取出用户的轨迹数据,再根据轨迹数据分别计算出移动用户与目标用
    户在地理位置和社交网络上的相似度,进而根据两个相似度预测出移动用户与目标用户的
    用户关系,基于地理位置和社交网络的相似度预测用户关系,提高了用户关系预测的精确
    度;通过每个移动用户与目标用户在时间和地理位置上的重合度对移动用户进行过滤,降
    低其后用户关系预测的误差。

    以上所述是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员
    来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也视为
    本发明的?;し段?。

    关 键 词:
    一种 用户 关系 预测 方法 装置
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    关于本文
    本文标题:一种用户关系预测方法及装置.pdf
    链接地址://www.4mum.com.cn/p-6092925.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03