• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 8
    • 下载费用:30 金币  

    重庆时时彩总大小开奖: 一种WEB社会网络行为轨迹分析与控制子集获取方法.pdf

    关 键 词:
    一种 WEB 社会 网络 行为 轨迹 分析 控制 子集 获取 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201110091282.7

    申请日:

    2011.04.12

    公开号:

    CN102163227A

    公开日:

    2011.08.24

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):G06F 17/30申请公布日:20110824|||实质审查的生效IPC(主分类):G06F 17/30申请日:20110412|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 湖南大学
    发明人: 胡玉鹏; 罗昊; 石懋德; 梁磊; 刘嘉祁
    地址: 410082 湖南省长沙市麓山南路2号
    优先权:
    专利代理机构: 长沙正奇专利事务所有限责任公司 43113 代理人: 马强
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201110091282.7

    授权公告号:

    ||||||

    法律状态公告日:

    2013.07.10|||2011.10.05|||2011.08.24

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本发明公开了一种web社会网络行为轨迹分析与控制子集获取方法:定义n个时间段的大小,分析行为轨迹,得到行为轨迹二部图;对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;合并输出的一系列最小行为控制子集合并,得到社会网络整体的行为控制子集。本方法解决了行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小了web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,有效地防止了传染性或恶性行为在网络中扩散。

    权利要求书

    1.一种web社会网络行为轨迹分析与控制子集获取方法,其特征在于,该方法为:1)定义n个时间段的大小,分析行为轨迹,得到行为轨迹二部图;2)对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;3)合并输出的一系列最小行为控制子集合并,得到社会网络整体的行为控制子集。2.根据权利要求1所述的web社会网络行为轨迹分析与控制子集获取方法,其特征在于,分析行为轨迹的步骤如下:1)为每个时间段定义包含行为主体与行为地点或类型的两个顶点集合:I和E;2)对tk时间段的数据记录逐行扫描,如果行为主体ik不在集合Ik中,则将行为主体ik添加到Ik中,如果行为地点或类型ek不在Ek中,则将ek添加到Ek:Ek←Ek∪{ek},其中k∈{1,2,...,n};3)在ik与ek之间建立关联;4)当tk时间段的数据记录扫描完毕时,输出一个包含Ik和Ek的二部图Gk;6)重复步骤2),3),4),直到分析完所有的时间段。3.根据权利要求1所述的web社会网络行为轨迹分析与控制子集获取方法,其特征在于,求解行为控制子集的步骤如下:1)定义行为重叠因子函数:其中,其中k∈{1,2,...,n},N(Jk)表示与行为地点或类型集合Jk关联的不同个体的数量,deg(l)表示关联顶点l的顶点的数量;2)求解重叠因子的最大值:得到二部图Gk的最小行为控制子集Jk,其中,argmax表示求解能使函数取最大值的变量值;3)重复步骤1)和2),直到分析完所有的行为轨迹二部图。

    说明书

    一种web社会网络行为轨迹分析与控制子集获取方法

    技术领域

    本发明涉及网络技术,具体是一种web社会网络中的行为数据分析与行为轨??刂谱蛹袢》椒?。

    背景技术

    在线的web社会网络(OSN,Online?Social?Networks)的快速崛起,已经聚集了海量用户和行为数据,据2010年统计我国社交网络用户近2亿,用户近5亿的FaceBook已成为世界第三大“国家”,人人网、MySpace、Ning等也均已拥有庞大的用户群。在线web社会网络为用户提供了丰富的应用服务,包括协同社区、网络广告分发、网络交友等,用户在社圈中可以进行各种活动,所形成的和具体活动有关的数据叫做行为数据,如邮件行为数据、微博行为数据、照片发布行为数据等。由于这些活动参与者能随时随地与世界各地成千上万的联系人迅速建立联系,并可在设定的范围内实时发布/共享数据和资源,如个人行踪、观点和敏感数据等,从而在短时间内迅速地积累了海量的行为数据,随着其内部活动日趋紧密和频繁,对各种复杂的社会网络行为数据进行分析,及时掌控web社会网络的行为特点,已成为目前新形势下刻不容缓的任务。

    这些行为(活动)数据集通常包含行为类型、行为地点、时间、人名、主题等。如图1显示了一个web交友社会网络的数据集的一部分;然后,根据图1,可以分析出图2中的Bob的部分社会网络(一些好友未画出),同理,也可以分析其它人的社会网络。但由于web社会网络中的个体行为在时间和空间上都有延伸分布,图2的分析图只能是静态体现某一时刻的社会网络,不能充分展示Bob或其它个体的动态行为轨迹(指对行为数据中的时间和空间等相关信息),更重要的是对于社会网络的整体行为特点缺乏掌控。

    二部图(Bipartite?Graph)是指顶点可以分成两个不相交的集合A和B,A和B之间存在关联(有共同边),但是在同一个集合A或B内的顶点不关联(没有共同边)的图。二部图的最小控制子集(Minimum?Dominating?Set)是指:顶点数量最小的一个集合C,或能将B或者A的全部顶点关联进来。这类控制子集问题通常为NP完全问题,求解的时间复杂度很高,研究人员通常通过一些时间复杂度相对低的近似算法来求解。

    发明内容

    本发明所要解决的技术问题是,提供一种web社会网络行为轨迹分析与控制方法,解决行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,防止传染性或恶性行为在网络中扩散。

    为解决上述技术问题,本发明所采用的技术方案是:web社会网络行为轨迹分析与控制子集获取方法为:

    1)定义n个时间段的大小,分析行为轨迹,得到行为轨迹二部图;

    2)对输出的行为轨迹二部图分别进行分析,求解行为控制子集,得到最小行为控制子集;

    3)合并输出的一系列最小行为控制子集集合,得到社会网络整体的行为控制子集。

    分析行为轨迹的步骤如下:

    1)为每个时间段定义包含行为主体与行为地点或类型的两个顶点集合:I和E;

    2)对tk时间段的数据记录逐行扫描,如果行为主体ik不在集合Ik中,则将行为主体ik添加到Ik中,如果行为地点或类型ek不在Ek中,则将ek添加到Ek:Ek←Ek∪{ek},其中k∈{1,2,...,n},;

    3)在ik与ek之间建立关联;

    4)当tk时间段的数据记录扫描完毕时,输出一个包含Ik和Ek的二部图Gk;

    6)重复步骤2),3),4),直到分析完所有的时间段。

    求解行为控制子集的步骤如下:

    1)定义行为重叠因子函数:其中,其中k∈{1,2,...,n},N(Jk)表示与行为地点或类型集合Jk关联的不同个体的数量,deg(l)表示关联顶点l的顶点的数量;

    2)求解求解重叠因子的最大值:得到二部图Gk的最小行为控制子集Jk,其中,argmax表示求解能使函数取最大值的变量值;

    3)重复步骤1)和2),直到分析完所有的行为轨迹二部图。

    本发明适用于包含行为数据的数据集合。本发明的基本思想是:对某时间段t内的行为地点(或者类型)与行为主体(这里指网络用户)数据分别进行抽取,利用二部图原理,将它们分配到一个包含两个不同集合(即行为集合与个体集合)的二部图,这样可将个体与时间/空间上的行为轨迹直接关联起来。在此基础上,定义一种行为重叠因子函数(≤1),通过求解重叠因子的最大值来获取该二部图的最小行为控制子集。由于web社会网络的规模往往很大,获取控制子集后能及早地对少量行为或个体进行跟踪和控制,防止传染性事件的扩散。

    由于随着时间的推移,行为数据集在不断增长,本发明首先对于各个时间段{t1,t2,...,tn}内的数据集进行分段,进而可以分析行为轨迹并获取控制子集,具体的方法与步骤为:

    (1)第一步,根据具体应用需要,定义n个时间段{t1,t2,...,tn}的大小,分析行为轨迹的步骤如下:

    (1.1)为每个时间段定义包含行为主体与行为地点(或类型)的两个顶点集合:I和E;默认为空;

    (1.2)For?k=1?to?n

    (1.3)对tk时间段的数据记录进行逐行扫描;

    (1.4)if行为主体i?not?in?Ik

    (1.5)将行为主体i添加到Ik:Ik←Ik∪{i};

    (1.6)if行为地点(或类型)e?not?in?Ek

    (1.7)将e添加到Ek:Ek←Ek∪{e};

    (1.8)并且在i与e之间建立关联;

    (1.9)直到tk时间段的数据记录扫描完毕;

    (1.10)输出一个包含Ik和Ek的二部图Gk;

    (1.11)End

    (2)第二步,对输出的行为轨迹二部图{G1,G2,...,Gn}分别进行分析,求解行为控制子集,步骤如下:

    (2.1)For?k=1?to?n

    (2.2)定义行为重叠因子函数:其中,

    (2.3)求解:

    (2.4)输出的Jk即为二部图Gk的最小行为控制子集;

    (2.4)End

    (3)第三步,合并输出的一系列{J1,J2,...,Jn}集合,得到社会网络整体的行为控制子集

    ???????????????????????????????

    其中,N(Jk)表示与行为地点(或类型)集合Jk关联的不同个体的数量,deg(l)表示关联顶点l的顶点i的数量。(2.3)中的公式argmax表示求解能使函数取最大值的变量值;(2.3)中求解的变量为Jk,函数σ(Jk)≤1。(2.3)要求N(Jk)尽可能大,这样受Jk覆盖/关联的顶点就越多;而deg(l)之和尽可能小,即覆盖的重叠顶点要少,从而获取最小控制子集。由于社会网络的规模非常庞大,实际应用时,本发明通过逐步寻找deg(l)值最大的那些顶点来求解(2.3),可以较快地获取控制子集。

    本发明解决了行为轨迹的时间和空间维度上的分析问题,以较低的时间复杂度求解出最小行为控制子集,从而有效地缩小了web社会网络的监控范围,较方便地对web社会网络整体行为进行控制,有效地防止了传染性或恶性行为在网络中扩散。

    附图说明

    图1为行为主体图;

    图2为行为轨迹二部图G1;

    图3为行为轨迹二部图G2。

    具体实施方式

    本发明具体实施方式如下:

    第一步,对数据集进行分析,得到行为时空和空间轨迹信息。

    (1)对表1中的数据集的两个时间段(n=2)进行定义{t1=11,t2=11};时间段t1从2011/03/09至2011/03/19,并为其定义两个集合I1和E1;t2从2011/03/20至2011/03/30,定义两个集合I2和E2。设I和E分别用于包含行为主体(这里指人名)和行为地点(这里指地点)。

    ??行为类型
    ??地点
    ??时间
    ??人名
    ??主题
    ??发布微博
    ??深圳(富丽华酒店)
    ??2011/03/09
    ??Bob
    ??结婚准备
    ??发布微博
    ??深圳(富丽华酒店)
    ??2011/03/09
    ??Fox
    ??参加婚礼
    ??发布微博
    ??深圳(富丽华酒店)
    ??2011/03/09
    ??Hans
    ??参加婚礼
    ??发布微博
    ??深圳(富丽华酒店)
    ??2011/03/09
    ??Landy
    ??参加婚礼
    ??发布微博
    ??深圳(机场)
    ??2011/03/10
    ??Tom
    ??机场起火
    ??发布微博
    ??深圳(机场)
    ??2011/03/10
    ??Bob
    ??蜜月旅行遇上机场起火
    ??发布微博
    ??芭提雅(Siam)
    ??2011/03/13
    ??Bob
    ??泰国购物
    ??发布微博
    ??深圳(深圳大学)
    ??2011/03/14
    ??Tom
    ??加班中
    ??微博回复
    ??深圳(深圳大学)
    ??2011/03/14
    ??Zhao
    ??Re:泰国购物
    ??微博回复
    ??深圳(深圳大学)
    ??2011/03/14
    ??Chen
    ??Re:泰国购物
    ??发布微博
    ??芭提雅(太子酒店)
    ??2011/03/15
    ??Luis
    ??芭提雅美食
    ??照片发布
    ??芭提雅(太子酒店)
    ??2011/03/15
    ??Luis
    ??芭提雅海滩
    ??照片发布
    ??芭提雅(Siam)
    ??2011/03/16
    ??Alex
    ??泰国小吃
    ??照片发布
    ??芭提雅(Siam)
    ??2011/03/17
    ??Joy
    ??泰国夜市
    ??…
    ??…
    ??…
    ??…
    ??…
    ??发送私信
    ??深圳(深圳大学)
    ??2011/03/22
    ??Alice
    ??旅行费用
    ??回复私信
    ??芭提雅(太子酒店)
    ??2011/03/22
    ??Bob
    ??Re:旅行费用
    ??发送邮件
    ??深圳(深圳大学)
    ??2011/03/24
    ??Jim
    ??礼物清单
    ??回复邮件
    ??芭提雅(Siam)
    ??2011/03/24
    ??Bob
    ??Re:礼物清单
    ??发布微博
    ??深圳(机场)
    ??2011/03/25
    ??Sam
    ??机场接Bob
    ??发布微博
    ??深圳(家乐福超市)
    ??2011/03/29
    ??Bob
    ??陪老婆购物
    ??发布照片
    ??深圳(富丽华酒店)
    ??2011/03/30
    ??Mike
    ??朋友聚会

    表1

    (2)对时间段t1的数据集进行逐行扫描。陆续将行为主体Bob,Fox等添加到I1,同时用数字表示人名,得到:I1={1-Bob,2-Fox,3-Hans,4-Landy,5-Tom,6-Zhao,7-Chen,8-Luis,9-Alex,10-Joy}。并将相应的地点添加E1,用数字表示地点,得到:E1={1-深圳(富丽华酒店),2-深圳(机场),3-芭提雅(Siam),4-深圳(深圳大学),5-芭提雅(太子酒店)}。然后,在I1和E1之间建立关联,输出得到的行为轨迹二部图G1如图2所示(图中顶点的数字表示原人名和地点)。

    (3)对时间段t2的数据集进行扫描。同上,可以得到:I2={1-Alice,2-Bob,3-Jim,4-Sam,5-Mike};E2={1-深圳(深圳大学),2-芭提雅(太子酒店),3-芭提雅(Siam),4-深圳(机场),5-深圳(家乐福超市),6-深圳(富丽华酒店)}。然后,在I2和E2之间建立关联,输出得到的行为轨迹二部图G2如图3所示。

    第二步,对行为轨迹G1和G2分别进行分析,求解控制子集。

    (1)利用(2.3)中的公式对G1进行分析,可以求解出J1={1-深圳(富丽华酒店),3-芭提雅(Siam),4-深圳(深圳大学),5-芭提雅(太子酒店)}。

    实际求解时,可以对E2中度最大(deg(l)值最大)的顶点进行搜索和逐步贪婪,如对顶点度的大小进行排序后,本方法会先找到1-深圳(富丽华酒店),然后是3-芭提雅(Siam)和4-深圳(深圳大学),在找到2-深圳(机场)时,由于其关联的主体顶点(1和5)已经被1-深圳(富丽华酒店)和4-深圳(深圳大学)关联,故跳过,继续搜索到5,这样本方法的效率会比较高。

    (2)同理,对G2进行分析,可以求解出J2={1-深圳(深圳大学),2-芭提雅(太子酒店),3-芭提雅(Siam),4-深圳(机场),5-深圳(家乐福超市),6-深圳(富丽华酒店)}。

    第三步,合并第二步得到的J1和J2。求出最小行为控制子集J=J1∪J2={深圳(富丽华酒店),深圳(深圳大学),芭提雅(Siam),芭提雅(太子酒店),深圳(机场),深圳(家乐福超市),深圳(富丽华酒店)},J一共包含7个地点。

    得到J后,若以后数据集继续增加,则可以对后续的多个时间段(t3,t4,...)的数据重复上面的步骤,得到更新的控制子集J,只要对J中的少量地点进行监控,则可以对web社会网络的整体行为轨迹进行控制,防止传染性行为扩散。

    关于本文
    本文标题:一种WEB社会网络行为轨迹分析与控制子集获取方法.pdf
    链接地址://www.4mum.com.cn/p-5868236.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 内蒙古十一选五预测 ewin棋牌游戏论坛 开心棋牌5239 边锋舟山棋牌 三分彩技巧 大乐透开奖直播 中国福利彩票开奖结果 福彩3d出号走势图彩宝网 幸运农场开奖结果走 七星彩走势图规律图 看河北十一选五走势图 新疆十一选五助手下载 北京赛车大群推荐 山西11选5推荐号码推荐 新浪围棋新闻竞技风暴 杰克棋牌官网完整版