• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 12
    • 下载费用:20 金币  

    重庆时时彩三星跨度: 一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法.pdf

    摘要
    申请专利号:

    重庆时时彩单双窍门 www.4mum.com.cn CN201610383009.4

    申请日:

    2016.06.01

    公开号:

    CN105956184A

    公开日:

    2016.09.21

    当前法律状态:

    授权

    有效性:

    有权

    法律详情: 授权|||实质审查的生效IPC(主分类):G06F 17/30申请日:20160601|||公开
    IPC分类号: G06F17/30 主分类号: G06F17/30
    申请人: 西安交通大学
    发明人: 周亚东; 党琪; 高峰; 管晓宏
    地址: 710049 陕西省西安市咸宁路28号
    优先权:
    专利代理机构: 西安智大知识产权代理事务所 61215 代理人: 段俊涛
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201610383009.4

    授权公告号:

    105956184B||||||

    法律状态公告日:

    2017.05.31|||2016.10.19|||2016.09.21

    法律状态类型:

    授权|||实质审查的生效|||公开

    摘要

    本发明公开一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法,包括:1)通过话题传播网络中的拓扑特性来识别分布在多个话题中的垃圾信息发布团体;2)基于相邻时间间隔的话题转发网络之间的相似度对比,识别垃圾信息发布团体参与的异?;疤?;3)根据用户在多个话题中的累计权重进行聚类,把参与异?;疤獾乃杏没Х治S没Ш屠畔⒎⒉纪盘宓囊斐S没?;本发明所公开的一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法,基于话题传播中的转发网络的拓扑信息进行分析,不需要相关话题的文本内容及用户的其他信息,使得实现算法简单、计算复杂度低,能够有效识别微博中的垃圾信息发布团体。

    权利要求书

    1.一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法,其特征在
    于,包括:
    步骤1,在多个热点话题中发现有垃圾信息发布团体参与的异?;疤?,具体步骤如下:
    步骤1.1,构建热点话题的动态转发网络,热点话题Ti在时间t的转发网络表示为有向图
    Gt=(Vt,Et),其中Vt和Et分别是节点集合和边集合,Vt中的任意一个节点表示用户ui在起始
    时间到时间t之间发表了话题Ti相关的微博,Et中任意一条边(ug,uk,wug,uk)表示用户uk转发
    了用户ug关于话题Ti的微博,wug,uk为边的权重,表示用户uk和ug之间转发微博的次数;由于
    热点话题随着时间在不断的动态变化,热点话题Ti的动态转发网络表示为Gt(Ti)={G1,
    G2,…,Gt};
    步骤1.2,对每个热点话题Ti的转发网络,计算相邻时间段的转发网络的相似度;话题在
    时间t的转发网络Gt表示为j个弱连通子图Gt={g1t,g2t,…,gjt},其中gjt表示第j个弱连通
    子图;计算相邻时间间隔转发网络的相似度指计算Gt-1=(Vt-1,Et-1)和Gt=(Vt,Et)之间的相
    似度simt,首先对两个网络的弱连通子图按照节点个数进行排序,分别得到两个网络的弱
    连通子图序列,两个子图的相似度由对应子图序列之间的斯皮尔曼相关系数来表示;
    步骤1.3,根据各个转发网络的相似度序列,识别异?;疤?;通过话题Ti的动态转发网络
    Gt(Ti)={G1,G2,…,Gt}得到相邻网络的相似度序列{sim1,sim2,…,simt-1},若该序列中存
    在某个相似度小于相似度阈值0.6,则该话题为异?;疤?;
    步骤2,在参与异?;疤獾乃杏没е?,识别垃圾信息发布团体用户,具体步骤如下:
    步骤2.1,在话题转发网络中定义用户权重;根据话题转发网络的定义,出度大的节点
    对于话题传播和信息扩散具有更多的影响力,在单个话题转发网络中的用户权重由该用户
    在转发网络中的出度来定义,再利用归一化和对数函数进行变形来便于计算;由于多次参
    与异?;疤獾挠没б约安斡攵喔鲆斐;疤獾挠没Ь哂懈蟮目赡苁抢畔⒎⒉纪盘宓?br />成员,因此对单个转发网络中的用户权重进行加权求和来得到该用户的累计用户权重;
    步骤2.2,在参与所有热点话题的用户中人工标注多个初始标签用户Ulabel={u1,u2,…,
    uq};为了使标签用户尽可能地少参与相同话题并且每个标签用户参与尽可能多的话题,初
    始标签用户的选择遵循以下策略:迭代地根据话题参与的频率来选择标签用户,在每次迭
    代中选择一个标签用户,从话题集合中移除上个标签用户参与的话题,重复之前的迭代直
    到话题集合中的大部分话题都被移除;
    步骤2.3,对于初始标签用户集中的每个用户uq,首先获得该用户参与的热点话题序列T
    (uq)={T1,T2,…,Tuq},对于参与该话题序列的所有用户U(uq)的权重进行加权求和获得每
    个用户的累计用户权重W(uq),然后基于k-means算法对累计用户权重列表进行聚类获得与
    初始标签用户属于同一组织的垃圾信息发布团体。
    2.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤1.1中,热点话题的动态转发网络的构建,以用户为节点,以用户
    之间的转发关系为边。
    3.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤1.2中,通过网络中弱连通子图排序得到子图序列,通过计算子图
    序列之间的距离来定义网络之间的相似度,所述弱连通子图是指将有向图的所有有向边替
    换为无向边,若该子图在无向图中是联通子图,则称该子图为弱连通子图;斯皮尔曼相关系
    数指两个向量之间的相关系数,是反映向量相关程度的统计分析指标。
    4.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤1.3中,通过判断转发网络拓扑结构的剧烈变化而引起的相似度
    变化,从而识别有垃圾信息发布团体参与的异?;疤?,转发网络之间的相似度具体计算如
    下:
    <mrow> <mi>s</mi> <mi>i</mi> <mi>m</mi> <mrow> <mo>(</mo> <msup> <mi>G</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>,</mo> <msup> <mi>G</mi> <mi>t</mi> </msup> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mn>1</mn> <mo>-</mo> <msub> <mi>w</mi> <mi>s</mi> </msub> <mo>&times;</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>&lambda;</mi> <mo>)</mo> </mrow> <mo>&Element;</mo> <msup> <mi>G</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>&cup;</mo> <msup> <mi>G</mi> <mi>t</mi> </msup> </mrow> </munder> <msub> <mi>w</mi> <mi>g</mi> </msub> <mo>&times;</mo> <msup> <mrow> <mo>(</mo> <msubsup> <mi>R</mi> <mi>g</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>R</mi> <mi>g</mi> <mi>t</mi> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> <mi>N</mi> </mfrac> <mo>-</mo> <msub> <mi>w</mi> <mi>v</mi> </msub> <mfrac> <mrow> <mo>|</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>&cup;</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mi>t</mi> </msubsup> <mo>|</mo> <mo>-</mo> <mo>|</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>&cap;</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mi>t</mi> </msubsup> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>&cup;</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mi>t</mi> </msubsup> <mo>|</mo> </mrow> </mfrac> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>&lambda;</mi> <mo>=</mo> <mn>0</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mn>1</mn> <mo>-</mo> <mfrac> <mrow> <munder> <mo>&Sigma;</mo> <mrow> <mi>g</mi> <mrow> <mo>(</mo> <mi>&lambda;</mi> <mo>)</mo> </mrow> <mo>&Element;</mo> <msup> <mi>G</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>&cup;</mo> <msup> <mi>G</mi> <mi>t</mi> </msup> </mrow> </munder> <msub> <mi>w</mi> <mi>g</mi> </msub> <mo>&times;</mo> <msup> <mrow> <mo>(</mo> <msubsup> <mi>R</mi> <mi>g</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>-</mo> <msubsup> <mi>R</mi> <mi>g</mi> <mi>t</mi> </msubsup> <mo>)</mo> </mrow> <mn>2</mn> </msup> </mrow> <mi>N</mi> </mfrac> <mo>,</mo> </mrow> </mtd> <mtd> <mrow> <mi>&lambda;</mi> <mo>&gt;</mo> <mn>0</mn> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
    <mrow> <msub> <mi>w</mi> <mi>v</mi> </msub> <mo>=</mo> <mfrac> <mrow> <mo>|</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msubsup> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msubsup> <mi>V</mi> <mi>v</mi> <mi>t</mi> </msubsup> <mo>|</mo> </mrow> <mrow> <mo>|</mo> <msup> <mi>V</mi> <mrow> <mi>t</mi> <mo>-</mo> <mn>1</mn> </mrow> </msup> <mo>|</mo> <mo>+</mo> <mo>|</mo> <msup> <mi>V</mi> <mi>t</mi> </msup> <mo>|</mo> </mrow> </mfrac> </mrow>
    ws=1-wv
    其中λ表示参与排序的弱连通子图中最小的节点个数,g(λ)表示选择节点个数大于λ的
    子图来排序;当λ=0时,表示所有网络中的子图包括单一节点都用来排序;wv表示单一节点
    子图的权重,ws表示出了单一节点的其他子图的权重;wg表示子图g的权重;Rgt-1表示子图g
    在Gt-1中的排名,Rgt表示子图g在Gt中的排名;Vvt-1表示Gt-1中单一节点的集合,Vvt表示Gt中
    单一节点的集合;Vt-1表示Gt-1中所有节点的集合,Vt表示Gt中所有节点的集合。
    5.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤2.1中,根据单个话题中用户节点出度的归一化和对数函数变化
    来定义用户权重,然后通过加权求和来计算多个话题中用户的累计用户权重,用户ui在单
    个话题转发网络Gh中的权重定义为:
    <mrow> <msubsup> <mi>w</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msub> <mi>G</mi> <mi>h</mi> </msub> </msubsup> <mo>=</mo> <mi>l</mi> <mi>o</mi> <mi>g</mi> <mfrac> <mrow> <msubsup> <mi>d</mi> <mi>o</mi> <msub> <mi>G</mi> <mi>h</mi> </msub> </msubsup> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> <mrow> <mo>|</mo> <msup> <mi>E</mi> <msub> <mi>G</mi> <mi>h</mi> </msub> </msup> <mo>|</mo> </mrow> </mfrac> <mo>+</mo> <mi>Z</mi> </mrow>
    其中doGh(ui)表示用户的出度;|EGh|表转发网络中总的边数,相当于所有节点的出度
    和;Z是一个正整数,用来保证用户权重大于零,
    用户ui在H个话题转发网络{G1,G2,…,GH}中的累计权重定义为:
    <mrow> <msub> <mi>w</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> </msub> <mo>=</mo> <munderover> <mo>&Sigma;</mo> <mrow> <mi>h</mi> <mo>=</mo> <mn>1</mn> </mrow> <mi>H</mi> </munderover> <msubsup> <mi>w</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> <msub> <mi>G</mi> <mi>h</mi> </msub> </msubsup> <msub> <mi>F</mi> <mrow> <mo>(</mo> <msub> <mi>u</mi> <mi>i</mi> </msub> <mo>,</mo> <msub> <mi>G</mi> <mi>h</mi> </msub> <mo>)</mo> </mrow> </msub> <msup> <mi>e</mi> <mfrac> <msub> <mi>h</mi> <msub> <mi>u</mi> <mi>i</mi> </msub> </msub> <mi>H</mi> </mfrac> </msup> </mrow>
    其中F(ui,Gh)表示用户ui在转发网络Gh中发表微博的次数,hui表示用户ui在H个话题中出
    现的次数。
    6.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤2.2中,初始标签用户的选择策略,通过迭代使得初始标签用户能
    够尽可能多地覆盖步骤1中所得到异?;疤?。初始的输入为步骤1中所发现的异?;疤庑蛄?br />和参加话题的所有用户,每次迭代过程为:计算话题序列中所有用户参加异?;疤獾钠德?,
    在这些用户中选择频率最高的用户作为初始标记用户,然后从话题序列中删除该用户参与
    的异?;疤?。在初始异?;疤庑蛄兄械陨瞎?,直到话题序列中的大多数话题被删除,
    迭代终止。
    7.根据权利要求1所述微博社会网络中协作化及组织化的垃圾信息发布团体的识别方
    法,其特征在于,所述步骤2.3中,基于对垃圾信息发布者的用户行为分析,在聚类过程中选
    择目标类别k=3。首先获得该用户参与的热点话题序列T(uq)={T1,T2,…,Tuq},对于参与该
    话题序列的所有用户U(uq)的权重进行加权求和获得每个用户的累计用户权重W(uq),然后
    基于k-means算法对累计用户权重列表进行聚类获得与初始标签用户属于同一组织的垃圾
    信息发布团体。

    关 键 词:
    一种 社会 网络 协作 组织 垃圾 信息 发布 团体 识别 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    0条评论

    还可以输入200字符

    暂无评论,赶快抢占沙发吧。

    关于本文
    本文标题:一种微博社会网络中协作化及组织化的垃圾信息发布团体的识别方法.pdf
    链接地址://www.4mum.com.cn/p-6199940.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03