• 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
    • / 7
    • 下载费用:30 金币  

    360重庆时时彩开奖统计: 一种基于移动电话数据识别城市特定区域的方法.pdf

    关 键 词:
    一种 基于 移动电话 数据 识别 城市 特定 区域 方法
      专利查询网所有资源均是用户自行上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作他用。
    摘要
    申请专利号:

    CN201410071669.X

    申请日:

    2014.02.28

    公开号:

    CN103841516A

    公开日:

    2014.06.04

    当前法律状态:

    驳回

    有效性:

    无权

    法律详情: 发明专利申请公布后的驳回IPC(主分类):H04W 4/02申请公布日:20140604|||实质审查的生效IPC(主分类):H04W 4/02申请日:20140228|||公开
    IPC分类号: H04W4/02(2009.01)I; G06F17/30 主分类号: H04W4/02
    申请人: 华中科技大学
    发明人: 向峰; 涂来; 黄本雄; 方宸
    地址: 430074 湖北省武汉市洪山区珞喻路1037号
    优先权:
    专利代理机构: 华中科技大学专利中心 42201 代理人: 梁鹏
    PDF完整版下载: PDF下载
    法律状态
    申请(专利)号:

    CN201410071669.X

    授权公告号:

    ||||||

    法律状态公告日:

    2018.11.02|||2014.07.02|||2014.06.04

    法律状态类型:

    发明专利申请公布后的驳回|||实质审查的生效|||公开

    摘要

    本发明公开了一种基于移动电话数据识别城市特定区域的方法,包括:(1)对移动基站网络进行Vinornoi分割;(2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;(3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;(4)根据用户标识和时间顺序,得到每个用户的轨迹路线;(5)抽取每个用户的地理位置发生变化的迁移;(6)根据得到的起始点区域和终止点区域,合并所有的迁移。(7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到通话迁移矩阵;(8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。本发明可以根据用户的移动特征反映地理属性,识别城市的特定区域。

    权利要求书

    权利要求书
    1.  一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:
    (1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割;
    (2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;
    (3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;
    (4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线;
    (5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点和终止点的区域范围以及时间信息;
    (6)根据得到的起始点区域和终止点区域,合并所有的迁移;
    (7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到维度为基站总数量的通话迁移矩阵(Transition Matrix);
    (8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。

    2.  根据权利要求1所述的方法,步骤(8)具体包括:
    对于某个基站A,统计一定时间内从基站A到其他地方的迁移频率,也即通话迁移矩阵中的矩阵元素在该一定时间内出现的频率,将通话迁移矩阵中的各个元素按出现频率大小从大到小排序;
    设基站A的地理邻居为NA个,根据基站邻接矩阵得到其地理邻居集合,记为SN(A),基站A的时间邻居中排名前NA的时间邻居集合记作TN(A),那么SN(A)-TN(A)表示地理上和基站A相邻但是通话迁移不相邻的基站集合,将该集合定义为异常集合(Outliers Set),异常集合占据的区域即为识别出的特定区域。

    3.  根据权利要求1所述的方法,其中,所述一定时间为一天。

    说明书

    说明书一种基于移动电话数据识别城市特定区域的方法
    技术领域
    本发明涉及移动数据挖掘技术,具体涉及一种基于移动电话数据识别城市特定区域的方法。
    背景技术
    移动终端设备的应用大大方便了人们的生活,相比于传统的有线电话网络,移动手机终端具有携带方便,移动范围广泛的特点,而且能够长时间反映用户的基本信息。随着3G网络的广泛使用,用户不仅仅有基本的语音和短信业务,还能使用数据流量业务。正因为移动终端设备方便携带,同时集众多功能于一身,移动业务已经广泛存在于生活当中。
    一般而言,一个简单的移动网络由移动终端,通信基站和承载网络组成。对于手机运营商而言,该网络不仅可以用于普通的计费,而且可以得到用户的通话时间和时长、通话对方、通话地点等信息。此丰富信息能够反映用户的地理移动特征和生活习惯,因而可以用于建设“智慧城市”,创造更加智能的生活环境,比如可以被用于分析交通堵塞的问题、局部区域的广告信息投放、用户和兴趣推荐、移动社交网络的发展以及划分用户类型等。
    发明内容
    鉴于此,本发明的目的在于提出一种基于移动电话数据识别城市特定区域的方法,该方法可以根据用户的移动特征反映地理属性,识别城市的特定区域。
    为实现以上发明目的,本发明采用以下技术方案:
    一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:
    (1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割;
    (2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵;
    (3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片;
    (4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线;
    (5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点和终止点的区域范围以及时间信息;
    (6)根据得到的起始点区域和终止点区域,合并所有的迁移。
    (7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到维度为基站总数量的通话迁移矩阵(Transition Matrix);
    (8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。
    本发明具有以下有益效果:
    可以根据用户的移动特征反映地理属性,识别城市的特定区域,并进一步用于分析交通堵塞、局部区域的广告信息投放、用户和兴趣推荐、移动社交网络的发展以及划分用户类型等问题。
    附图说明
    参照下面的说明,结合附图,可以对本发明有最佳的理解。在附图中,相同的部分可由相同的标号表示。
    图1是本发明较优实施例的整体流程示意图;
    图2是对一个基站网络作Vinornoi分割的示意图。
    具体实施方式
    为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及示例性实施例,对本发明进行进一步详细说明。应当理解,此处所描述的示例性实施例仅用以解释本发明,并不用于限定本发明的适用范围。
    数据准备
    用户通话数据,主要包含以下字段:
    用户id
    用户呼叫时间(发起电话或接听电话)
    基站cell id
    通话时长
    这些数据能够反映用户的通话习惯和移动模式,以上的数据存放在Hadoop数据库中,数据量至少为千万条。
    根据基站cell id得到地理位置
    根据通话数据中反映基站的标识cell id,在工参表中查询到基站所处的地理经纬度。一个基站的覆盖面积较大,用户打电话的地理位置不能仅依靠该地理位置。通过工参表中对应基站的其他参数,如辐射角,波束方向等信息进行定位,可以大致分析出用户所在的位置,具有较好的精度。此外,通话过程中,因为基站的跳变和负载均衡,基站的位置可能和实际的地理位置有偏差,此时可以用用户常出现位置的概率和地点变换之间的时间差来估计用户实际所处的地理范围。通过以上方法,可以得到基站之间的距离和是否相邻以及用户较为精确的行为轨迹等信息。把用户在各个基站间的移动作为联系基站间的桥梁,根据用户的行为模式得到区域的功能属性分类,进而分析局部区域的特性。
    特性定义
    轨迹:一个移动用户在一段时间里移动的地理位置按时间排序,得到一组连续的地理位置序列。比如移动用户user早上起床后在A处打了电话,之后上公交路上B接到了他人的电话,到达公司C后给其他部分给了若干各电话通知。那么这段时间里该用户user的轨迹则为在时间上按序排列的(A,tA)-(B,tB)-(C,tC1)-(C,tC2)。
    迁移(Transition):表明移动用户在地理位置上的变化,反映了通话流量在不同地点间的流动,是一个由起点、终点和时间表示的组合。根据以 上的轨迹定义,得到形如[(A,tA),(B,tB)]、[(B,tB),(C,tC1)]的组合,因为[(C,tC1),(C,tC2)]发生的地点没有改变,该组合不属于迁移的定义。
    地理邻居(Spatial Neighbors):根据基站覆盖图可知,每个基站周围都有若干个邻居,这些邻居基站和中心基站构成了GSM的蜂窝网络。因为地理位置上是相邻的,因此将这些邻居定义为地理邻居Spatial Neighbors,这些Spatial Neighbors的个数为Ni。
    时间邻居(Temporal neighbors):由移动用户的迁移图可知,用户的移动模式可能发生在地域上不相邻的位置,定义用户迁移的基站组合为时间上的邻居Temporal neighbors。也即,用户从起始点到终止点,如果在时间上跨度很紧密,那么这两个地方就是时间邻居。
    根据以上定义,可以得到移动用户轨迹网络图G(V,E),其中V表示基站的覆盖范围,E表示用户的迁移(Transition)。移动用户在一段时间(例如一天、一个星期、半个月或者一个月等)的轨迹图则可以用带权重的一系列Trace=(E,Weight)来表示。通过分析群体用户在不同时间段上的迁移规律,可以得到群体用户的移动模式。所谓移动模式,是反映用户群体使用移动电话在地理上的迁移特性。这种特性可能是由于城市中的特定区域(例如地理位置上的不通畅)造成的,因此,利用人们的这种移动模式可以识别城市的特定区域。
    在以上原理介绍的基础上,参见图1,下面详细说明本发明提出的一种基于移动电话数据识别城市特定区域的方法,包括以下步骤:
    (1)假定各个基站的覆盖范围互不相交,对移动基站网络进行Vinornoi分割。
    在移动网络中,一般而言,移动用户的接入和通话都由附近的基站负责。由于不同地点人群的密集程度不同和手机信号的切换,一个基站信号的覆盖范围有大有小,甚至还有宏基站和蜂窝基站同时存在,因此,移动用户设备接入时,会收到来自周围的多个基站id列表,然后从中选取SNR 最优的基站进行接入。
    在本实施例中,假定各个基站的覆盖范围互不相交,处于某一地点的用户只能被最近的基站服务。根据该假定,基站网络可以用经典的Vinoroni图来近似划分,从而得到移动网络的基站覆盖图。如图2所示,对一个基站网络作Vinornoi分割,图中的X表示基站的地理位置,每个X点外面用虚线围绕的区域近似表示该基站的覆盖区域。
    (2)统计移动基站网络中每个基站的邻基站集合,得到基站邻接矩阵。
    具体而言,统计邻基站就是得到每个基站的邻基站集合,以图1中的基站X9为例,其邻基站集合为{X4,X5,X10,X13,X8}。然后,用一个邻接矩阵来存储两两基站之间的地理位置关系,如果两基站在地理上相邻,则相应的矩阵元素为1,反之则为0。
    (3)利用Hadoop集群的负载均衡将数据分割成大小相同的若干分片。
    原始的用户通话数据预先存放在数据库中,数量巨大,因此采用Hadoop平台对数据进行处理。具体而言,在Hadoop中使用20个slave节点存取数据,Hadoop自身有负载均衡的功能,可以将大数据均匀分布到各台机器,也可以根据各个机器的空间容量等比例来分配,在本实施例中,可以使用前者。此外,还可以定义不同数量的maper和reducer的个数来调整Hadoop集群运算的性能。
    (4)根据用户标识(prd)和时间顺序,得到每个用户的轨迹路线。
    (5)抽取每个用户的地理位置发生变化的迁移,该迁移包含有起始点和终止点的区域范围以及时间信息。
    其中,理论上的起始点和终止点为经纬度坐标,由于不能得到具体的地理位置,因此本实施例中,用区域范围来大致表示起始点和终止点,例如可以用小区(cell)表示。
    (6)根据得到的起始点区域和终止点区域,合并所有的迁移。
    (7)在Hadoop中统计所有(起始点,终止点,时间)三元组合的个数,得到维度为基站总数量的通话迁移矩阵(Transition Matrix)。
    统计用户连续两次通话的地理跨度,发现大部分地理间距集中在0.5km的范围,这说明移动用户的大部分通话在地理上的迁移距离很短,极大可能就在相邻的基站之间。因此,下面主要分析单个基站迁移特性。
    (8)利用基站邻接矩阵和通话迁移矩阵识别城市中的特定区域。
    对于某个基站A,统计在一定时间内从基站A到其他地方的迁移(可以由通话迁移矩阵的一个矩阵元素表示)频率,也即通话迁移矩阵中的矩阵元素在该一定时间内出现的频率,将通话迁移矩阵中的各个元素按出现频率大小从大到小排序。通过对通话迁移矩阵(Transition Matrix)和基站邻接矩阵的观察,得知排名靠前的几个时间邻居大多都是地理上相邻的基站。
    设基站A的地理邻居为NA个,根据基站邻接矩阵得到其地理邻居集合,记为SN(A),基站A的时间邻居中排名前NA的时间邻居集合记作TN(A),那么SN(A)-TN(A)表示地理上和基站A相邻但是通话迁移不相邻的基站集合,将该集合定义为异常集合(Outliers Set)。在本实施例中,主要考虑以一天为单位时间的聚合特性。为了更精确地得到基站间的联系,还可以进一步划分时间段。
    下面结合实际地图来分析异常集合(Outliers Set)的特点。在基站覆盖图上添加地图层,并且,将正常集合SN(A)∩TN(A)中的基站用蓝色线段相连,而上述异常集合中的基站用红色线段相连。结果表明,异常集合占据的区域大多都是一些可以称为“城市阻碍”的特定区域,例如江河湖泊、公园、正在开发的大型基础建设工程项目等。
    以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的?;し段е?。

    关于本文
    本文标题:一种基于移动电话数据识别城市特定区域的方法.pdf
    链接地址://www.4mum.com.cn/p-6147617.html
    关于我们 - 网站声明 - 网站地图 - 资源地图 - 友情链接 - 网站客服 - 联系我们

    [email protected] 2017-2018 www.4mum.com.cn网站版权所有
    经营许可证编号:粤ICP备17046363号-1 
     


    收起
    展开
  • 四川郎酒股份有限公司获第十二届人民企业社会责任奖年度环保奖 2019-05-13
  • 银保监会新规剑指大企业多头融资和过度融资 2019-05-12
  • 韩国再提4国联合申办世界杯 中国网友无视:我们自己来 2019-05-11
  • 中国人为什么一定要买房? 2019-05-11
  • 十九大精神进校园:风正扬帆当有为 勇做时代弄潮儿 2019-05-10
  • 粽叶飘香幸福邻里——廊坊市举办“我们的节日·端午”主题活动 2019-05-09
  • 太原设禁鸣路段 设备在测试中 2019-05-09
  • 拜耳医药保健有限公司获第十二届人民企业社会责任奖年度企业奖 2019-05-08
  • “港独”没出路!“梁天琦们”该醒醒了 2019-05-07
  • 陈卫平:中国文化内涵包含三方面 文化复兴表现在其中 2019-05-06
  • 人民日报客户端辟谣:“合成军装照”产品请放心使用 2019-05-05
  • 【十九大·理论新视野】为什么要“建设现代化经济体系”?   2019-05-04
  • 聚焦2017年乌鲁木齐市老城区改造提升工程 2019-05-04
  • 【专家谈】上合组织——构建区域命运共同体的有力实践者 2019-05-03
  • 【华商侃车NO.192】 亲!楼市火爆,别忘了买车位啊! 2019-05-03
  • 平特肖论坛999133.com 福建体彩25选5 11选5技巧不得不学的稳赚秘籍 时时彩技巧 打地鼠真人游戏 捕鱼来了怎么赚钱 河北快三开奖基本走势图 广东好彩1走势图 456 棋牌下载 双色球基本走势图体彩 鼎博彩票首页 打麻将必胜绝技窍门 辽宁快乐12玩法介绍及图片 波克棋牌斗地主 最好的排列五走势图 排球女将下载