移动网络的用户行为及用户价值区域特征的分析研究
发布时间:2017-12-21
顾震强
 (广州杰赛科技股份有限公司,广东 广州 510310)

【摘要】随着移动通信技术的迅猛发展,移动运营商积累了海量的用户行为数据。首先基于移动网络的多种数据源,结合通信用户行为的特点,通过时空关联分析的方法提出了一套通信用户停留分析的方法;随后在对用户进行停留分析的基础上,通过用户价值区域多维分析的方法挖掘出高价值区域的地理分布情况。实践表明,基于通信数据的用户行为分析及用户价值区域特征分析对通信网络的建设、通信网络的建设与优化具有重要的现实意义和实用的应用价值。
【关键词】用户行为    区域特征    网络建设    网络优化

1   引言
    移动通信技术的快速发展和应用不仅提升了用户使用通信媒体的便利性,也产生了大量的用户信息。与此同时,基于移动通信用户数据研究用户行为、用户习惯、用户使用业务的地理特征的研究也不断涌现,这些研究能够为移动通信运营商的网络建设与优化提供有价值的信息:根据用户使用的业务行为规律有效地配置网络资源,做到资源的精准投放。因此,本文将对移动网络的用户行为及用户价值区域特征进行研究,对运营商的数据进行多维关联,从中提炼出高价值区域的分布,帮助运营商有效提升网络服务水平,为移动用户提供优质的网络质量和具有竞争力的业务体验。

2   用户行为研究
    通过挖掘用户的位移变化、用户使用网络类型、用户使用业务类型来分析用户停留特征及用户使用业务的热点。利用了用户的使用网络请求类型、业务量、位移量:
    (1)网络请求类型:是指用户在使用业务时使用的网络类型,使用不同类型网络的次数、特定时间段使用不同网络类型的次数作为描述用户使用业务习惯的关键指标。
    (2)业务量:业务量是指用户使用业务的次数、时长以及使用业务的时间分布作为描述用户的停留特征、用户业务使用热点的关键指标。
    (3)位移量:位移量是指用户发生业务时请求的基站的次数、在不同时段请求基站的次数分布作为描述用户停留特征分析以及使用热点的关键指标。
2.1  用户停留特征分析
    用户的停留行为一般具有规律性,在特定的时间段、特定区域停留次数、停留分布,在一定程度上反映了该区域的人口密度以及该区域的主要职能特点。基于用户停留分析,关联用户使用业务的类型、业务量,挖掘用户使用业务的热点,以此来指导网络建设。
    (1)用户停留的数据提取方法
    用户停留数据包括一系列的业务使用记录点集P(p1, p2, ……, pn),其中n为位置记录点的数量,每一个记录点是一个三元素集合pi(lat, long, T),其中(lat, long)是用户发生业务的纪录基站;T为用户发生业务的时间。
    由于用户发生业务不是联系的,它跟GPS点不一样,因此用户停留分析需要连续观察一段时间内用户在某个区域发生业务的频率,以此来反应用户在特定时间段在某一个区域的停留特征。在本文是连续观察某一个地市一个月的用户在某一个基站、某一个时间段发生业务的次数、每天发生业务的频率,以此来识别用户是否在该区域具有停留的特征。本文对停留定义的规则是观察用户在一个月内平均每天在某一个时间段在某一个基站上发生业务的概率大于0.7,那么就认为该用户在基站具有停留的特征。
    (2)用户的停留特征分析
    基于上述的定义,本文把某地市移动用户在工作停留区、休息停留区的用户停留特征进行GIS展现,如下图所示。从图1可以看出,用户的工作停留区域主要分布在红色区域,该区域是该地市的行政中心,也是人口比较集中的区域。从图2可以看出,用户的休息停留区也是分布在红色区域,但较图1而言,图2所覆盖的区域更大,因此可以判断出该行政中心主要的功能还是住宅,工作区域已经逐渐迁出郊区方向。
 
图1    用户工作停留区示意图

 
图2    用户休息停留区示意图
2.2  用户业务使用热点分析
    分析用户业务使用热点能够使现有的无线通信资源实现优化配置,极大提高资源利用率,有效调节该区域业务量不均衡的状态,提高用户满意度。
    (1)用户业务使用热点的数据提取方法
    用户通信热点数据包括一系列的业务使用记录点集P(p1, p2, ……, pn),其中n为位置记录点的数量,每一个记录点是一个三元素集合pi(lat, long, T, B, N),其中(lat, long)是用户发生业务的纪录基站;T为用户发生业务的时间;B是业务的使用类型,包括语音和数据;N是业务量的使用数量。
    (2)用户业务使用的热点
    利用全网基站语音、流量数据与基站的覆盖范围,计算全网业务使用量的密度,并通过GIS对全网业务量进行渲染,根据业务量的密度分析全网业务使用量热点。
    用户使用业务热点分析是根据基站发生的业务量(语音量、数据流量)与基站的覆盖面积(通过泰森多边形确定)构建全网的业务量分布热点图。通过对业务量密度进行分档以及对不同的颜色进行渲染,最后得到业务量密度高的基站,并把这些基站的覆盖范围作为热点的范围。本文通过对3G网络的业务量在不同时间段的热点进行渲染,分别得到了不同时间段的语音热点、流量热点。通过对比图3~图6不同时间段语音和流量的热点分布图,得知该区域的流量热点在闲时忙时差异不是特别大,相反语音在闲时忙时差异很大。由此可以得知,在网络建设时,需要根据用户的业务使用量的时空分布特征有侧重性进行资源调节,提高网络利用率,有效解决网络的超负荷问题。

 

图3    3G网络忙时流量热点分布


 图4    3G网络忙时语音热点分布

 

图5    3G网络闲时流量热点分析


 

图6    3G网络闲时语音热点分析


3   用户价值区域特征的分析研究
    随着通信技术和移动互联网的发展,数据业务已经取代传统的语音业务,流量业务的增长不仅对运营商的网络运营带来巨大的压力,同时也给运营商自身的利润带来挑战。当前运营商的重要任务是如何掌握用户的价值,通过对用户价值区域进行甄别,使得运营商合理地将优先的网络资源分配给高价值的用户使用业务的区域,实现资源的精准投资,降低网络资源负载过重的现象,限制那些对运营商贡献少但又占用极大网络资源的业务来保证网络质量,从而为高价值的用户群体提供更高速、更持续的网络服务,提高高价值用户的用户感知。
3.1   价值区域数据提取方法
    用户价值是利用用户的话务详单、流量详单以及工参等数据,实现区域的流量分析、流量回落分析、高价值用户分析、终端分析以及收入分析,以确定用户的高价值区域,为网络精准规划和优化提供支撑。
    用户价值数据包括一系列的业务使用记录点集P(p1, p2, ……, pn),其中n为位置记录点的数量,每一个记录点是一个三元素集合pi(lat, long, T, B, N, package, I, terminal),其中(lat, long)是用户发生业务的纪录基站;T为用户发生业务的时间;B是业务的使用类型,包括语音和数据;N是业务量的使用数量;package表示用户的套餐类型;I表示用户的收入;terminal表示用户的终端类型。
3.2  用户价值区域多维分析
    (1)流量分析
    通过对每一个基站发生的流量进行汇总,通过流量排名的方法对基站的流量进行排名,按照实际的需求挖掘高流量的区域。如图7所示,运营商可以根据实际的需要分析topN的基站,分析高流量区域的地理分布以及聚集区域。
 
图7    用户流量分析
    (2)流量回落分析
    如图8所示,通过对每一个基站的流量回落进行分析,结合该基站被覆盖的4G基站的情况、不同终端发生的流量、不同制式的终端流量发生情况,找到导致该基站发生回落的原因,为运营商的基站建设和扩容提供有价值的信息。
 
图8    流量回落示意图
    (3)高价值用户分析
    如图9所示,高价值用户分析主要是关注高价值用户发生业务的区域、流量分级,以此挖掘高流量用户聚集的区域分布以及业务特征。
 
图9    高价值用户分析
    (4)终端分析
    如图10所示,结合不同制式的终端渗透率以及流量排名,以此挖掘满足终端渗透率需求以及流量需求的区域,为运营商的基站建设和扩容提供必要性的条件。

 

图10    终端分析

    (5)多维关联分析
    通过对上述的流量分析、流量回落分析、高价值用户分析、终端分析进行多维关联,为运营商的网络规划和建设提供一个综合性的解决方案。从图11可以看到,运营商可以根据各项选项进行关联分析,挖掘有价值的区域。

 

图11    多维关联分析


4   结论
    随着4G时代的到来,业务的性能越来越成为运营商和终端用户的共同关注点。面向移动数据业务的网络质量评估面临新的挑战,本文通过用户行为和价值区域特征分析的特点,反映基于用户感知的网络质量情况,实现有效利用当前网络资源,达到精准化投资的目的。

参考文献:
[1] 刘瑜,肖昱,高松,等. 基于位置感知设备的人类移动研究综述[J]. 地理与地理信息科学, 2011,27(4): 8-13.
[2] Gonzalez M C, Hidalgo C A, Barabasi A L. Understanding individual human mobility patterns[J]. Nature, 2008,453(7196): 779-782. 
[3] Chinrungrueng C, Sequin C H. Optimal adaptive k-means algorithm with dynamic adjustment of learning rate[J]. IEEE Transactions on neural networks, 1995,6(1): 157-69.
[4] Davies D L, Bouldin D W. A Cluster Separation Measure[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence, 1979(2): 224-227.
[5] Dunn J C. A Fuzzy Relative of Isodata Process and Its Use in Detecting Compact Well——Separated Clusters[J]. Cybernetics and Systems, 1973,3(3): 32-57.
[6] Song C, Qu Z, Blumm N, et al. Limits of predictability in human mobility[J]. Science, 2010,327(5968): 1018-1021.
[7] 徐赞新,王钺,司洪波,等. 基于随机矩阵理论的城市人群移动行为分析[J]. 物理学报, 2011,60(4): 46-52. 
[8] Phithakkitnukoon S, Horanont T, Di Lorenzo G, et al. Activity-aware map: Identifying human daily activity pattern using mobile phone data[A]. Salah A A, Gevers T, Sebe N, et al. Human Behavior Understanding[C]. Berlin: Springer Berlin Heidelberg, 2010: 14-25.
[9] 汤燕娟,张小刚. 业务预测与无线网话务量分析方法初探[J]. 电信工程技术与标准化, 2005(4): 77-83.
[10] 田萌. 移动数据业务话务分析及预测[D]. 北京: 北京邮电大学, 2012.
[11] 琳琳,刘俊杉,李德忠,等. 数据业务密度图生成方法及在TD-LTE网络规划中的应用[J].电子工程技术与标准化, 2013(3): 38-41. ★

作者简介 
顾震强:毕业于南京邮电大学,现任广州杰赛科技股份有限公司市场部副总经理,从事移动通信网络规划设计及用户行为分析,长期跟踪通信技术发展,曾主持参与国内外多个运营商的网络建设规划编制。
请输入评论内容
登录注册访问网站首页。

copyrights @ 2013  版权所有:中国电子科技集团公司第七研究所《移动通信》杂志社

粤ICP备17061932号-2     粤公网安备 44010502000212号