40天,36亿人次。这是2014年春运的总时间和总出行人数。这场堪称人类历史上最大规模的短期迁徙中,人群从哪儿去了哪儿?哪些线路最热门?
以往,这些问题可能难以精确回答。但随着技术进步,通过应用大数据这一技术利器,人们已经接近迷宫中感受全局地看见春运的全景。
实时地图上的春运全景
1月26日,百度迁徙网站正式上线。网站主页的中国地图上,每一个跳跃的点,都是人们动身和到达的目的地。点击任一城市,就会出现过往8小时内这一乡村迁出与迁入人次最多的数据。
点击北京会看到26日1119时,从北京出发,最热门目的地的前3位是保定、天津、德州,流入北京人次最多的天津、保定、成都、上海。同一时间段内,全国最热门的春运线路前3位,成都到北京、上海到滁州、天津到德州。笔者又查看了1月16日春运开始后每天的实时数据汇总榜,北京和成都之间的双向流动,一直位居最热线路的前几位。同时,京沪线上的北京和上海之间、京广线上的北京和郑州之间,也是迁徙人群流动的热门线路。通过新技术,笔者看到北京、上海、广东等省市,一直是人口迁出的大省。这和春运的基本判断吻合—这些地区历来经济发达、外来人口较多。
此外,新的趋势也在呈现。通过大数据,发现了一些有趣的现象,比如人口的逆站迁徙’以成都为例,发现春运期间有很多人往北京跑。因为现在很多年轻人在大城市工作,工作之后有了小孩不回家了父母到北京来过年,这就形成了一个逆向迁徙高峰。百度品牌沟通副总监徐继业介绍说。这一数据与成都铁路局的统计情况吻合—与去年相比,今年春运,成都到北京的旅客增幅逾60%
此次百度图景化地展示春运情况,基于LBS基于地理位置的服务)技术的一次创新。数据每8小时更新一次,囊括了全国铁路、公路和航空在内的线路。
国内有2亿手机用户使用百度地图,用户每次位置变化,百度都能得到数据。把手机网民的定位信息汇总成大数据进行分析,就能勾勒出人们迁徙轨迹。百度LBS技术总监顾维灏介绍道。
购票数据里的春运迁徙
除了通过人们位置的变化得到大数据,购票信息另一个可以得出大数据的途径。
84亿次,这是1月9日12306网站和手机端的总访问量。这一天,人们可以买腊月二十九的火车票,最热门返乡日。这相当于每个中国人都通过电脑或手机访问了该网站6次多。这一天,该网站平均每秒的点击量是24万次,意味着抢票开始时,如果晚点鼠标1秒钟,就已经落后了20多万次。难怪12306网站的火车票每次放出,几乎都是秒杀状态—要回西安的小高从当天早上8时开始刷票,一直刷到下午2时多,才买到一张无比珍贵票。
12306网站的数据显示,当天平均每一张火车票,都需访问网站近千次才干预订胜利。略显严酷大数据里,盛放着每一个人想回家的急切心情。这一天,网购的火车票达501万张,占该日全部售票量的57.5%网络和电话购票的冲击下,保守的网点售票正日渐式微,不会使用数字技术购票的人群买票也越来越难,落入新一轮的数字鸿沟
今年,共有1400万人次使用支付宝抢票,这些购票数据形成的大数据,也显示了春运的一斑。支付宝发布的支付宝用户春运演讲》显示,湖南人、湖北人、河南人,成为跨省春运的主力军数据显示,广东、浙江、北京、上海、江苏,这些离乡者的主要工作地。其中,广东被春运带走人数是最多的
不过,大数据也显示,现在外出务工的人群不再一味孔雀东南飞人群流动最集中的离家200800公里的区域。比如北京,流出的人口就主要集中在保定、邯郸、石家庄、张家口、天津5个周边城市。而诸如广东到湛江、西安到咸阳、武汉到黄冈、重庆到成都等热门线路,则显示了一些城市群的崛起。
专家表示,随着未来移动互联网的发展,分析人口迁移的方向、城镇化进程、乡村治理、春运运输调配、文化交流等方面,大数据技术都具有重要意义。