《南方日报》:大数据视觉下的深圳交通 老街地铁站日均客流上万 最赚钱的士日净收入近千
深圳最长的公交路线是哪条?深圳5条地铁线118个站点中哪个站客流量最大?哪个站最拥挤?深圳约1.5万辆出租车中最赚钱的司机是哪一位?深圳出租车的行驶里程能绕地球多少圈?科技园的程序员每天几点下班回家等等?……通过大数据技术计算,这些话题都找到了答案。
大数据助力交通规划
记者了解到,2010年起,中国科学院深圳先进技术研究院在智能交通领域与深圳市交通运输委员会开展合作,基于深圳市交通运输委员会在智能交通领域的管理思路,结合深圳先进技术研究院在云计算及海量数据分析处理等方面的优势,依托中科院华南超算节点,旨在共同打造基于云的智能交通大数据管理平台,从弹性存储资源管理到交通数据分析挖掘,在有效提高政府行业监管效率的同时,多方位多角度地为公众提供便捷的交通出行资讯发布、交通出行规划等服务。
“比如乘客上了一辆公交车,通过刷卡付车费和车辆定位两方面的信息,我们可以计算出车上有多少人、拥挤程度如何,每条公交线的平均等待时间、预计多长时间到达乘客所在的站点等进行分析,可以为决策者决策、规划提供一些指导依据。”中国科学院深圳先进技术研究院云计算技术研究中心副研究员张帆博士告诉南方日报记者,交通部门以往一度采用调查问卷的方式了解公众出行需求,虽然更加全面,但速度相对缓慢,现在的数据可以实时更新,对用户需求可以更快地了解,反应速度很快,改进也很快,而且改进后的效果也可以尽快看到。
每天实时传递新数据
今年4月1日,深圳的定制公交进入“试水”阶段,有两条单向线路在运行,分别是四季花城-南山科技园、梅林二村-华为两条线路,收费均采用包月制。据张帆介绍,定制公交起点与终点的确定也与大数据密切相关,通过以往的数据可以分析出哪些起点和终点是人们需求量比较高的,哪些站点是乘客频繁早出、晚归或换乘的。此外,大数据也可以反映出出租车的违规交接班等异常行为,分析得出长途客运车在路边揽客等异常行为。
深圳交通的数据是如何获得和处理得出相关结论呢?张帆告诉记者,深圳的公交车、出租车、地铁、长途客运车等基本都有数据采集的设备,每天实时传递出新的数据,如出租车每天的运营金额、里程,公交车各个站点的刷卡记录等。
“这些数据每分每秒收集,凌晨起,很多服务器构成的数据处理集群将按照设定好的分工,对前一天的所有数据自动计算,完成数据清洗、过滤以及固定程序的任务,我们早上上班时就可以看到这些预处理过的数据,基于这些清洗好的数据开展下一步工作。”张帆举例说,这些数据经历了数据质量分析、数据处理、数据可视化等过程,如果用炒菜来比喻的话,服务器在夜间将收集来的所有数据进行分类、清洗、存储,工作人员上班后需要做的只是炒菜的步骤,可视化则是最后的摆盘过程。
《南方日报》2014年8月15日星期五第SC08版 http://epaper.southcn.com/nfdaily/html/2014-08/15/content_7339670.htm