有人用大数据“杀熟”,她们却用大数据做了我市轨道交通客流分析,运用自己设计的算法,对轨道交通出站人数的预测平均精准率达到了93%。昨日,在第33届重庆市青少年科技创新大赛上,南开中学三位高二女生的研究项目获得了一等奖。

  挤地铁 挤出来这个课题

  谭婧懿、韦沐汐、唐睿诗是南开中学高二年级的学生,虽然三人不在同一班上,但她们都有一个共同的爱好,参加科技创新活动。说起这次参加重庆市科技创新大赛,谭婧懿有些不好意思,“这个选题,还是我们上学放学挤地铁挤出来的。”

  原来,三位女生经常坐1号线。

  “每天早上上学和放学回家乘坐轨道交通会这么拥挤?根本就挤不进去啊!”“如果有方法能够迅速疏散客流,为市民提供快捷、舒适的出行服务,那该多好!”

  三个人你一言,我一语,就把选题给定了下来。

  找数据 一站就是3小时

  确定了选题,就开始找数据。“她们用了最笨但也是最实在的办法,就是高峰、平峰两个时间段,到地铁站数人。”指导老师杨梦宁说。

  “我们三个人,一人数出站人数,一人数进站人数,一人看车厢的拥挤程度。”唐睿诗说,虽然大家有分工,但一天数下来,“是真累,好想带个小板凳坐下,好想吃个面包充饥。那段时间真是太累了,回去就不想动,放空自己。”放学后、假期里,在地铁1号线的沙坪坝站,三位小女生成了常客。还因为长时间站在那里,不少人以为她们是志愿者,“好多来问路的。”

  付出总是有回报,数了一段日子后,孩子们在自己整理的记录上,发现了一些规律,“我们通过这些数字中的规律,再找到负责部门要了一些数据,做后期的研究。”

  做分析 手算一个月才处理两个星期数据

  拿到了海量数据,就要做分析找规律。因为之前没有做过类似的课题,三位女生又用到了最原始的方法,把数据录入到EXCEL里“手算”。“因为数据要录入,还要排版,这样‘手算’了一个月,才处理两个星期的数据,这样不是办法。”杨梦宁说。

  于是孩子们运用多种算法对数据进行计算,“最开始,预测精准率只有60%,后来加入其他算法,提升到70%以上。但她们拿着这样的结果给运营部门看时,他们说精准率在80%以上,才算有点意义。”在深度学习算法后,“我们再把空间特征转化为时间特性来进行计算,平均精准率就达到了93%。”谭婧懿说。

  “我们的创新主要是将轨道交通的空间信息引入到客流预测中,同时引入了两种不同的时间信息,即历史同期序列与顺序时间序列,并将其结合,形成新的特征组。除此之外,还将时空特征进行结合引入到客流预测中,将空间特征以及时间特征历史共同结合来创建模型,能更准确全面地进行客流预测。”三个女生的这一项目不仅获得了一等奖,目前也正在申请相关的专利。(记者 罗薛梅)