本文利用粒度计算在处理多源、海量、异构交通时空数据方面的优势,将其引入定制公交初设线路选择。以交通特性、出行者个体特性、出行特性等数据为分析处理对象,以识别城市公众中可能采用定制公交通勤出行、通勤线路分布为目标输出的群体数量,构造同质出行特性判别信息颗粒;采集经脱敏处理后的公交刷卡数据、公交APP数据、卡口过车及驾驶员数据,通过粒度计算,挖掘提取目标群体的出行时间、地点、方向、目的等特性,并进行归类,从而为定制公交线路走向、里程、途中停靠站确定提供依据。
定制公交是一种“类专属”公共交通服务方式,其服务对象是出行起讫点、出行时间相近,出行计划相对稳定(主要为通勤出行),且对出行时效性、舒适性需求较高的群体[1]。近年来,在公众对出行方式多样化需求不断提升,以及“互联网+”技术广泛应用等因素的多重推动下,定制公交在国内多个城市开通运营并逐渐兴起。
目前,国内公交企业多采用基于乘客需求的反向操作方式来运营定制公交。其基本流程是:1) 首先由乘客向公交企业提交自身需求;2) 公交企业结合乘客需求,设计最优线路;3) 进行乘客招募;4) 开通运行。这种线路运营模式在需求调查阶段可以有效节约公交企业成本,但同时也存在明显缺点:一是需求信息获取难度大,难以为线路开行决策提供大数据支撑。由于线路开行需要事先由乘客提交乘车需求, 因此对公交企业而言, 需求信息的获取方式是被动的, 这就造成其能够获取的有效需求信息数量少、效率低,直接影响线路开行决策的正确性;二是影响乘客的出行体验,造成客源流失。据文献[2]所述, 北京市乘坐定制公交的乘客中,有约60%之前自驾车上下班,这部分定制公交主力乘客对线路通达性、预定便利性、乘坐舒适性较为敏感,因此在事前提交乘车需求的情况下,如果需求无法满足,很容易造成这部分乘客不愿再尝试使用定制公交出行。由此可见,定制公交线路开行方案是否合理,很大程度上依赖于需求调查的准确性,而目前被动式的调查方式难以胜任。
随着交通数据采集手段的日益丰富,交通出行时空数据呈级数增长。通过对这些海量、多源、异构的交通数据进行挖掘分析,可以精准提取城市人群的出行特性,从而为公交企业科学制定定制公交线路运营方案提供了保障。粒度计算(Granular Computing)是信息处理的一种新的概念和计算范式,覆盖了所有有关粒度的理论、方法、技术和工具的研究。它是词计算理论、模糊集理论、粗糙集理论、商空间理论、区间计算等的超集,是软计算科学的一个分支[3]。粒度计算在对信息进行处理时并不局限于细节, 因此在对海量、模糊、不确定、不完整的信息进行分析运算时表现出独特的优势。将粒度计算引入交通出行时空数据处理,挖掘分析城市公众通勤出行特性情况[4],包括通勤出行时间、地点、走向、路线、偏好等,并从中提取可能乘坐定制公交的群体数量和分布信息,为定制公交线路的开通提供决策依据。