师资和研究FACULTY

返回首页

李楠:如何解救困在系统里的外卖骑手?

发布者:校友与发展联络办公室    发布时间:2020-09-24

——在决策系统中引入不确定性下的稳健经济决策思维

2020年9月8日的一篇《外卖骑手,困在系统里》,在很多人的朋友圈刷屏。文章以一句“又有两分钟从系统里消失”开篇,剑指问题的症结:外卖平台企业运用AI智能算法和大数据不断缩减外卖骑手的配送时间,导致骑手在差评和罚款的压力下不得不违反交规骑行,事故频发,甚至失去宝贵的生命。饿了么和美团两大外卖平台都在第一时间迅速反应,饿了么给消费者多等5-10分钟的自主选择权,而美团外卖则给骑手留出8分钟弹性时间。

如何解救这些困在系统里的骑手?饿了么和美团的发表声明后的短短几天内,有多篇文章从不同的角度探讨解决问题的方法,包括行政监督、监管平台、激励机制、法律保障、人文关怀等。

但是又有更多人的反思,消费者的同理心能够解决问题吗?在算法中引入人文关怀如何操作?什么样的监管和行政法规才是可执行的?饿了么把平台与骑手的问题转嫁为消费者的“良心拷问”引起了消费者的恶评;而美团给外卖骑手一刀切式的“弹性8分钟”又可能让骑手订单量锐减,降低骑手的收入。每个人都看到了问题,但是找到一个合理的可执行的解决方案却很难。

既然是算法造成的问题,解决问题的关键应该还是算法

从经济学的角度来看,任何一个问题都是一个有约束的优化问题,实时智能配送系统计算外卖骑手的配送时间也不例外。该问题的优化目标是消费者的满意度、外卖平台的利润和外卖骑手的收入,显然配送时间越短,消费者越满意;单位时间内完成订单越多,平台利润越高,骑手收入越高,但同时成本也必然越高。

任何算法在寻求利润极大化或者成本极小化的过程中,不可避免地需要考虑到各种约束条件设置多种参数,比如路面状况、高峰时段、雨雪天气、外卖骑手的工作效率等等。如果说为了拯救外卖骑手,强行通过监管条例、行政命令、道德约束、人文关怀等来给外卖骑手多几分钟,这样不仅不能解决问题,反而会因为把更多的约束条件强加到算法中,把最优解变成次优解,降低平台的利润和外卖骑手的收入,造成更多新的问题。

如何破解?

在算法中引入对参数和模型的不确定性的考量,设计出具有稳健性(robustness)的算法是解救外卖骑手出困境的关键。

近些年来,“不确定性”一词频繁出现在政策制定者、管理者和投资者的口中。特别是今年年初新冠疫情爆发以来,越来越多的人深深感受到了不确定性的增大对个人和社会的巨大影响。但是面对不确定性如何做出最优决策却鲜见讨论。这是因为既然是不确定性,就是难以捉摸、难以预测、难以把握的,既然无法把握,那么如何能应对?

其实,我们每个人都有应对不确定性的直觉,中国的老话“不怕一万,就怕万一”,英文的谚语“Prepare for the worst and try your best”都是说当我们面对不确定性时,应该在最差的可能性中寻求最优的结果,也就是“做最坏的打算,努力获得最好的结果”。以这样的思维做出的决策是具有稳健性,保证在最坏的情况下不出现灾难性的后果。如果外卖配送时间的算法能够考虑到骑手可能碰到的各种不确定性,在设计最优解法的时候,寻求在最差情形下的最优解,那么就能保证骑手即使碰到最恶劣的情况也能在规定的配送时间内完成任务,这样骑手就不会被迫“铤而走险”。

设计具有稳健性的算法的技术挑战在于,如何量化各种影响配送时间的因素的不确定性,并系统性引入带有约束的经济决策优化问题中。

不确定性下的决策科学和控制理论在机械制造等实际生产中的应用已早有丰硕的成果,在经济决策中的应用也在近些年也有了长足的发展。诺贝尔经济学奖获得者托马斯萨金特和拉尔斯彼得汉森为代表的经济学家从上世纪八十年代就开始在经济决策中系统地引入不确定性的研究,得到了丰富的可以应用于解决实际问题的成果。

外卖平台的技术人员可以充分借鉴现有的研究成果,在算法中量化并引入对各种影响配送时间的因素的不确定性,即考虑在多种可能出现的情形中最坏的情景,例如,每一个红绿灯都需要等足全部时间,每一个电梯都需要等候最长的时间等,并在最差的情景求得最优配送时间,从而得到具有稳健性的最优解。

一般而言,具有稳健性的决策往往更为保守,也就是说最优配送时间会因为考虑到最坏的情景而被延长,但是具有稳健性的算法可以科学地根据不同订单的情况,在考虑到平台和骑手的经济利益的前提下,算出最合理的“弹性时间”,让骑手即便碰到最不利的情况也能在系统规定的配送时间内完成任务。这样得到的最优时间虽然可能会多几分钟,但是因其考虑了消费者、平台和骑手多方利益的最优稳健方案,不需要通过强加额外的行政命令和道德约束,也能让利益相关各方乐于接受。

通过收集和分析数据,减少因不确定性而产生的成本。

如果在做决策时,盲目地考虑最差的可能性,就可能做出过于保守的决策,这也是有成本的。为了减少过度保守决策的成本,可以基于不断累积的数据,更好地把握路线和气候等因素的不确定性对于配送时间的影响,例如,可以尽可能精确地估计红绿灯、电梯的最长等待时间,尽可能精确地估计不同时段、不同路段因雨雪天造成的最长延误时间,从而能够得到更好的具有稳健性的最优解, 降低不确定性带来的成本,在保证不出现灾难性后果的前提下,进一步提高优化配置效率,提高消费者和骑手的利益。


“中国智慧”是不确定性下的稳健最优决策思维

对比“摸着石头过河”的中国特色市场经济的改革和前苏联的“休克疗法”,对比中国和其他国家应对新冠疫情的不同措施所产生的截然不同的后果,我们都可以看出在面对不确定性时,在最坏的可能性下寻求最好的结果的稳健决策思维可以避免灾难性的后果。

随着信息技术迅猛发展,获取数据和计算能力的提升使得量化不确定性并且在经济社会中的决策中引入对不确定性的考量成为可能。无论是国家的产业政策和货币政策还是企业的管理决策和投资决策,都应该考虑到重要因素的不确定性,引入不确定性下的稳健决策思维,并且通过收集分析有效信息,充分降低不确定性,从而在避免灾难性的后果的同时,减小因不确定性而做出过度保守决策的成本。