光华思想力
光华思想力
《研究简报》第147期 人工智能时代的人机交互(上)——人机合作的效率与平等问题

 

在日新月异的企业数字化浪潮中,大数据、机器学习、人工智能等技术正在不断提升、颠覆各大行业。各大行业可借助算法,改进工作流程,提升工作效率。例如,制造业企业用人工智能替代车间主任去完成机器和工人的调度工作,零售业企业用人工智能辅助店长预测下一个爆品,医院用人工智能为医生推荐诊疗方案。人工智能对劳动力市场的冲击,主要是替代重复性的、基于大量数据分析的任务。而在更复杂的任务中,探索人类决策和算法如何相互结合,利用人工智能技术辅助而不是完全替代人类,是未来人工智能应用中关键的课题。

笔者团队在研究中关注以下问题:人类决策、机器决策和人机合作这三种决策模式在效率上有哪些差异?引入人工智能对劳动力市场的平等性有何影响?本研究得出两点发现:

第一,人类-人工智能合作决策相比于人类决策有非常可观的效率提升。

第二,人工智能辅助可以提升劳动力表现的平等程度,基础表现较差的劳动力可以从人工智能辅助中获得更大的提升。考虑到人工智能完全替代劳动力会带来劳动力市场更大的不平等,“人工智能辅助劳动力”模式是稳定劳动力市场和促进社会公平的优选模式。

一、人工智能的发展趋势是人机合作

目前,人工智能在各行各业的商业应用方兴未艾。现有研究和案例总结得出,在部分应用场景下,人工智能可直接替代人工,而在更多复杂的场景中则以辅助人类决策的形式出现。

现有的实践经验表明,简单任务场景下人工智能直接替代人工可极大提升生产率。例如,零售业企业可以用刷脸支付替代收银员。某零售商的数据显示,一台刷脸支付机器相当于1.5个收银柜台,按早晚班计算,可以减少3个收银员的人力成本,集团每年可节省1344万元。又如,制造业企业可以利用算法替代人工做筹划工作,提升生产效率。管理者可以无死角地实时查看设备和工人的工作状态,并利用算法优化安排工人排班和机器。某重型机械企业听从人工智能的建议,没有增加设备,只是略微增加工人的劳动时间,就实现了两倍的产能提升。

随着人工智能在业界应用的兴起,很多学者开始关注其对劳动力市场的影响。学术研究通过比照真实的人工决策和人工智能决策数据,更为具体地衡量了在不同任务下人工智能与人类决策质量的差距。例如,对比人工智能和法官对被逮捕的犯罪嫌疑人是否可以保释的决策,人工智能可以很大程度上超越人类法官的决策水平,在审前羁押率不变的情况下,让犯罪率下降24.7%。人工智能在心脏病诊疗方面也可以超越医生的判断水平,这主要是因为医生会过分看重人口学特征而不是实际症状,并系统性低估得过肺炎的病人患心脏病的概率。人工智能也同样可以在预测公司营收方面超越研究员。[1]

在更为复杂的、尤其是涉及大量人际交互的场景中,人工智能更多以辅助人类决策的角色出现。例如,在互联网金融中,贷款催收的痛点之一在于单笔额度较低,回款成本较高。借助人工智能技术,互联网金融公司可以依托大数据和机器学习建模,对客户的还款意愿进行分层打分,并提供相应的催收手段和策略。对于还款意愿高的客户,采用提醒版催收话术;对于还款意愿中等的客户,前期使用催收机器人,后期根据催收机器人反馈结果转人工处理;对于还款意愿低的客户,直接转人工处理。据某互联网金融公司统计,通过这一方式,综合回收率可提升5%以上,并且能节省40%的人力成本。又如,以往在线教育的短板之一是教师不能及时观察学生学习反馈、对教学做出调整。而今天,语音识别技术、自适应技术和图像识别技术等人工智能技术都为提升学生学习效果提供了强有力的支持。某在线教育公司还通过收集大量学习行为数据(如观看视频过程中的暂停、拖拽、回放,练习过程中的犹豫时间、看解析等行为),更好地分析学生的学习效果,不断完善教学视频。这些精细提取的学习数据,可能比现场教学分析更加细致,大大节省了教师的精力,可以专心于提升教学内容的质量。在人工智能辅助员工培训方面,有研究表明,在培训员工的三种方式中(人类教练单独培训、人工智能教练单独培训和人类-人工智能教练合作培训),最有效的是人类与人工智能相结合的方式,这主要是因为人类教练可将人工智能总结的内容以更好的沟通方式向员工传达。[2]

本研究集中在探索人工智能辅助人类决策时对效率和公平的影响。

 

二、人类-人工智能合作决策相比于人类决策有非常可观的效率提升

本研究希望进一步理解引入人工智能辅助人类决策的过程中对劳动力市场效率和平等的影响。研究团队基于某公司的历史现金贷实际数据,研究以下三种情形的贷款审批决策的效果:人类单独决策、人类-人工智能合作决策、人工智能单独决策。在人类决策组,决策者看到贷款者的人脸照片和背景信息,并独立做出贷款决策。在人类-人工智能合作决策组,人工智能为决策者提供贷款者基于人脸照片判定的还款倾向(下称还款分[3]),决策者根据贷款者的还款分和其他背景信息,综合做出贷款决策。在人工智能决策组,贷款决策完全由人工智能完成。然后我们用贷款者的真实历史表现衡量贷款决策质量,并分析其中的决策机制。

我们首先分析人工智能以不同形式引入决策对于决策质量的影响。如图1最左侧所示,人类决策组、人类-人工智能合作决策组、人工智能决策组的准确率分别是62.4%70.6%84.7%,并在统计上有显著差异。人类-人工智能合作决策组相比于人类决策组,准确率提高了13.3%,提升程度非常可观。

 

图表描述已自动生成

1 人类决策组、人类-人工智能决策组、人工智能决策组对比

 

决策错误可以进一步分为“错误地拒绝了实际还款的人”和“错误地接受了实际未还款的人”两类错误。图1中间和右侧两列展示了这两类决策错误的占比。人类-人工智能合作决策组相比于人类决策组,在两类错误方面都有所降低。有趣的是,人类-人工智能合作决策组相比于人工智能决策组,仅仅在错误地拒绝了实际还款的人方面落了下风(人工智能决策组仅为3.5%),而在错误地接受了实际未还款的人比人工智能单独决策表现更好(人工智能决策组为11.7%)。这意味着,人类做最终决策时更注重避免错误地放贷给实际不会还款的人。人类与人工智能的目标不尽一致,可能是造成人们不愿意采纳人工智能辅助的原因。


课题组成员:陈泽阳、刘玉珍、孟涓涓、王曾

作者单位:北京大学光华管理学院


如需获取完整简报,请点击此处联系我们