(如需转载,请后台联系管理员)
原文信息:Erik Brynjolfsson, Danielle Li, Lindsey Raymond., 2025, "Generative AI at Work", The Quarterly Journal of Economics, 140 (2): 889–942.
原文链接:
https://academic.oup.com/qje/article/140/2/889/7990658
图片来源:ChatGPT生成
推文期数:277期
成语出处:《千字文》:“桓公匡合,济弱扶倾”,指扶助弱小或处境困难的人。
引言
技术变革对劳动力市场的影响是经济学长期关注的经典问题。随着生成式人工智能(Generative AI)的诞生与发展,这一议题再次引发了学者与政策制定者的广泛讨论。尽管现有研究在类实验室环境下已证明生成式AI在写作、编程等多个领域表现优异(Peng et al., 2023;Noy & Zhang, 2023),但现实工作场景远比实验环境复杂,其问题来源更广、形式更灵活,AI可能无法妥善应对,同时,人机协作本身也存在沟通与协调的困难。因此,生成式AI在真实企业环境中能否显著提升劳动生产率仍存在较大不确定性。此外,生成式AI对不同技能与经验水平员工的影响也可能存在差异,AI究竟是产生“替代效应”,取代低技能员工、加剧劳动力市场分化,还是发挥“赋能效应”,缩小员工之间的技能与绩效差距,这一问题在学术界也尚未形成共识。
为回应上述核心问题,本文聚焦于生成式AI实际落地的前沿领域——在线客服行业,利用一家美国大型软件企业的内部运营数据,基于AI助手逐步推广的特征,识别了生成式AI在真实工作场景中的微观影响。研究发现:①AI助手显著提高了员工劳动生产率,客服人员每小时解决问题的数量平均提升约15%。②AI助手的影响具有明显异质性。技能水平较低、经验不足的客服受益最大,而高水平员工的收益有限,其工作质量甚至轻微下降。③AI助手能够加速客服的学习进程,使其更快掌握有效的沟通技巧与问题解决方式,客服对AI建议的遵循度越高,收益越大。④AI助手显著改善了客户与客服之间的互动体验,降低了新员工的离职率。
本文的研究贡献主要有以下三点:①首次提供了来自真实工作场景的生成式AI应用的实证证据。既有文献多基于实验室实验讨论生成式AI对劳动力市场和员工绩效的影响,本文使用大型企业的运营数据提供了微观层面的因果证据。②揭示了生成式AI影响员工绩效的多重机制。本文根据员工遵循度、人力资本积累、问题类型等特征进行异质性分析,系统展示了AI工具提升员工表现的内在路径。③为理解技术进步与人力资本积累的关系提供了新的经验证据。本文的研究表明,AI工具在提升整体生产率的同时,对低技能、低经验员工的帮助尤为显著,即生成式AI可以有效缩小员工之间的技能差距。
生成式AI与应用场景
1.生成式AI与大语言模型
生成式人工智能是指能够基于既有数据模式生成新内容的AI模型家族,覆盖文本、图像、音频、视频等多模态输出。本文所研究的模型,是其中专用于处理序列化文本数据,进行文本内容输出的分支,即大语言模型(Large Language Models, LLMs)。在计算规模扩大与训练方法优化的基础之上,其诞生、发展、迭代的关键在于模型架构的创新。位置编码(Positional encoding)和自注意力(Self-attention)机制的出现,大幅提高了序列信息的传播效率,使模型能够在复杂语境下捕捉语义关系,从而根据已有文本,掌握语言的统计规律,进而生成语法正确且语义连贯的新内容。基于此,通过利用海量无人为标注的数据进行预训练,模型能够学习自然语言的基本规则与通用知识,进而具备基础语言能力,再根据具体应用场景,使用针对性的有标注数据进行微调(fine-tuning),强化模型在特定领域的能力以满足需求。本文所研究的AI以GPT-3为基础,经客服对话数据微调,并对高绩效员工样本加权,以期将优秀客服的行为模式嵌入模型建议中。
2.应用场景
本文的研究对象为一家软件公司,该公司主要经营面向美国中小型企业主的业务流程软件,并通过自有团队或外包为客户提供基于文本的在线技术支持服务。数据来源为客服的运营日志,覆盖来自5172名客服的数百万条对话记录(其中大多数客服来自菲律宾,少数位于美国本土)。客服人员被编入若干团队并由各团队经理管理,其工作内容统一,即根据空闲程度随机分配客户并为其提供技术支持,但不同客服之间的绩效差异显著。
本研究使用以下月度层面的客服行业指标来对生产力进行衡量:(1)主要指标:每小时问题解决数(Resolutions Per Hour, RPH)。(2)其他指标:平均对话处理时长(Average Handle Time, AHT)、每小时处理的聊天数(Chats Per Hour, CPH)、解决率(Resolution Rate, RR)、客户满意度(Net Promoter Score, NPS)。
因预算与培训资源有限,企业分批次逐步推广AI助手的使用。每名客服在完成一次性的三小时培训后即可获得AI使用权限。该培训名额有限,若已启用的客服离职,则名额可回收给尚未启用AI的客服。此外,为确保客服团队的正常运转与培训质量,同一团队内的客服被分配至不同批次的培训,当团队分配到培训名额时,具体人选由团队经理根据当天的排班情况从成员中挑选。这一逐人逐次的上线机制是本文识别策略的关键,也使得同一团队内成员的上线时间存在自然跨期差异。AI助手启用后,系统会实时监测客服聊天对话,并根据对话容适时给出建议。员工可以自行决定是否采纳,以及如何采纳建议。
实证策略
本文采用标准双重差分模型研究AI助手的因果效应。模型设定如下:
其中,Yit为衡量员工生产力的结果变量,基准回归使用每小时问题解决数,因变量AIit示员工i在时间t是否启用AI助手,若启用取1,反之取0。δt控制共同的时间趋势,αi为客服个体的固定效应,用于控制个人能力等无法观测的个体因素,Xit是客服层面的控制变量,用于控制员工经验等客服个人因素的影响。同时,为缓解经理挑选培训员工时存在选择偏误的问题,本文还以团队内首个AI启用时间作为工具变量,证明AI启用与不可观测的客服个体特征无关。
此外,考虑到AI助手是逐步推广的,使用传统双重差分模型可能存在负权重问题(Negative Weighting),本文还采用Sun and Abraham(2021)提出的交互加权方法(Interaction-weighted Estimator, IW)研究处理效应的动态路径,并使用其他稳健估计量、不同标准误聚类层级与观测值权重加以验证。
实证结果
1.AI助手对整体劳动生产率的影响
本文首先考察了AI助手上线对客服总体劳动生产率的影响,图2的结果表明,客服平均每小时解决问题的数量提高15%,该效应在AI启用后立即显现且在整个样本期内保持稳定。此外,客服单次聊天的平均时长与每小时处理的聊天数也得到显著改善,而解决率与客户满意度则未有明显变化,这表明AI助手在提升客服效率的同时并未以牺牲服务质量为代价。
2.异质性影响
为探究生成式AI工具的应用究竟会带来技能偏向还是技能扩散,本文分别按照客服的技能水平与任职期限进行分组,检验了AI助手上线的异质性效应。结果如下图所示,技能水平最低的客服受益最多,而水平最高的员工则收益有限,解决率与客户满意度甚至略有下降,这可能源于高水平员工对AI建议的过度依赖。而对于不同经验水平的客服,亦出现相似结果,这表明AI助手通过分享高绩效员工的成功经验,缩小了客服之间的技能差距。
3.客服成长速度的变化
为进一步研究引入AI助手后员工生产率的变化情况,本文画出了三类不同员工的学习曲线。结果如下图所示,刚入职就启用AI的客服学习曲线明显更为陡峭,仅通过两个月的学习,这类客服解决问题的能力就与从未使用AI的客服8-10个月的水平相当,而对于入职5-6个月才启用AI的客服,其每小时问题解决数依然在引入AI后迅速上升,这说明AI助手不仅显著加快了新手的上手速度,也提升了资深员工的进步速度。此外,客服对AI建议的遵循度越高,学习带来的生产力收益也越大,而随着时间推移,所有人都对AI建议展现出更高的遵循度与信任度,这也再次暗示了AI助手在真实工作中的实用价值。
4.客服人力资本积累
本文进一步考察了AI对客服人力资本积累的影响。对此,本文利用AI服务宕机(Outage)时段的对话数据进行了研究。结果如下图所示,可以发现,即使是在AI服务不可用的时段,那些愿意采纳AI建议的员工表现依然更为出众,其对话处理速度提升,展现出更高的工作效率,这表明AI建议能够内化为客服能力,带来持续的人力资本改善。
5.工作体验与离职率
客服岗位具有高标准、高压力的工作特征,其离职率长期居高不下,导致企业面临高昂的劳动力成本。AI的引入或许可以通过改善客服-客户关系,减少客户的情绪输出与质疑,以优化员工的工作体验进而降低离职率。本文发现,引入AI后客户情绪得到明显改善,要求转接客服上级主管的概率同样显著下降,下图的结果显示,这种工作体验优化使客服离职率显著下降。
结论
本文基于一家企业客服团队的微观数据,利用生成式AI工具逐步推广的准自然实验,揭示了AI在真实职场环境中对劳动力的复杂影响。结果显示,AI显著提升了整体生产率,但收益主要集中于低技能与经验不足者,高技能员工的表现改善有限。这表明生成式AI在提升效率的同时,也可能重塑人力资本结构与企业劳动需求格局,未来政策或应以促进技术扩散、完善技能再培训机制为重点,以实现技术进步与包容性增长的统一。
推荐理由
本文揭示了生成式AI在真实职场中对员工绩效的影响,但也留下了诸多值得深入探讨的问题。研究发现,高技能员工可能因过度依赖AI而表现下滑,这或将削弱AI系统的持续学习与优化能力;同时,企业绩效目标的动态调整可能侵蚀员工收益。更重要的是,本文的结论基于中短期的局部均衡,从长期看,企业究竟会选择以AI替代人力,还是扩大劳动需求?技术进步最终将利好低技能还是高技能群体?这些问题仍需要未来进一步的研究。
推荐人:米兰电竞·(中国区)财政税务学院 罗皓元
排版 | 杨春亭
一审 | 刘 桦
二审 | 万 欣
米兰电竞·(中国区)财政税务学院
海南大学国际商学院
米兰电竞·(中国区)收入分配与现代财政引智基地
全球公共财政研究中心
读经典之文献
学先进之方法
铸坚实之基础
享深邃之思想