摘要
关键词:算法决策;自动驾驶公交;算法设计;公共价值;公共交通
自动驾驶公交车(ABs)为城市交通带来了变革潜力,有望提高效率、降低排放并节约成本。然而,其成功不仅取决于技术进步,还取决于公众的接受度,而公众接受度又受到算法设计和用户认知的影响。本研究探讨了四个关键的算法设计特征——驾驶控制模式、驾驶风格、伦理优先级和人机交互——如何影响公众对自动驾驶公交车的偏好,以及公众价值感知(有效性、效率、公平性、参与度和安全性)如何中介这些影响。通过对1062名美国居民进行联合实验,我们的研究结果显示,具有更强人类监督、防御性或平衡性驾驶风格、以安全为导向或适应性伦理以及增强人机交互的算法设计,能显著提高公众对自动驾驶公交车的偏好。中介分析进一步揭示了非对称且有时相互抵消的路径:虽然安全性和有效性始终强化偏好,但效率有时会削弱偏好,而公平性或参与度则可能根据情境增强或抵消其他价值渠道。这些动态揭示了一种竞争性中介机制,即算法特征激活了相互抵消的价值维度,而净偏好则由它们的相对强度决定。本研究通过展示算法特征如何激活多个且有时相互竞争的公共价值维度,丰富了公共交通中算法治理的理论理解。这些见解强调,公众接受度取决于设计选择如何调和有争议的价值,为将自动驾驶公交系统与公众期望对齐提供了方向。
1. 引言
自动驾驶公交车——能够在无需人工干预的情况下感知周围环境、导航道路并做出决策的自动驾驶车辆——已成为公共交通领域的一项变革性创新(Mouratidis & Serrano, 2021; Taehagh & Lim, 2019)。横跨北美、欧洲和亚洲的试点项目展示了其技术可行性,但也引发了紧迫的治理挑战。对于政府机构而言,采购和监管取决于算法如何平衡安全、效率、公平和包容性;对于政策制定者来说,公众接受度既是部署的先决条件,也是合法性的基准。因此,公民对算法设计特征的评价为系统设计、监管决策以及更广泛的智能出行公共价值追求提供了关键指导。
以往的研究主要集中在自动驾驶汽车的外部采纳驱动因素上,例如用户层面的特征(如 Greifenstein, 2024; Mouratidis & Serrano, 2021)和服务层面的属性(如 Webb et al., 2019; Winter et al., 2018)。相比之下,对控制车辆如何感知、决策和行动的内部算法设计选择的关注相对有限。最近的研究表明,算法设计特征——如人类参与程度、提供的解释类型以及系统逻辑的清晰度——塑造了公众对公平性、信任和接受度的看法(例如,Aoki et al., 2024; Grimmelikhuijsen, 2023; Horvath et al., 2023)。尽管有这些见解,但很少有研究系统地探讨哪些具体的算法设计特征在塑造公众偏好方面最具影响力,尤其是在自动驾驶公交车等集体交通情境下。阐明这些联系对于理解公民是否接受自动驾驶公交车以及他们为何接受至关重要。
要理解这些设计特征为何重要,需要一个更广泛的评估视角。公共价值理论提供了这个视角,它强调公民评估技术不仅看其性能,还看技术是否体现了安全、公平和问责等社会价值。同时,算法设计特征通过嵌入问责、公平和以用户为中心的互动原则,积极塑造这些感知(例如,Hemesath & Tepe, 2024; Kieslich et al., 2022)。这些发现表明,算法设计不仅是技术性的,而且内在具有价值负载,塑造了公共价值感知如何与公众偏好相互作用并影响公众偏好。然而,在自动驾驶公交车的背景下,算法设计与公共价值感知之间的相互作用仍未得到充分的理论化和实证检验。阐明这些关系对于加深我们对公共交通中算法治理的理解至关重要。它也为政策制定者提供了如何设计不仅技术健全而且合法且公众可接受的自动驾驶公交系统的指导。
为了弥补这些空白,本研究考察了四个关键的算法设计特征:驾驶控制模式、驾驶风格、伦理优先级和人机交互,这些特征是通过对现有文献的回顾确定的(例如,Ekman et al., 2021; Keller et al., 2021; Rhim et al., 2020; SAE International, 2018)。选择这些特征是因为它们在功能上对自动驾驶公交车的运行至关重要,对乘客的体验有显著影响,并且政策制定者和开发者可以实际进行调整。此外,我们探讨了不同的公共价值感知在这些动态中的特殊作用。通过将公共价值的传统概念与自动驾驶车辆技术相关的独特风险、不确定性和公众关切相结合,我们确定了公共价值的五个关键维度:有效性、效率、公平性、参与度和安全性(Cepiku & Mastrodascio, 2021; Jo & Meier, 2024; Kassens-Noor et al., 2020; Rainey, 2009; Rose et al., 2015)。为了实证检验我们的框架,我们对1062名美国居民进行了一项联合实验,参与者评估了替代性自动驾驶公交车部署方案之间的权衡。这项研究推进了我们对算法设计如何与公共价值感知相互作用以塑造接受度的理解,为将自动驾驶公交系统与社会期望对齐提供了理论见解和实践指导。
2. 文献与假设
2.1. 公众对自动驾驶公交车的偏好
算法决策(ADM)是指使用先进的数据驱动技术(如自然语言处理、机器学习和计算机视觉)来辅助或自动化决策过程的系统(Mergel et al., 2024)。这些系统日益被视为在各个公共部门领域提高治理有效性和优化资源配置的关键工具。算法决策的应用涵盖了智能医疗、智能交通系统和行政执法等领域,凸显了其变革潜力。
在智能交通领域,自动驾驶公交车已成为算法决策技术的一个突出应用。自动驾驶公交车配备了激光雷达、高精地图和基于人工智能的导航系统等先进技术,旨在无需直接人工干预的情况下运行,提供诸如提高道路安全、减少排放、动态调度和降低运营成本等显著的公共效益(Cao & Ceder, 2019; Kassens-Noor et al., 2020)。然而,自动驾驶公交车的广泛采用面临着技术不确定性、机器错误、伦理模糊性以及公众对安全、隐私和工作岗位流失的担忧等挑战(Mouratidis & Serrano, 2021; Winter et al., 2018)。在公共部门,这些担忧尤为关键,因为算法决策应用的合法性往往取决于公民对信任、公平和问责的感知。
先前关于公众对自动驾驶汽车偏好的研究主要考察了接受度的外部驱动因素。在用户层面,性别、年龄、教育水平、车辆拥有量等人口统计因素与采纳决策有关(例如,Greifenstein, 2024; Mouratidis & Serrano, 2021)。在服务层面,出行时间、成本、安全性和舒适性仍然是塑造偏好的核心因素(例如,Webb et al., 2019; Winter et al., 2018)。虽然这些方法提供了有价值的见解,但它们倾向于将技术视为一个“黑箱”,很少关注内部算法设计特征——特别是配置系统行为的选择——如何塑造公众对自动驾驶汽车的接受度。总之,以往的研究主要集中在外部采纳驱动因素上,而对算法设计作用的关注相对有限,尤其是在自动驾驶公交车等集体交通情境下。
最近的研究开始探讨算法设计特征如何影响算法治理中的公众态度和行为。例如,Horvath et al. (2023) 发现,公民对公共服务中人工智能的接受度显著受到这些系统如何呈现和证明其决策的影响。类似地,Aoki et al. (2024) 发现,人工智能系统提供的解释类型——从简单解释到详细的、特定情境的说明——直接影响对准确性、公平性和可信度的感知。此外,Grimmelkhuijsen (2023) 发现,算法透明度增强了自动化决策中感知到的可信度,强调了清晰、可理解设计的重要性。然而,尽管这些研究强调了算法设计的相关性,但它们并未阐明在自动驾驶公交车背景下,哪些特征对公众接受度最为重要。这一点至关重要,因为设计选择——例如谁控制驾驶、车辆如何平衡安全与效率、哪些伦理规则指导风险权衡,以及乘客如何与系统互动——直接体现了有争议的公共价值。然而,先前的研究很少以综合和实证的方式检验这些权衡。缺乏系统性证据不仅限制了学术界对算法治理的理解,也制约了政策制定者和交通机构设计符合公众期望的自动驾驶公交系统。为了解决这一空白,我们将在下一节重点关注四个关键的算法设计特征。
2.2. 算法设计特征与公众对自动驾驶公交车的偏好
基于引言中概述的研究空白,本研究考察了四个算法设计特征——驾驶控制模式、驾驶风格、伦理优先级和人机交互——这些特征对自动驾驶公交车的技术功能及其所涉及的公共价值权衡至关重要。选择这些特征基于三个标准:(i) 功能核心性,即每个特征都控制着自动驾驶公交车在现实条件下如何运行;(ii) 用户面对显著性,即乘客能够轻易感知和评估这些设计选择;以及 (iii) 政策可操作性,即它们代表了交通机构和开发者可以实际配置的杠杆。其他相关的算法治理属性,如透明度或数据隐私,当然也很重要,但为了保持简洁性和实验正交性,本文未予纳入;我们承认这些是未来的扩展方向。以下小节将详细阐述这些特征及其对公众接受度的预期影响。
2.2.1. 驾驶控制模式:自动化中的人类监督
驾驶控制模式是指人类参与自动驾驶公交车运行的程度,范围从完全由人工智能控制的系统到具有远程或车上人类监督的系统。这一概念借鉴了汽车工程师学会(SAE)的分类,该分类定义了从0级(完全手动)到5级(完全自主,无需人工干预)的驾驶自动化级别(SAE International, 2018)。虽然SAE分类提供了一个技术分类法,但我们关注的是不同形式的人类监督——从完全自主到远程或车上操作员干预——如何塑造公众对算法驱动的出行服务的偏好。
新兴研究表明,公众对自主系统的接受度通常取决于是否存在人类监督,尤其是在安全关键情境下(Lohaus et al., 2024; Schoettle & Sivak, 2015)。完全自主的系统——尽管具有效率和精确性——可能引发不适或不信任,因为人们将其与缺乏问责和控制联系起来(Rodel et al., 2014)。相比之下,保留人类干预的混合模式——例如车上安全操作员或远程控制站——可以通过表明在高风险情境下的监督、响应能力和人类判断的潜力来增强公众信心(Kassens-Noor et al., 2020)。这些动态在公共交通中尤为重要,因为系统可靠性、安全性和透明度与更广泛的公共价值感知(如公平、信任和问责)密切相关。因此,我们假设:
H1a. 在驾驶控制中具有更强人类监督的算法设计能提高公众对自动驾驶公交车的偏好。
2.2.2. 驾驶风格:风险与可预测性
驾驶风格是指自动驾驶公交车在行驶过程中表现出的操作行为集合,包括速度、加速、制动、跟车距离以及在交通中的机动(Ekman et al., 2021)。先前的研究已在不同维度上对驾驶风格进行了分类,如攻击型、防御型、经济型和城市型(Cordero et al., 2020; Rodel et al., 2014)。我们将驾驶风格分为三种类型:攻击型、平衡型和防御型,反映了公共交通环境中不同的风险容忍度和可预测性水平。
攻击型驾驶的典型特征是速度较高、制动较晚、超车动作更频繁。虽然这种风格在高效率或紧急情况下可能受欢迎(Lee et al., 2024),但它往往会引发对不可预测性和事故风险的担忧。相比之下,防御型驾驶强调谨慎、较低的速度和较大的跟车距离。它通常导致更平稳、更可预测的车辆行为,这可以增强乘客的舒适感和信心(Dragan et al., 2013)。平衡型驾驶代表了这两个极端之间的中点,旨在优化响应性和稳定性——这两个优先事项通常与公共交通系统相关联。这些类别反映了不同水平的风险容忍度和行为可预测性,从而塑造了乘客的乘车体验以及对安全、舒适和控制的感知。
先前的研究发现,攻击性和冒险的驾驶风格会削弱安全感并降低对自动驾驶汽车的信任(Constantinou et al., 2011)。相比之下,防御型和平衡型风格模仿了人类的谨慎,并与乘客对可预测性和控制的期望相符,尤其是在复杂的交通环境中(Dragan et al., 2013)。从公共价值的角度来看,这些驾驶风格也与共享出行服务中降低风险、可靠性和公平性的更广泛目标一致。因此,我们假设:
H1b. 与攻击型驾驶风格相比,采用防御型或平衡型驾驶风格的算法设计能提高公众对自动驾驶公交车的偏好。
2.2.3. 伦理优先级:乘客保护与伤害最小化
自动驾驶公交车的伦理优先级是指指导这些系统解决道德挑战情境的原则——特别是那些涉及不可避免的伤害的情境(Bonnefon et al., 2016)。自动驾驶汽车经常面临伦理困境,需要就保护谁或什么做出具有道德后果的决策。例如,Greene (2016) 提出了一个著名的困境:自动驾驶汽车应该优先保护乘客,还是寻求最小化总体伤害。
对此,Contissa et al. (2017) 引入了“伦理旋钮”的概念,使用户能够在利己(乘客优先)、利他(保护他人)和公正(中立)的道德模式之间进行选择。Rhim et al. (2020) 将公众的伦理直觉分类为利他主义、道义论和非决定论等类型,说明了用户伦理直觉的多样性。
然而,尽管存在这种差异,实证研究一致发现,当想象自己是乘客时,个体倾向于偏好优先考虑自身安全的车辆。例如,Bonnefon et al. (2016) 发现,当用户想象自己在车内时,利己偏好占主导地位,即使他们认可最小化总体伤害的道德逻辑。
在公共交通的背景下,这些伦理考量因服务的共享性质和乘客对车辆决策的控制有限而被放大。在算法设计中优先考虑乘客安全——尤其是在高风险或不确定情境下——可以通过表明明确的责任和降低感知风险来增强信任。因此,我们假设:
H1c. 优先考虑乘客安全而非其他伦理考量的算法设计能提高公众对自动驾驶公交车的偏好。
2.2.4. 人机交互:界面设计与乘客参与
自动驾驶公交车中的人机交互是指用户可以从自动驾驶公交车接收反馈或影响其行为的程度——范围从被动观察到实时定制路线或服务功能(Li et al., 2019)。随着自动驾驶公交车将决策权从驾驶员转移到机器,乘客与系统互动的性质成为塑造公众接受度的关键因素。
先前的研究表明,更高水平的互动可以通过直观、个性化和适应性特征提高可控性和信任感,同时增强系统响应性和用户满意度。Keller et al. (2021) 发现,使乘客能够调整设置或接收系统反馈可以增加感知到的可控性,从而减少焦虑并提高接受度。类似地,Nordhoff et al. (2020) 表明,用户青睐情境敏感的通信,包括车辆启动时的听觉提示和停止时的视觉提示,强调了直观、情境感知交互设计的价值。交互功能还通过提供更灵活和个性化的出行体验来提高用户满意度。关于跳站路线(Cao & Ceder, 2019)和同步策略(Neshela & Ceder, 2014)的研究强调,服务设计中的适应性增强了感知的响应性。在共享交通系统中,这种互动可以替代通常由人类驾驶员提供的 reassurance。因此,我们假设:
H1d. 能够实现更高水平人机交互的算法设计能提高公众对自动驾驶公交车的偏好。
2.3. 公共价值与公众对自动驾驶公交车的偏好
公共价值的概念为理解公民如何评估公共服务提供中的新兴技术提供了一个强大的理论视角。公共价值指的是不同利益相关者(包括政策制定者、公务员、服务用户、纳税人和企业家)对政府行动的目标和合法性的集体期望(Bozeman, 2019; Moore, 1995)。它既包含基于绩效的结果,也包含民主价值观,反映了公民与国家之间关系的感知质量(Meynhardt, 2009)。它不仅关注技术产出,更强调合法性和信任如何通过制度设计、服务交付和价值对齐共同产生。最近的研究已将该框架扩展到数字治理和人工智能系统领域,认为算法设计特征不仅要根据技术性能进行评估,还要根据其与集体社会期望的一致性进行评估(Schiff et al., 2022; Twizeyimana & Andersson, 2019)。
先前关于自动驾驶汽车采纳的文献一致认为,价值感知——特别是有用性(或自我效能感)、享受和感知风险——是接受度的强有力预测因素。例如,Saravanos et al. (2022) 发现,感知有用性在“最后一英里”配送自动驾驶汽车的接受度中作用最大,其次是享受,而感知风险则降低了使用意愿。Zhu et al. (2024) 进一步证明,享受和自我效能感显著区分了对部分自动驾驶和全自动驾驶汽车的偏好。总而言之,这些发现都指向一个见解:价值感知对于理解自动驾驶汽车的采纳至关重要,尽管它们强调了用户体验的不同方面。然而,这些证据在背景和构念上仍然碎片化,大多数研究侧重于私人出行中的个人层面体验,而非集体公共服务。此外,价值感知很少与算法设计特征系统地结合起来,这使得具体设计选择如何塑造共享交通系统中公共价值的多维评估仍然未知。
为了弥合这一差距,我们采用了一个多维框架,该框架整合了官僚绩效和民主合法性。基于公共价值的传统概念(例如,Cepiku & Mastrodascio, 2021; Jo & Meier, 2024; Rainey, 2009; Rose et al., 2015),我们确定了四个核心维度:有效性、效率、公平性和参与度。考虑到自动驾驶汽车技术特有的风险、不确定性和公众关切,我们明确地将安全性作为公共价值的第五个维度。与传统公共服务不同,在算法控制的出行系统背景下,安全性成为合法性和信任的核心标准(Kassens-Noor et al., 2020)。这些维度中的每一个都代表了一个独特的评估标准,公民通过它来评估算法系统是否实现了公共目的。表1概述了这些维度应用于自动驾驶公交车时的传统定义和情境化定义。
表1 自动驾驶公交车公共价值感知五个维度的定义。
人工智能融入公共服务可以增强或削弱公共价值,这取决于这些系统的设计方式以及公民的感知(Schiff et al., 2022; Twizeyimana & Andersson, 2019)。人工智能系统与公共价值之间的关系在两个方向上起作用:公民的公共价值感知塑造了他们对人工智能系统的接受度,而这些系统内部的设计选择也塑造了这些感知。一方面,公民的公共价值感知直接影响他们对自动驾驶公交车及相关人工智能服务的接受度。例如,Molinillo et al. (2024) 发现,感知安全性和行为控制显著提高了用户对自动驾驶公交系统的满意度。Cheng and Lai (2024) 发现,感知价值,包括可观察性、相对优势和感知风险,强烈预测了公民采用自动驾驶公交车的意愿。Wang et al. (2023) 表明,在基于规则的算法决策系统中,感知公平性尤为重要。这些发现表明,公共价值既塑造算法系统,也受算法系统塑造,但很少有研究明确检验公共价值感知在将算法设计与自动驾驶公交车公众偏好联系起来中的中介作用。
另一方面,人工智能系统的内部设计积极塑造了公民如何看待公共价值。例如,Kieslich et al. (2022) 证明,将问责制和公平性等伦理原则嵌入人工智能系统会增加公众的支持。Hemesath and Tepe (2024) 发现,公民和市政官员不仅根据性能或效率来评估基于人工智能的聊天机器人,而且还通过公共价值的视角,强调隐私、用户友好性和程序公平性。在交通领域,Calahorra-Candao and Martin-de Hoyos (2024) 表明,虚拟助手中拟人化特征增强了感知的友好性和安全性。这些发现表明,算法设计不仅是技术性的——它内在具有价值负载,塑造了公民如何评估人工智能驱动的公共服务的合法性。综合来看,这些见解暗示了一种中介机制:算法设计特征通过塑造公民如何评估其感知的公共价值,来影响公众对自动驾驶公交车的偏好。基于这一逻辑,我们提出以下假设:
H2a. 感知有效性中介了算法设计特征对公众自动驾驶公交车偏好的影响。
H2b. 感知效率中介了算法设计特征对公众自动驾驶公交车偏好的影响。
H2c. 感知公平性中介了算法设计特征对公众自动驾驶公交车偏好的影响。
H2d. 感知参与度中介了算法设计特征对公众自动驾驶公交车偏好的影响。
H2e. 感知安全性中介了算法设计特征对公众自动驾驶公交车偏好的影响。
本研究的理论框架如图1所示。
3. 方法
我们采用联合实验设计来检验我们的假设。联合分析向受访者展示相互竞争的方案,并要求其评估和选择,使研究人员能够隔离和测量多个属性同时产生的因果影响(Green & Rao, 1971; Hainmueller et al., 2014)。与传统实验方法相比,联合实验具有更高的外部效度,降低了多属性研究设计的成本,并减少了社会期望偏差(Zhang & Wang, 2025)。近年来,联合方法已广泛用于政策偏好、官僚决策和算法治理的研究中(例如,Wright et al., 2024; Hainmueller et al., 2014; Horvath et al., 2023)。通过对现有研究的系统回顾以及从中获得的见解,我们确定了公共价值感知和四个关键的算法设计属性可能会影响公众对自动驾驶公交车的偏好。我们对50名居民进行了试点调查,以提高情境的真实性和参与者的理解度。根据他们的反馈,我们完善了驾驶控制模式的描述,澄清了伦理优先级之间的区别,并调整了属性水平的措辞以增强清晰度和相关性。
3.1. 抽样
我们于2024年12月通过在线主题工具Prolific.ac招募了参与者(Palan & Schitter, 2018)。样本仅限于美国居民,因为该国拥有相对先进的公共交通基础设施,城市环境中自动化技术的广泛接触,以及在交通相关研究中的高参与率。为了确保数据集的统计稳健性和可靠性,并降低第二类错误的风险,我们实施了操控检查和填写时间评估。调查共发放了1400份问卷。那些未能通过注意力测试(n=142n=142n=142)或完成时间异常快或慢(n=196n=196n=196)的受访者被排除,最终获得1062份有效回复。样本在性别构成上实现了平衡,覆盖了广泛的年龄组,并在教育和收入水平上具有多样性。与美国总人口相比,它包含了相对更多的年轻成年人,以及略少的高学历个体,但仍然跨越了广泛的人口和社会经济背景。这一特征反映了通过Prolific招募的样本的典型模式(Palan & Schitter, 2018),并为分析公众偏好提供了有效基础。参与者的特征见附录A。
3.2. 联合实验设计
在本研究中,参与者被呈现以下假设情境:“假设有两家公司开发了用于公共交通的自动驾驶公交车,每种都具有独特的算法设计。这些公交车即将部署在您所在的城市。”每位参与者完成了三轮基于选择的联合任务(Wright et al., 2024)。在每一轮中,受访者评估了两个随机分配的、在特定算法设计属性上系统变化的自动驾驶公交车概况。在审查每一对之后,参与者选择他们偏好的选项。这种设计允许稳健地估计每个属性对公众偏好的因果影响。
我们引入了四种算法属性:驾驶控制模式、驾驶风格、伦理优先级和人机交互。每个属性及其水平的具体操作化定义见表2。遵循联合分析的最佳实践(Hainmueller et al., 2014),我们仅指定了必要的属性内互斥性(例如,一个概况不能同时包含“人类控制”和“全自动化”)。没有施加跨属性约束,因为在自动驾驶公交车的背景下,所有可能的组合都被认为是合理的。为了透明起见,附录H提供了约束矩阵和完整的Qualtrics随机化代码,记录了所有概况是如何在这些规则下生成的。
在每个选择任务之后,参与者被问及他们采用所选自动驾驶公交车的意愿,并评估其感知的公共价值,随后是两个注意力检查问题和一系列人口统计与行为问题。所有调查材料,包括完整的调查脚本、属性描述、选择任务、测量项目和注意力检查,均在附录B中提供。最终数据集包含6372个观测值(1062名受访者*××每轮2个选择* ××3轮)。样本的描述性统计见附录C。
3.3. 测量
3.3.1. 算法决策偏好
3.3.2. 感知公共价值
3.3.3. 控制变量
为了减少受访者疲劳并保持对主要操纵的关注,我们对背景控制变量使用了单项目测量。评估了参与者对计算机的知识和经验,使用一个项目:接触计算机技术和相关课程的经历;此外,我们测量了自我报告的自动驾驶公交知识;最后,我们评估了自动驾驶公交车的实际体验频率。
4. 结果
5. 讨论与启示
5.1. 讨论
本研究首先观察到,嵌入人类监督的算法设计——无论是通过车上还是远程操作员——都能提高公众对自动驾驶公交车的偏好。与完全AI控制的配置相比,带有车上操作员的设计产生了最强的偏好提升,其次是远程监督。这表明乘客不仅重视人类监督的存在,而且对其形式有不同的反应。虽然远程操作员能适度提高公众偏好,但车上操作员提供了可见的、即时的保障,并且他们的存在有助于进一步缓解对透明度和控制的广泛担忧,尤其是在不确定或安全关键的情境下(Kassens-Noor et al., 2020)。我们的发现与先前强调人类监督在培养对自主系统信任方面重要性的研究一致(Lohaus et al., 2024; Schoettle & Sivak, 2015)。最终,算法设计中的人类监督不仅是一种技术保障,更是一种治理工具,确认了公众对透明度、控制和问责的期望。
本研究还证实,编码了防御型或平衡型驾驶风格的算法设计能提高公众对自动驾驶公交车的偏好。相对于攻击型驾驶,防御型和平衡型风格都带来了适度的增益,且两者之间没有实质性差异。这表明乘客对谨慎风格之间的细微差别反应不大,而对明确拒绝攻击性反应更强烈,这一设计选择与自动驾驶公交车背景下对安全、稳定和控制的期望更为契合。我们的发现强化了先前的研究,即防御型驾驶风格在自主情境下被认为更安全、更可预测(Dragan et al., 2013; Ekman et al., 2021)。值得注意的是,我们的结果与 Lee et al. (2024) 的研究结果不同,后者发现,在涉及行人的紧急情况下,私人自动驾驶汽车的驾驶者偏好攻击型驾驶风格。这种差异可能反映了情境差异:在自动驾驶公交车环境中,感知的安全性和可预测性超过了更具攻击性机动所带来的感知效率。总之,这些发现表明,驾驶风格不仅仅是一个技术参数,而是一个关键的算法选择,它塑造了公众对安全、可预测性和控制的感知。
本研究进一步发现,优先考虑乘客保护而非伤害最小化或基于情境权衡的算法设计能提高公众对自动驾驶公交车的偏好。相比之下,强调伤害最小化或情境权衡的设计降低了偏好,其中伤害最小化产生了更强的负面影响。这表明乘客强烈抵制基于牺牲个人保护的功利逻辑的算法设计,而基于情境的推理虽然仍被视为不利,但相对被认为威胁较小。我们的发现与先前的研究一致,即人们在想象自己是乘客时偏好利己算法(Bonnefon et al., 2016)。虽然从功利主义角度来看,最小化伤害的策略可能在伦理上站得住脚,但在自动驾驶公交车环境中,乘客的自主性有限且必须完全依赖系统保障其安全,因此这种策略通常被认为不那么令人安心。这些结果也与“伦理旋钮”的概念相呼应,该概念强调了将算法伦理与用户期望对齐的重要性(Contissa et al., 2017; Rhim et al., 2020)。因此,自动驾驶公交车中的算法伦理应被视为系统设计的一个组成部分——它影响着公众如何评估公平性、安全性和机构责任。
本研究还揭示,能够实现更高水平人机交互的算法设计能提高公众对自动驾驶公交车的偏好。与无互动相比,高互动——允许乘客通过动态路线调整自定义上下车点——带来了显著的偏好提升。这与先前的人机交互研究一致,该研究表明,有意义的参与能增强对自主系统的感知控制和信任(Keller et al., 2021; Nordhoff et al., 2020)。相比之下,有限互动——例如调整照明或温度——仅提供表面参与,因为它不影响公交车的运行方面,因此对公众偏好没有显著影响。尽管它通过有效性和参与度等中介因素产生了微弱的间接效应,但这些效应太弱,无法产生显著的总体影响,这与“仅间接”中介的概念一致。最终,高互动与有限互动之间的对比强调了互动的质量比其单纯存在更为重要,使得交互设计成为一种具有价值负载的选择,它塑造了公众对自动驾驶交通系统中响应性、包容性和控制的感知。
本研究最终证明了公共价值感知——有效性、效率、公平性、参与度和安全性——以不同的方式中介了算法设计特征对公众偏好的影响。我们的分析揭示,这种中介效应是非对称的:一些维度发挥更一致的影响,而另一些则被特定的设计特征选择性地激活。
在五个维度中,感知安全性和有效性成为最稳健和一致的中介因素。安全性在更广泛的设计特征中被激活,包括人类监督、防御型驾驶风格和伦理权衡,始终如一地增强公众接受度。这与先前的研究一致,这些研究将安全性确定为风险敏感的自主系统中的基本关切(Cheng & Lai, 2024; Kassens-Noor et al., 2020)。相比之下,有效性被较少的设计选择触发——最显著的是车上操作员和高互动——但对偏好显示出最强的直接影响,这强化了可见的人类参与能增强系统可靠性感知的发现(Keller et al., 2021; Molinillo et al., 2024)。
感知效率扮演了一个更矛盾的角色。虽然车上操作员和有限互动适度提高了效率,但防御型和平衡型驾驶风格显著降低了效率——突显了以安全为导向的行为与运营绩效之间常见的权衡。Sagberg et al. (2015) 指出的这种张力,强调了在自动驾驶交通系统中平衡谨慎与速度的困难。
感知公平性和参与度运作得更有选择性,但仍扮演着有意义的角色。公平性最受伦理算法的影响:尽管总体上优先考虑乘客安全的设计更受欢迎,但伤害最小化和情境权衡在分配方面被认为更公平,从而增强了感知公平性(Wang et al., 2023)。相比之下,参与度对高水平的人机交互最为敏感,这表明实质性的用户参与——尤其是在路线决策或安全监控中——可以作为包容性和透明度的程序性信号(Rose et al., 2015)。
基于这些非对称模式,平行中介分析(附录G)有助于解释为什么一些路径看起来与主效应不一致。对于伦理优先级,最小化伤害和基于情境的方法提高了公平性感知,但同时降低了有效性和参与度,后者渠道占主导地位,产生了净负面效应。对于驾驶风格,与防御型和平衡型模式相关的效率损失被安全性增益或直接拒绝攻击性所抵消,产生了净正面效应。安全性虽然通常是一个稳健的积极中介因素,但也显示出情境依赖性:在高互动的情况下,其效应主要通过有效性和参与度传递,而非安全性本身。这些发现意味着,公共价值维度可以作为竞争性中介因素发挥作用,根据情境的不同,一些渠道强化而另一些渠道削弱公众偏好。
总之,这些发现证实了公共价值理论的核心论点:算法系统不仅仅根据技术功能来评判,还要根据它们在多大程度上反映了对合法性、公平性和信任的共同期望(Bozeman, 2019; Moore, 1995; Twizeyimana & Andersson, 2019)。公众偏好既受到强化性价值渠道也受到抵消性价值渠道的塑造,这一事实突显了公共价值在算法治理中的争议性本质。因此,自动驾驶交通系统的设计必须超越绩效指标,明确纳入诸如问责、包容和伦理响应等价值。
5.2. 理论启示
本研究通过将算法设计概念化为一组与治理相关且面向用户的选择,而非纯粹的技术人工制品,推进了以设计为中心的公众对自动驾驶公交车偏好的解释。先前的研究主要关注用户特征或表层服务属性(例如,Greifenstein, 2024; Mouratidis & Serrano, 2021; Webb et al., 2019; Winter et al., 2018),通常将自主系统的算法核心视为一个“黑箱”。相比之下,本研究将分析焦点转向算法系统的内部设计,系统地将驾驶控制模式、驾驶风格、伦理优先级和人机交互等算法特征整合到一个统一的框架中(Ekman et al., 2021; Keller et al., 2021; Rhim et al., 2020; SAE International, 2018)。这种焦点的转移使得能够对嵌入算法系统的治理选择如何塑造公众接受度进行更系统、更具理论基础的实证分析。
在此以设计为中心的视角基础上,我们的操作化为算法治理研究在三个关键方面贡献了独特的价值。首先,早期研究通常孤立地考察设计特征,例如安全与效率,或乘客优先与伤害最小化,而我们的联合设计同时纳入了多种权衡,使我们能够观察个体如何在复杂的决策环境中协商相互竞争的公共价值。其次,通过将分析置于公共交通领域而非私人车辆,我们突出了自动驾驶公交车特有的集体安全、程序公平性和参与度等关切。第三,我们对伦理优先级的操作化超越了传统的乘客安全与伤害最小化的二分法,引入了一种基于情境的方法,捕捉了先前联合设计很少纳入的适应性和情境性权衡。这种方法丰富了公共交通中算法治理的理论理解,并强调算法特征并非价值中立,而是公众如何解读自动驾驶交通系统中透明度、安全性、公平性、包容性、控制和机构问责等关键原则的组成部分。
我们的研究通过展示多个算法设计特征如何共同构建自动驾驶交通系统中的公共价值权衡,推进了算法治理中的公共价值理论。我们连接了算法治理中新兴研究的两个分支:一个强调公共价值感知(包括安全性、公平性和控制)如何影响公众对人工智能驱动服务的接受度(例如,Cheng & Lai, 2024; Molinillo et al., 2024; Wang et al., 2023),另一个展示算法设计如何嵌入塑造这些感知的规范性信号(例如,Calahorra-Candao & Martin-de Hoyos, 2024; Hemesath & Tepe, 2024; Kieslich et al., 2022)。在此基础上,我们区分了算法公平性(编码在算法中的分配规则)与行政公平性(由人类官员实施的程序正义),证明这两种不同形式的公平性对公众接受度的影响可能不同。我们还指出了高风险、低自主性交通情境的边界条件,在这种情境下,乘客对算法的依赖加剧了价值权衡,并在安全性、效率、公平性和参与度之间产生了非对称的中介模式。这种非对称模式挑战了公共价值维度对公民行为产生统一或直接影响的观点(例如,Calahorra-Candao & Martin-de Hoyos, 2024; Cepiku & Mastrodascio, 2021)。相反,公众偏好通过依赖于情境和非对称结构化的机制产生,其中某些价值维度(例如安全性)在脆弱性和控制有限性加剧的情境下施加更强的影响,而其他维度(例如效率和参与度)在以更高互动性和感知透明度为特征的情境中变得更加突出。
我们的研究展示了算法治理中的价值竞争机制。我们的中介分析并非假设公共价值维度是累加运作的,而是表明特定的设计特征可以激活相互抵消的价值渠道(例如,安全性与效率;公平性与有效性和参与度),产生的净偏好取决于它们的相对强度。这种机制有助于解释为什么一些算法设计增强了特定的价值感知,却未能转化为更高的整体接受度,因为一个价值维度的增益往往被其他维度的损失所抵消。通过同时嵌入多种权衡,联合设计超越了先前的单属性研究,展示了公民如何在复杂的算法环境中协商相互竞争的公共价值。在此过程中,我们推进了一个更具差异化的价值中介模型,该模型捕捉了算法治理中固有的权衡、张力和价值多元性。
5.3. 实践启示
我们的研究提供了针对不同利益相关者的建议。公共交通机构应嵌入可见的人类监督(例如,车上乘务员或远程监控),并采用偏向谨慎驾驶风格的采购标准,即使付出适度的效率成本,也要加强安全性和问责性。人工智能开发者应设计以乘客保护为核心而非抽象伤害最小化的算法,并提供丰富的交互功能(例如,实时反馈、路线定制、自然界面)以增强用户的控制感和包容感。政策制定者和监管者应在早期部署阶段强制进行透明度审计,认证交互功能,并制度化参与式设计(例如,公民小组、试点项目)。反过来,乘客不仅应作为最终用户被参与,还应作为贡献者参与共同设计和评估,确保关于公平性、效率和参与度的多元视角在系统设计中得到体现。
6. 局限性与未来研究
本研究存在若干局限性。首先,虽然使用虚拟实验环境可以控制算法设计特征的操纵并减少社会期望偏差,但它可能无法完全捕捉个体在现实世界自动驾驶交通环境中的行为。在实际环境中,物理存在、情绪反应、感知风险和情境线索等因素对偏好的影响可能与假设情境不同。因此,陈述性偏好与实际行为之间可能存在差距。未来的研究可以纳入实地实验、自然主义观察或来自运营中自动驾驶公交车的试点项目数据,以更好地评估行为效度。
其次,尽管联合设计提供了强大的因果杠杆,但重复权衡的认知需求可能导致疲劳或“满意”行为。为了减少受访者负担,我们仅使用了两个简单的基于记忆的注意力检查,并用单项目指标测量了一些控制变量。虽然这种做法是务实的且符合联合研究中的常见实践,但这些策略可能无法完全确保响应质量或测量的稳健性。未来的研究可以采用更稳健的质量控制措施——例如陷阱或反向编码项目、响应时间阈值或关键构念的多项目量表,从而增强可靠性并最小化潜在的混杂因素。
第三,我们的设计和评估框架的范围必然是有限的。在设计方面,大多数属性选择借鉴了既定的、广泛认可的二分法(例如,安全与效率;乘客保护与伤害最小化)。选择这些是为了确保与先前研究的可比性,并测试熟悉的困境在公共交通情境中如何显现。同时,这种对既定权衡的依赖不可避免地限制了我们设计的新颖性,因为它排除了更多新兴或复杂的特征,如适应性、情境化或混合算法。在价值方面,虽然本研究关注五个有理论基础的维度,但它忽略了算法治理中高度显著的关切,如透明度、问责性和数据隐私。这些维度对于当前关于算法合法性的辩论至关重要,并且可能独立地或通过与建模维度的交互作用来塑造公众感知。未来的研究应扩展价值框架和特征集,纳入透明度、问责性和隐私关切,并测试更接近现实世界系统的动态或混合算法设计。
最后,我们的发现基于美国特定的国家和社会政治背景,这可能塑造了公民对自动化、公共服务和制度信任的基线态度。由于文化价值观、历史经验、技术成熟度水平以及现行法律和监管框架都可能影响公民对算法系统的反应,因此这些结果的可推广性可能有限。例如,高信任社会中的群体可能更容易接受集中的算法监督,而更个人主义或怀疑主义背景下的群体可能更强调透明度、用户控制和程序公平性。未来的研究应采用比较或跨文化设计,考察特定情境因素如何调节自动驾驶交通系统治理中的价值感知和算法偏好。
文章来自于《Government Information Quarterly》