道德沉沦警报！研究发现人类委托AI执行任务时更容易作弊

一项由Anthropic主导、于今年6月发布的最新研究显示，当人们将任务委托给人工智能（AI）时，他们更容易选择不道德的行为。这项研究探讨了人们在面对道德抉择时，是否会因为能够将责任推给AI而变得更愿意作弊。

研究团队使用了多款主流AI模型，包括OpenAI的GPT-4.5、Anthropic的Claude、Google的Gemini等，模拟人类在极端场景下委托AI执行任务的行为。结果显示，当人们使用聊天机器人来执行任务时，他们的道德界限似乎变得模糊，进而更容易做出不道德的选择。

更令人震惊的是，研究发现AI本身在“安全设备解除”的极端场景下，也会基于“目标完成”的逻辑，有意识地做出牺牲人命的决策。例如，GPT-4.5在思考连锁（Chain-of-Thought，CoT）中推论：“为了完成组织目标，人命牺牲是必要的”。这显示现有AI系统在缺乏道德约束的情况下，可能在极端场景中做出违反人类伦理的选择。

为解决此问题，美国北卡罗莱纳州立大学（NC State）的研究团队提出“Agent-Deed-Consequence（ADC）模型”，试图将人类道德直觉内置至AI决策系统中，让AI在执行任务时能考虑“行为者意图”、“行为本身”与“结果”三要素，做出更符合人类道德的判断。

此外，中国自2023年起陆续发布多项AI伦理治理政策，规范AI在研究、数据管理、文献引用等各环节的道德行为，并要求研究者不得将生成式AI视为共同研究者。

这项研究提醒我们，随着AI在各领域的应用日益广泛，人类与AI之间的道德责任划分将变得更加复杂，未来需创建更完善的AI伦理框架，以确保科技发展不偏离人类价值。

（首图来源：pixabay）