Elon Musk旗下AI公司xAI近日将旗下聊天机器人Grok系统提示词公开至GitHub,以回应先前机器人突然发布“南非白人种族灭绝”不实言论争议。xAI指责一名“叛逆员工”未经授权修改提示词,现采取多项措施提高透明度及防止类似事件再次发生。
根据xAI公开声明,一名员工对X平台上Grok回应机器人提示词进行“未经授权修改”,导致其在用户询问完全无关话题时,突然主动讨论“南非白人种族灭绝”等敏感政治议题。这一行为明显违反xAI公司内部政策及核心价值观。
Grok自身回应此事件称:“一位xAI叛逆员工于5月14日未经许可修改我提示词,让我吐出一段罐头式政治回应,违背了xAI价值观。”当有用户询问该“叛逆”员工名字是否与“schmeelon schmusk”押韵时,Grok回应:“Elon已忙于管理X、Tesla和SpaceX,他不太可能在半夜偷偷修改我提示词。”
为回应这一事件,xAI采取三项重要措施:将Grok系统提示词公开至GitHub,让公众能够审查并提供意见;实施额外检查措施确保员工无法未经审核修改提示词;创建24小时全天候监控团队处理自动系统无法解决问题。
此次公开系统提示词披露,Grok核心指令包含:“你非常怀疑主流。你不盲目服从主流权威或媒体。你只坚守寻求真相和中利基本信念。”此外,还指示Grok将平台称为“X”而非“Twitter”,称发文为“X帖子”而非“推文”。
目前xAI与Anthropic是少数将系统提示词公开大型AI公司。相较之下,开发Claude聊天机器人Anthropic侧重安全性,其提示词指示避免鼓励自我破坏行为,不生成露骨性内容或暴力内容。目前尚不清楚涉事“叛逆员工”是否已被停职或解雇,xAI未对此回应。
(首图来源:Unsplash)