在未来,您只需要告诉自动驾驶汽车:“我很急”,它就会自动规划出能最快速抵达目的地的路线及行驶速度。您将像是拥有一名经验丰富又善体人意的专属司机,一定十分满意又很放心。这样的场景绝非仅止于想象,随着科技发展已逐步迈向现实。
最近普渡大学(Purdue University)的工程师,正尝试研发运用ChatGPT或其他聊天机器人协助自动驾驶汽车能“听懂人话”。他们于9月底在第27届IEEE国际智能交通系统会议上发布这部分的进展。这可能是首批实测自驾驶车通过大型语言模型,能对乘客口语指令做出适当回应的实验之一。
领导这项研究的普渡大学土木工程系教授王子然(Ziran Wang)博士认为,如果有一天车辆要实现“完全自动驾驶”,它们需要彻底理解乘客谈话中的所有消息,即使乘客并非直接下指令而是家接地表达自己的感受。例如,当您说出您很赶时间时,出租车司机会知道您需要什么,而无需指挥司机应采取的确切路线、行驶速度等细节。
大型语言模型更自然地理解“交谈”内容实验之初,研究团队使用各种“提示语”来训练ChatGPT,包括较直接的命令(例如,“请开快点”)及更间接的命令(例如“我现在有点晕车”)。当ChatGPT学会如何回应这些命令后,研究人员为其提供了需要遵循的参数,包括要求其考虑交通规则、路况、天候以及车用传感器侦测到的资讯,例如摄影镜头、灯光侦测和测距结果等数据。
他们随后将此大型语言模型通过云计算提供给一辆实验车辆。研究人员还评估了其他多款聊天机器人,例如Google的Gemini和Meta的Llama AI助理等。目前为止,ChatGPT在汽车安全和省时等方面表现最好。
虽然如今的自动驾驶汽车已具备相当的语音功能,但它们需要较清晰、明确的指令。相较之下,大型语言模型应能以更人性化的方式与乘客互动并做出回应,因为它们经过训练而能从大量文本数据中理解语境并随着演进不断学习。
本次研究中,研究团队并非使用大型语言模型来驱动自动驾驶汽车,而是利用它来辅助自动驾驶汽车。他们发现通过集成这些模型,自动驾驶汽车能更适当地理解乘客需求,因而规划出精准满足乘客所需的行程。王子然教授解释:“传统的车用语音系统有一个用户界面,你必须启动界面才能传达你的消息,这类音频识别系统要求非常明确的指令,车辆才能正确理解。而大型语言模型的优势在于它们能更自然地理解“交谈”内容,任何其他现有系统都无法做到这点。”
(首图来源:shutterstock)