硅谷对AI代理人的乐观情绪高涨,这些技术被视为能够解决问题、执行任务并随着环境学习而变得更智能的虚拟助理。企业已经开始利用这些代理人来预订航班、收集数据、总结报告甚至做出决策。然而,这些代理人并不完美,错误和幻觉的问题依然普遍,且随着使用的增加而恶化。

随着企业开始使用代理人来自动化复杂的多步骤任务,新的工具也随之出现。例如,Regie AI的“自动驾驶销售代理人”能自动寻找潜在客户、撰写个性化电子邮件并跟进买家;Cognition AI则开发了一个名为Devin的代理人,专门执行复杂的工程任务;而四大专业服务公司PwC则推出了“代理操作系统”,以便于代理人之间的沟通和任务执行。

不过,代理人在完成任务的每一步中,错误率的增加将直接影响最终结果。有些代理过程的步骤数量可达100步以上,根据Patronus AI的研究,这些错误可能导致显著的风险和收入损失。该公司在其blog中指出:“任何一步的错误都可能使整个任务偏离轨道。涉及的步骤越多,最终出错的机率就越高。”

此外,ScaleAI的增长负责人Quintin Au提到,实际操作中的错误率往往更高,每当AI执行一个动作时,大约有20%的错误机率。如果一个代理需要完成5个动作,则每一步都正确的机会仅为32%。DeepMind的首席执行官Demis Hassabis在最近的活动中表示,错误率应被视为“复利”,而当代理需要经历5,000个步骤时,正确的概率可能是随机的。

因此,AI代理人失败的可能性使企业面临更大的客户流失风险。好消息是,通过设置过滤器、规则和工具等防护措施,可以减少错误率。这些小改进能够显著降低错误的概率。Patronus AI的首席执行官Anand Kannappan指出,防护措施可以是简单的附加检查,以确保代理人在操作过程中不会失败。

总之,随着AI技术的发展,对其能力的期望和实际表现之间的差距越来越明显。企业在使用AI代理时,应该谨慎评估其风险与收益,并采取适当的措施来降低错误率,以便更有效地利用这项技术。

(首图来源:pixabay)