各种生成式AI的消息大幅占据科技新闻篇幅,不论公司运营发展近况,或是所推出的AI模型与服务,可说是瞬息万变,令人目不暇给,所有人都在急忙追赶AI快速发展的脚步,各种AI名词层出不穷,在来不及解读其意义、具体运行原理的状况之下,过没多久又有更多新的突破出现。
目前来看,单是百花齐放的生成式AI模型,或CoPilot这类与特定软件、云计算服务结合的AI小助手,还算是众人能够粗浅理解的程度,但谈到高端商业应用,可能就令人感到困惑,大家不知该从何处着手,对于厂商提供的解决方案,也充满疑问。
比如说,有厂商推出AI Foundry服务,他们通过集合多种AI基础模型的全方位解决方案,想提供企业使用,协助他们自行创建生成式AI模型。有厂商鼓吹企业应兴建AI Factory,他们希望将传统数据中心“提升”,成为具有加速运算能力的数据中心,并且兴建新形态数据中心:AI Factory,这类AI工厂生产出来的产品就是AI。
Factory和Foundry应该是不同层次的业务形态,用这问ChatGPT,它表示,Foundry专注提供生产服务、可帮其他公司代工,并不处理产品的设计与销售,相对较开放;Factory偏向自有产品的生产和制造,属于内用、封闭、公司自营。但这类用语还是很抽象,一般人们不易了解具体内涵,以及对于各行各业的意义。或许对于高科技制造业而言,可能更能了解AI厂商提出这些名词的用意吧。
另一个让我很疑惑的用词,是AI Agent(AI代理)。过去我们多多少少都接触过对话机器人(chatbot),也大致知道机器人流程自动化(RPA),而所谓的AI代理,依照坊间的定义,似乎是某种更具有自主能力的智慧应用程序,也有企业发展多重AI代理系统(Multi-Agent AI System),顾名思义,是集合、包含多个AI代理一起工作、执行任务。
而随着AI代理相关消息越来越多,有厂商将这类应用称为代理型AI(Agentic AI),我们也看到有人介绍AI代理工作流程(AI Agentic Workflow),并将这类处理流程命名为Agentic AI Workflow、Agentic Workflows in AI,相关词汇名称似乎尚未完全统一。
若我们将时间提前至去年至今年上半,单是生成式AI(Generative AI)的英文简称就有好几种,像是GenAI最常用,GAI也有人用,而另一个更早被提出的“通用人工智能(Artificial General Intelligence)”也重新受到各界重视,全名可缩写为AGI,由于GAI与AGI乍看只差在字母排列,可能也让许多人们感到困惑,不了解为何AI有这么多种称呼,难以确定它们的是相互对立或部分重叠。
若回归最终用户的角度而言,使用方式与概念最容易理解与接受的,莫过于“Copilot”这类AI辅助操作或互动模式,一般人可通过许多渠道进行体验。
举例来说,通过浏览器连到生成式AI服务网站,像是https://chatgpt.com,或https://gemini.google.com,向AI进行提问与对话;连到网络搜索引擎,像是Bing、Google,均可通过页面上的按钮连至Microsoft Copilot,或是个人AI助理Gemini,进行对话。
除此之外,还可以通过浏览器插件程序集成使用生成式AI,例如,我会用DeepL进行网页文章内容的即时翻译,只需选取需要翻译的文章段落,通过鼠标右键打开菜单选择Translate with DeepL,就能马增至到AI翻译的结果,有时也会对照Chrome浏览器的整页翻译功能,看看何种译法较适合该文脉络。
在整理采访内容时,生成式AI除了帮忙将录音频转成逐字稿,当我细部查看采访对象的谈话内容时,遇到似是而非、不确定讲者所言专业词汇的正确名称时,也能通过在生成式AI输入一些前后文的内容,请它们推断或猜测可能的名称,能在既有搜索引擎输入关键字逐笔查询结果的做法之外,提供更聚焦在问题的解答选择。
关于AI的使用模式与信任程度,每个人可能都需要时间摸索,而关于最终用户体验的探讨与描述,其实也是AI能否扩大普及率的关键,主导权并非只是掌握AI模型的科技公司,或是提供AI服务的企业与机构,虽然用户目前只能被动参与,但相关的讨论不应停留在AI专家的层级,希望未来我们能找到与创造更容易让人理解的AI描述方式,“词穷”问题不断发生,恐增沟通困难度。