
Google公开预览BigQuery托管人工智能函数,将大型语言模型能力封装成AI.IF、AI.CLASSIFY与AI.SCORE三个函数,可直接嵌入SQL查询,让熟悉SQL的数据团队不必额外研究提示词与语言模型,就能在查询中处理语义问题。
SQL是结构化数据分析的主力工具,但面对评论文本、新闻内文或图片等非结构化数据,多半得先把数据搬到其他系统,再串联语言模型API与设计提示词,而现在Google把常见的语义筛选、分类与评分需求集成成BigQuery内置函数,让写查询的人在既有环境中就能调用大型语言模型。
在这组函数中,AI.IF负责语义判断,用户可用自然语言描述条件,即使文本并未明确提到关键字,BigQuery也能过滤出与特定主题相关的新闻或记录。AI.CLASSIFY用于分类,先提供一组标签,系统便会将文本或图片自动归类,方便后续统计分析,AI.SCORE则替每一列数据评分,依自然语言描述的标准产生分数,可用来排序影评或其他文本内容。
Google在背后针对这些人工智能函数加入提示词与查询计划的优化,例如BigQuery会先执行一般WHERE条件,再调用大型语言模型,以减少调用次数与执行时间,同时由系统代为选择模型端点与参数设置,以兼顾成本与结果稳定度。
这组托管人工智能函数是既有AI.GENERATE等通用Gemini推论函数的补充。常见的语义筛选、分类或评分场景,官方建议优先使用AI.IF、AI.CLASSIFY与AI.SCORE,要是需要更细致控制提示词或指定模型,则改用AI.GENERATE家族。Google并预告会把更多运算搬回BigQuery端,在部分场景下带来大幅性能改善,这些函数也已集成到BigQuery DataFrames并提供Python范例。










