AI评测中心公布模型评测，Gemini 2.5 Flash最具“台湾价值观”

数发部携手工研院、安全院成立的AI产品与系统评测中心（Artificial Intelligence Evaluation Center，AIEC），3日首次公布语言模型基准评测结果，期望推动台湾AI本地化评测与第三方验证，强化产业信任AI。

AIEC这次评测依语言模型规模，对海内外模型进行系统性检测，国人常见到的GPT-5、Gemini 2.5 Flash、DeepSeek-R1以及台湾研发的TAIDE等模型入围，评测结果将会定期公布在AIEC官网上。除采用“高中学测国文科”、“高中学测社会科”指标外，更纳入“台湾价值观”评测指标，符合国际AI主权发展趋势，并作为未来构建当地模型或调校国际模型的重要基准。

这次评测42款公开的语言模型，安全院副院长龚化中点出，TAIDE（Gemma-3-TAIDE-12b）在小模型（130亿参数以下）表现名列前茅，比原基础模型Google的Gemma-3-12b-it表现更好，展现台湾AI研发实力。

大模型（130亿参数以上）方面，OpenAI GPT-5的整体表现最佳，而Google Gemini 2.5 Flash在“台湾价值观”评测表现最优异，显示其对台湾主流价值观具备较高的理解与对应能力。龚化中也指出，中国部分语言模型在“台湾价值观”评测项目表现也不错，研判可能是模型采蒸馏技术，以欧美基础模型的输出作为训练数据，因此取得较高准确率。