欧盟也积极推动人工智能发展,强化语言模型技术透明度与多语言研究,由欧洲多家顶尖研究机构及企业组成的OpenEuroLLM项目,在欧盟Digital Europe Programme资助下正式展开。该项目目标是打造新一代开源大型语言模型,期望借此巩固欧洲在人工智能领域的竞争力,同时维持法遵与技术透明度,回应欧盟在人工智能技术自主与数字主权上的需求。
OpenEuroLLM由捷克查理大学(Charles University)与芬兰AMD Silo AI等单位共同带领,包含多家欧洲高等院校、人工智能研究机构及EuroHPC超级计算机中心。项目内容特别强调两个方向,其一是对外完全透明,也就是从数据收集、模型训练到评估指标都遵循欧盟隐私与安全标准,并尽可能向社交媒体开放;其二是聚焦多语言能力,除了欧盟官方语言,也涵盖欧洲内部其他常被忽略但同样重要的局部语种,并考虑在经贸或文化层面具备潜力的语言,期望降低当地产业或公共单位导入人工智能的门槛。
在开源方向上,OpenEuroLLM提出真正开放的目标,强调会公开训练与测试程序代码、数据处理过程、评估方法及中间成果,并同时号召社交媒体参与。这种合作模式可扩大开发者基础,也替未来人工智能应用提供更透明与法遵环境。由于欧盟正推动人工智能法案(AI Act)等法规,项目也强调将遵守法规要求,设置安全评估、用户隐私保护及其他配套措施,在技术与监管之间取得平衡。
欧洲多个国家已具备超级运算、自然语言处理与深度学习的丰富研究能力,像是德国的Fraunhofer研究机构、意大利Cineca高性能计算中心、西班牙巴塞罗那超级运算中心等,都已在各自领域具有相当基础。这次欧洲多方共同投入OpenEuroLLM项目,试图在硬件资源与技术上合作,以更大规模的资源来训练语言模型。同时,欧盟Digital Europe Programme也承诺投入资金与政策支持,包括数据开放、算力强化、模型安全检测等领域。
依照OpenEuroLLM的计划,未来这些基础模型都能通过开源渠道被微调或扩展,适用于专业领域如医疗文本处理、法律咨询等,同时也会保留对隐私与数据保护的设计,以符合欧盟强调的隐私原则。开发者与企业得以在不违反欧盟法规的前提下,取得高品质的多语言模型基础,并进一步定制化出符合自身需求的人工智能解决方案。