Apple最近于Hugging Face上发布了OpenELM生成式人工智能模型,据悉这个AI模型有4个不同参数的版本,可在手机上运行。

OpenELM全称为Open-source Efficient Language Models,意思是开源高效语言模型。OpenELM设有2.7亿、4.5亿、11亿及30亿共4个不同参数版本,比一般高性能模型而言要少。

《The Register》报道指,OpenELM使用GitHub RedPajama数据库、Wikipedia、StackExchange、ArXiv 、Reddit以及大量书籍进行预训练。Apple于Hugging Face公开的数据显示,其训练数据规模高达1.8兆tokens。据外媒报道,Apple声称OpenELM是开源,其理由是因为Apple推出了模型,同一时间也分享了其训练方式。Apple也将OpenELM的源码上传至GitHub数据库。

据《The Register》报道,Apple推出的OpenELM并没有使用公认开源标准,但也没有严格禁止用户用于商业用途,不过就表示会保留向任何基于OpenELM的衍生品提出专利索赔的权利。

图片来源:Hugging Face

由于OpenELM参数较少,而且运用了分层缩放技术提高准确度,模型也可在普通手提电脑,甚至是电话上运行。据《The Register》报道,OpenELM可以将模型转换为MLX程序代码,让OpenELM在Apple计算机上运行更加流畅。

图片来源:YouTube

数据源:The Register、East money