Google推出图片生成模型VideoPoet，五大功能产生直式短影音

近来一波波图片生成模型出现，无论是贴近提示要求或在图片处理细节上，许多情况下展现出令人惊艳的高品质。Google也不甘示弱，日前发布自主开发的大型语言模型VideoPoet。

为了探索语言模型在图片生成中的应用，Google引进全新大型语言模型VideoPoet，能够执行包括文本转成视频、图片转成视频、视频风格转换、视频修复、视频生成音频等五大功能，而且默认产生直式短影音。

比方说，文本提示输入“两只熊猫打扑克牌”，VideoPoet产生两只熊猫坐在桌边打扑克牌的短片。图片转成视频方面，像是上传一张油画图片，画中一艘驶向大海的船遭遇雷电交加、波涛汹涌，借由VideoPoet可以转变成动图形态。VideoPoet也能为视频产生音频，例如先以模型产生2秒短片，并尝试在没有任何文本提示下配上音频，于是从单一模型就能产生视频和音频。