Nvidia本周更新其基于生成式预训练模型(Generative Pre-trained Transformer,GPT)与Nvidia RTX系列GPU的ChatRTX聊天机器人,它可支持更多的开源模型,具备语音查询能力,并可识别图片。

ChatRTX为一由Nvidia所开发的GPT聊天机器人示范程序,在选择了大型语言模型之后(LLM),用户即可将它连至自己的文件、笔记、图片或其他数据,借由检索增强生成(Retrieval-Augmented Generation,RAG)技术、TensorRT-LLM软件与RTX加速,即可向该定制化的聊天机器人提出问题,并得到相关的解答。由于它是直接在Windows PC或工作站上执行,可确保隐私及安全。

Nvidia是在今年2月发布ChatRTX,其系统需求包括Nvidia GeForce RTX 30/40系列GPU、Nvidia RTX Ampere或Ada Generation GPU,执行Windows 11操作系统,以及必须具备16GB或更多内存。

用户可通过ChatRTX将本地端的文件当作数据集,首个版本支持.txt、.pdf、.doc/.docx和.xml等文件格式,连至诸如Mistral或Llama 2的开源大型语言模型,以利用ChatRTX来查询笔记及文件,而且是在用户的设备上执行。

新版增加了对Gemma与ChatGLM3模型的支持,也支持语言及图像对比预训练(CLIP)神经网络,并通过对Whisper的支持提供了语音查询能力,额外支持jpeg、gif及png文件格式。因此,现在用户除了可以文本及语音与ChatRTX对话之外,还能搜索照片与图片。

ChatRTX开放所有用户免费下载。