Nvidia更新ChatRTX聊天机器人以支持语音提示及更多模型

Nvidia本周更新其基于生成式预训练模型（Generative Pre-trained Transformer，GPT）与Nvidia RTX系列GPU的ChatRTX聊天机器人，它可支持更多的开源模型，具备语音查询能力，并可识别图片。

ChatRTX为一由Nvidia所开发的GPT聊天机器人示范程序，在选择了大型语言模型之后（LLM），用户即可将它连至自己的文件、笔记、图片或其他数据，借由检索增强生成（Retrieval-Augmented Generation，RAG）技术、TensorRT-LLM软件与RTX加速，即可向该定制化的聊天机器人提出问题，并得到相关的解答。由于它是直接在Windows PC或工作站上执行，可确保隐私及安全。

Nvidia是在今年2月发布ChatRTX，其系统需求包括Nvidia GeForce RTX 30/40系列GPU、Nvidia RTX Ampere或Ada Generation GPU，执行Windows 11操作系统，以及必须具备16GB或更多内存。

用户可通过ChatRTX将本地端的文件当作数据集，首个版本支持.txt、.pdf、.doc/.docx和.xml等文件格式，连至诸如Mistral或Llama 2的开源大型语言模型，以利用ChatRTX来查询笔记及文件，而且是在用户的设备上执行。

新版增加了对Gemma与ChatGLM3模型的支持，也支持语言及图像对比预训练（CLIP）神经网络，并通过对Whisper的支持提供了语音查询能力，额外支持jpeg、gif及png文件格式。因此，现在用户除了可以文本及语音与ChatRTX对话之外，还能搜索照片与图片。

ChatRTX开放所有用户免费下载。