
腾讯正式发布混元3D世界模型1.0,作为业界首个开源可沉浸漫游、可互动、可模拟的世界生成模型,用户只需一句话或一张图片,几分钟内即可生成360度沉浸式虚拟世界。过去需要专业建模团队数周才能搭建的3D虚拟世界,现在可在短时间内完成,为游戏开发、VR、数码内容创作等场景带来革命性突破。
混元3D世界模型1.0的核心在于其创新的“语义层次化3D场景表征及生成算法”。该算法将复杂3D世界解构为不同语义层级,实现前景与背景、地面与天空的智慧分离,不仅生成视觉效果逼真的整体场景,还能输出标准化的3D Mesh资产。

模型融合了全景视觉生成与分层3D重建技术,同时支持文本和图片输入,实现了高品质、风格多样的可漫游3D场景生成。生成的Mesh文件兼容Unity、Unreal Engine、Blender等主流工具,用户可对场景内元素进行独立编辑或物理模拟,无缝衔接AIGC技术与传统CG工作流程。
对游戏开发者而言,混元3D世界模型极大简化了3D场景构建流程。开发者只需输入简单指令,模型即可快速生成包含建筑、地形、植被的完整3D场景。输出的Mesh文件可用于游戏原型搭建或关卡设计,还能灵活调整前景物体、更换天空背景,满足个性化创作需求。

无建模经验的普通用户也可通过混元3D创作引擎,仅需一句话或一张图即可快速生成360度沉浸式视觉空间。生成的场景可无缝导入Vision Pro等虚拟头显,带来沉浸式体验。
与全球领先的开源模型相比,混元3D世界模型1.0在文生世界、图生世界的美学品质和指令遵循能力等关键维度均全面超越当前SOTA的开源模型。该模型的发布标志着腾讯从秒级生成单个3D资产,到一键打造可漫游的3D世界,正逐步构建完善的3D内容生成生态。

目前,腾讯混元大模型已实现图像、视频、3D、文本等在内的全模态开源,图像、视频衍生模型数量分别达到1,400个和1,600个,混元3D系列模型社交媒体下载量超过230万,已成为全球最受欢迎的3D开源模型。
来源:腾讯











