继Sora之后，微软再出王炸：开源TRELLIS.2，3D建模进入分钟时代。

qimuai 发布于 2025-12-18 18:03 阅读：89 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

过去想为商品建个3D模型，耗时耗力还烧钱。现在？一张图，一分钟搞定。

这不是未来猜想，而是微软刚扔进开源世界的一颗“深水炸弹”：TRELLIS.2。它干的事简单到离谱：喂给它一张普通的2D产品图，吐出来一个带精细材质的、可直接商用的3D模型。

电商老板、游戏开发者、VR内容创作者，你们的“生产力核弹”可能到了。

想象一下这个场景：
你有一个新产品要上线，摄影师拍好了精美的静物图。传统路径是：找3D建模师，沟通、建模、上材质、渲染，周期以天甚至周计。

现在，用TRELLIS.2，把那张产品图拖进去。等待大约1分钟，你就能拿到一个.glb格式的3D文件。 这个文件不是粗糙的模型白模，而是自带完整的PBR（基于物理的渲染）材质“四件套”：

这意味着什么？你拿到手的就是一个能直接扔进Blender、Unity或Unreal Engine里使用的“成品资产”，可以360°旋转展示，可以打光渲染，可以用于VR场景。从拍照到拥有3D展示素材，链路被压缩到了以分钟计算。

当然，如果只是快，但模型粗糙、漏洞百出，那也没用。TRELLIS.2的“内力”相当扎实。

它的核心是一个40亿参数的专用3D生成模型。这规模放在3D生成领域，属于“大家伙”，目的就是为了高保真。

更关键的是其底层技术——它采用了一种叫 “O‑Voxel” 的新型稀疏体素结构作为3D表示。你可以把它理解成一种更聪明、更高效的3D“乐高”搭建方式。

传统方法（如SDF）在处理开放表面（比如一个敞口的杯子）、非流形几何（比如两个面仅仅接触）时很容易“懵圈”，导致模型错误或缺失。
而O‑Voxel 天生就擅长处理这些复杂拓扑，生成的结果更稳定、更完整。内部结构、镂空设计，它都能更好地理解和重建。

效率也恐怖得不像话：

光说不练假把式，来看官方在NVIDIA H100上的实测数据：

对于绝大多数电商展示和游戏原型需求，1024³的分辨率已经能提供相当丰富的细节。17秒，从无到有，这效率足以颠覆许多工作流。

对于开发者，上手也不难。微软已经把模型放在了Hugging Face（microsoft/TRELLIS.2-4B），代码开源在GitHub（microsoft/TRELLIS.2）。官方提供了清晰的推理管线示例，几行Python代码就能跑起来。

而且，这还只是开始。 根据开源路线图，接下来还会发布“形状条件纹理生成”（给一个白模和参考图，生成纹理）以及完整的训练代码。

从ChatGPT到Sora，再到今天的TRELLIS.2，我们正亲眼目睹“创造”的门槛被一级级踏平。

以前，3D建模是专业人士苦练多年的手艺；今天，一张图片加一个开源模型，就能在分钟级内产出可用资产。这不仅仅是效率工具，这更是一种思维解放——让更多人能把精力从“如何建造”转移到“创造什么”上。

技术从未如此逼真地告诉我们：所有领域都值得用AI重做一遍。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

文章目录

扫描二维码，在手机上阅读