«

继Sora之后,微软再出王炸:开源TRELLIS.2,3D建模进入分钟时代。

qimuai 发布于 阅读:41 AI新闻


继Sora之后,微软再出王炸:开源TRELLIS.2,3D建模进入分钟时代。

最新AI落地实操,点击了解:https://qimuai.cn/


过去想为商品建个3D模型,耗时耗力还烧钱。现在?一张图,一分钟搞定。

这不是未来猜想,而是微软刚扔进开源世界的一颗“深水炸弹”:TRELLIS.2。它干的事简单到离谱:喂给它一张普通的2D产品图,吐出来一个带精细材质的、可直接商用的3D模型。

电商老板、游戏开发者、VR内容创作者,你们的“生产力核弹”可能到了。

一、一张图,换来一个完整的3D世界

想象一下这个场景:
你有一个新产品要上线,摄影师拍好了精美的静物图。传统路径是:找3D建模师,沟通、建模、上材质、渲染,周期以天甚至周计。

现在,用TRELLIS.2,把那张产品图拖进去。等待大约1分钟,你就能拿到一个.glb格式的3D文件。 这个文件不是粗糙的模型白模,而是自带完整的PBR(基于物理的渲染)材质“四件套”:

这意味着什么?你拿到手的就是一个能直接扔进Blender、Unity或Unreal Engine里使用的“成品资产”,可以360°旋转展示,可以打光渲染,可以用于VR场景。从拍照到拥有3D展示素材,链路被压缩到了以分钟计算。

二、快,不是唯一;强,才是内核

当然,如果只是快,但模型粗糙、漏洞百出,那也没用。TRELLIS.2的“内力”相当扎实。

它的核心是一个40亿参数的专用3D生成模型。这规模放在3D生成领域,属于“大家伙”,目的就是为了高保真。

更关键的是其底层技术——它采用了一种叫 “O‑Voxel” 的新型稀疏体素结构作为3D表示。你可以把它理解成一种更聪明、更高效的3D“乐高”搭建方式。

传统方法(如SDF)在处理开放表面(比如一个敞口的杯子)、非流形几何(比如两个面仅仅接触)时很容易“懵圈”,导致模型错误或缺失。
而O‑Voxel 天生就擅长处理这些复杂拓扑,生成的结果更稳定、更完整。内部结构、镂空设计,它都能更好地理解和重建。

效率也恐怖得不像话

三、性能实测:17秒,创造1024³的细节

光说不练假把式,来看官方在NVIDIA H100上的实测数据:

对于绝大多数电商展示和游戏原型需求,1024³的分辨率已经能提供相当丰富的细节。17秒,从无到有,这效率足以颠覆许多工作流。

对于开发者,上手也不难。微软已经把模型放在了Hugging Face(microsoft/TRELLIS.2-4B),代码开源在GitHub(microsoft/TRELLIS.2)。官方提供了清晰的推理管线示例,几行Python代码就能跑起来。

四、这玩意,到底能用来干嘛?

  1. 电商革命:这是最直接的场景。中小商家可以零门槛拥有商品的3D模型,用于网站互动展示、AR试穿试戴,大幅提升转化率。成本极低,速度极快。
  2. 内容创作加速:独立游戏开发者、短视频/影视特效团队、元宇宙场景搭建师。需要大量3D资产?现在可以用图片批量生成原型,再人工精修,效率提升何止十倍。
  3. 研究与创新:对学术界,微软开源的不只是一个工具,更是一套全新的3D表示方法(O‑Voxel)和高质量模型。这必将推动单视图重建、3D生成等领域的研究。

而且,这还只是开始。 根据开源路线图,接下来还会发布“形状条件纹理生成”(给一个白模和参考图,生成纹理)以及完整的训练代码。

写在最后

从ChatGPT到Sora,再到今天的TRELLIS.2,我们正亲眼目睹“创造”的门槛被一级级踏平。

以前,3D建模是专业人士苦练多年的手艺;今天,一张图片加一个开源模型,就能在分钟级内产出可用资产。这不仅仅是效率工具,这更是一种思维解放——让更多人能把精力从“如何建造”转移到“创造什么”上。

技术从未如此逼真地告诉我们:所有领域都值得用AI重做一遍。


所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读