«

腾讯开源文生3D动作AI,网友:这波操作,游戏公司要慌了!

qimuai 发布于 阅读:20 AI新闻


腾讯开源文生3D动作AI,网友:这波操作,游戏公司要慌了!

最新AI落地实操,点击了解:https://qimuai.cn/


腾讯炸场!10亿参数文生3D动作神器开源,游戏NPC一键“活”了!

还在为游戏里NPC僵硬的动作发愁?还在为短视频和动画制作一个流畅的转身动作反复调试、烧预算?

今天,你可以跟这些麻烦事暂时说再见了。

就在几天前,腾讯混元团队在2025年的尾巴,扔出了一颗重磅技术“炸弹”——他们开源了HY-Motion 1.0。简单说,这是一个你用文字描述,就能直接生成高质量3D人体动作的AI模型。

不是噱头,是真能用的东西。而且,它免费了。

为什么说它“炸场”?

因为“文生3D动作”这个赛道,一直是个高门槛的技术活。你想,让AI理解“一个角色疲惫地瘫坐在沙发上”这句话,并转换成一套符合物理规律、关节运动自然的三维数据,难如登天。

以前,要么是专业动画师手K,要么用动捕设备录,成本高、周期长。现在,腾讯把一套经过工业化级训练的方案,直接开源了出来。

这意味着什么?意味着个人创作者、中小游戏团队、影视预研部门,手里突然多了一把“屠龙刀”。高质量动画动作的生成门槛,被瞬间踏平了一大截。

这玩意儿到底有多强?

第一,内核够硬。它用的不是普通架构,而是当前最热的Diffusion Transformer (DiT) 配合流匹配机制。你可以把它理解为一台专门为“动作生成”设计的顶级引擎,理解文本指令的能力极强。

第二,练得够狠。为了让它生成的动作又自然又合理,腾讯团队用了“全阶段训练”策略:先拿3000个小时的多语言动作数据做“预科”教育,再用400个小时的精品数据做“精英”微调。这还没完,最后还加上了RLHF——也就是用人类反馈来优化,确保AI生成的动作不光像,还得符合物理常识,不出现“骨骼清奇”的诡异姿势。

这套组合拳下来,HY-Motion能覆盖6大类超过200种动作,从基础的走跑跳到体育运动、健身动作,再到社交手势、日常行为,甚至游戏里的特殊技能,它都有涉猎。

第三,效果能打。官方在超过2000条文本提示上做了测试,它的指令遵循准确率达到了78.6%,生成动作的平均质量评分是3.43分(满分5分)。这个成绩,已经超过了MoMask、DART等一众开源对手。实测中,“跑步”、“坐到椅子上”甚至“子弹时间下腰”这类指令,它都能交出流畅自然的答卷。

当然,它也不是万能的。比如,职业运动员那种极限动作(像高难度跳台滑雪),还原度还有提升空间;涉及到人和物体精准交互的动作,比如“准确地把杯子放在桌沿”,目前还难以完美实现。但这些都是业界公认的难点,不妨碍它已经是个“超级生产力工具”的事实。

开源,才是最狠的一步棋

腾讯这次,把主模型 HY-Motion 1.0(10亿参数) 和轻量版 HY-Motion 1.0-Lite 的代码、权重全部开放了。官网能体验,GitHub上就能直接克隆仓库。

输出格式直接是行业通用的SMPL-H骨骼格式,无缝对接Blender、Unity、虚幻引擎(UE)这些你熟悉的三维软件。你不用再为格式转换掉头发。

它的想象力瞬间被打开:游戏里,给海量NPC批量生成个性动作,不再是梦;影视前期,分镜动画和预演的速度可以提升十倍;VR内容创作,一个人也能快速搭建生动的虚拟世界。

这已经不是“未来已来”的空话。而是工具已经摆在桌上,就看谁先拿起它,重塑自己的工作流。


所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读