AI击败全球99%程序员后,竟开始给物理论文挑刺,真人真事。

最新AI落地实操,点击了解:https://qimuai.cn/
当你觉得AI还在抄作业时,它已经悄悄坐上了奥赛金牌的领奖台,并且开始给顶级学者的论文“挑刺”了。
这不是科幻剧情。
这是Google刚刚扔出的“王炸”——Gemini 3 Deep Think。
过去,我们说一个模型聪明,是看它聊天是否风趣,画画是否精美。
而这一次,Google直接把它的“大脑”送进了全球最残酷的算法竞技场,和最顶尖的人类智力同台PK。
结果令人后背发凉。
在著名的程序员“修罗场”Codeforces上,它的Elo评分高达3455分。
这是个什么概念?
在这个平台上,全球范围内,只有7个活生生的人类选手,有把握击败它。
它已经不止是“像”一个天才程序员,它自己就是冠军级别的存在。
这背后是一套叫做“并列思考”的核心技术。它不再是一条路走到黑,而是在解决问题时,能同时探索多条推理路径,像一支顶尖的智囊团在内部辩论、推演,最终选出最优解。
所以,它的突破远不止写代码。
在号称“人类最后考试”的HLE基准测试中,它无工具辅助拿下了48.4%的分数,刷新记录。
在更全面的ARC-AGI-2测试中,它获得了84.6%的高分,并获得官方认证。
更夸张的是,在模拟的国际数学、物理、化学奥赛笔试中,它的表现全部达到金牌水准。
数字是冰冷的,但它的“实战”却热得发烫。
罗格斯大学的数学家Lisa Carbone用它来审阅一篇高能物理领域的复杂论文。这个连人类专家团队都可能疏忽的领域,Gemini 3 Deep Think竟然精准地指出了其中一个关键的逻辑漏洞。
在工程领域,它甚至能看懂科学家信手涂鸦的手绘草图,直接生成可用于3D打印的精确模型文件,将整个流程效率提升十倍。
它不再只是一个回答问题的工具,而是一个能进行深度科学推理和创造的“协作者”。
这个强大模式,来自Google DeepMind团队(团队中包括了前Anthropic的顶尖研究员姚顺宇),已于2月12日正式发布。目前,它是Gemini 3系列模型的专属能力,面向Google AI Ultra订阅用户开放,同时也通过API提供给研究人员进行探索。
从解题、审稿到创造,AI的“思考”边界正在以我们肉眼可见的速度崩塌。
它提醒我们:AI竞争的下一程,早已不是谁能生成更美的图片,而是谁拥有更接近本质的、深邃的“思考力”。当AI开始在逻辑、推理和科学发现的深层领域,达到乃至超越人类专家的水准,我们每个人与之协作的方式,都将被彻底重塑。
所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。
文章标题:AI击败全球99%程序员后,竟开始给物理论文挑刺,真人真事。
文章链接:https://www.qimuai.cn/?post=3307
本站文章均为原创,未经授权请勿用于任何商业用途