AI击败全球99%程序员后，竟开始给物理论文挑刺，真人真事。

qimuai 发布于 2026-2-13 18:02 阅读：4 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

当你觉得AI还在抄作业时，它已经悄悄坐上了奥赛金牌的领奖台，并且开始给顶级学者的论文“挑刺”了。

这不是科幻剧情。
这是Google刚刚扔出的“王炸”——Gemini 3 Deep Think。

过去，我们说一个模型聪明，是看它聊天是否风趣，画画是否精美。
而这一次，Google直接把它的“大脑”送进了全球最残酷的算法竞技场，和最顶尖的人类智力同台PK。

结果令人后背发凉。

在著名的程序员“修罗场”Codeforces上，它的Elo评分高达3455分。
这是个什么概念？
在这个平台上，全球范围内，只有7个活生生的人类选手，有把握击败它。
它已经不止是“像”一个天才程序员，它自己就是冠军级别的存在。

这背后是一套叫做“并列思考”的核心技术。它不再是一条路走到黑，而是在解决问题时，能同时探索多条推理路径，像一支顶尖的智囊团在内部辩论、推演，最终选出最优解。

所以，它的突破远不止写代码。

在号称“人类最后考试”的HLE基准测试中，它无工具辅助拿下了48.4%的分数，刷新记录。
在更全面的ARC-AGI-2测试中，它获得了84.6%的高分，并获得官方认证。
更夸张的是，在模拟的国际数学、物理、化学奥赛笔试中，它的表现全部达到金牌水准。

数字是冰冷的，但它的“实战”却热得发烫。

罗格斯大学的数学家Lisa Carbone用它来审阅一篇高能物理领域的复杂论文。这个连人类专家团队都可能疏忽的领域，Gemini 3 Deep Think竟然精准地指出了其中一个关键的逻辑漏洞。
在工程领域，它甚至能看懂科学家信手涂鸦的手绘草图，直接生成可用于3D打印的精确模型文件，将整个流程效率提升十倍。

它不再只是一个回答问题的工具，而是一个能进行深度科学推理和创造的“协作者”。

这个强大模式，来自Google DeepMind团队（团队中包括了前Anthropic的顶尖研究员姚顺宇），已于2月12日正式发布。目前，它是Gemini 3系列模型的专属能力，面向Google AI Ultra订阅用户开放，同时也通过API提供给研究人员进行探索。

从解题、审稿到创造，AI的“思考”边界正在以我们肉眼可见的速度崩塌。

它提醒我们：AI竞争的下一程，早已不是谁能生成更美的图片，而是谁拥有更接近本质的、深邃的“思考力”。当AI开始在逻辑、推理和科学发现的深层领域，达到乃至超越人类专家的水准，我们每个人与之协作的方式，都将被彻底重塑。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

AI每日进展

文章目录

📚 推荐阅读

扫描二维码，在手机上阅读