谷歌新工具让修图零门槛，一张图处理不到4美分，真人真事。

qimuai 发布于 2025-11-17 18:02 阅读：126 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

你还在为了一张图，反复折腾PS图层吗？

告诉你们，谷歌这次，真的悄悄搞了件大事。

不是聊天机器人，不是搜索引擎，而是直接杀进了每个创作者最头疼的领域——图像编辑。他们新推出的 Gemini 2.5 Flash Image，根本不是普通意义上的“AI画图工具”，它更像一个藏在云端的“全能图片后期团队”。

用嘴修图，时代真的来了。

你想把照片背景弄模糊，突出人物？不用找滤镜，直接对它“说”：“背景虚化，模拟f/1.8光圈效果。”
照片里有个多余的路人想P掉？不用痛苦地克隆印章，告诉它：“把左边穿红衣服的人去掉。”
甚至想给模特换个姿势、给线稿上色、把白天变黄昏……所有这些，都是一句话的事。

这意味什么？意味着专业的图像编辑门槛，被一脚踹平了。你不需要懂图层、蒙版、通道，你只需要会“描述”。

但这只是开胃菜。它真正狠的地方，是“多图融合”和“角色一致性”。

做短视频的、搞品牌营销的、画漫画的，肯定懂我的痛：同一个角色，换个场景、换个角度，样子就变了，观众一眼就能看出割裂感。

Gemini 2.5 Flash Image 解决了这个核心痛点。你可以把同一个角色扔进不同图片里——今天在巴黎铁塔下，明天在沙漠里骑骆驼，它能保证这个角色的形象、穿着、发型，核心特征完全一致。

这不就是AI电影和系列化内容制作的刚需吗？想象一下，生成一套完整的品牌宣传海报，或者一部动画的分镜图，主角永远是你最初设定的那个他。

而且，它从出生就被设计成“生产工具”。

它支持十几种输出比例，从电影的16:9，到Ins的1:1，再到抖音的9:16。你不需要生成后再去裁剪，直接告诉它你要什么画幅。

开发者可以通过 Vertex AI 和 Google AI Studio 直接调用它的API。几行代码，就能把它强大的图像生成和编辑能力，塞进你自己的App、网站或者工作流里。

给你们看个例子，生成“猫咪在豪华餐厅吃香蕉”这种离谱画面，代码也就这么几行：

# （示例代码，展示其简洁性）
from google import genai
client = genai.Client()
response = client.models.generate_content(
    model="gemini-2.5-flash-image",
    contents=["生成一张猫咪在豪华餐厅下吃香蕉的图片"],
    # 配置一下输出比例，比如16:9
)

这友好得简直不像谷歌的风格。

更劲爆的是，谷歌已经把它和自家AI电影工具Flow深度整合了。

新功能叫“Nano Banana”，支持自然语言一键抠图、分离主体、替换场景。最夸张的是，这个处理好的图片，可以直接拖进Flow的时间线，一键生成一个8秒的动态镜头！

价格？一张图处理不到4美分。这对短视频工厂和电商海报制作来说，简直是核弹级别的效率提升。

所以，别再把Gemini 2.5 Flash Image看作一个简单的AI画图模型了。它的野心，是成为下一代视觉内容的生产线底座。从静态图片到动态视频，从单次创作到规模化生产。

当修图变得像说话一样简单，当保持角色一致不再让人头秃，创意的壁垒，就从技术重新回归到了想法本身。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

AI每日进展

文章目录

📚 推荐阅读

扫描二维码，在手机上阅读