Gemini 截图疑似泄露,真正危险的不是模型,而是 Google 这一步棋

AI PM 编辑部 · 2023年10月24日 · 7 阅读 · AI/人工智能

正在加载视频...

视频章节

一组疑似泄露的 Google Gemini 截图,暴露的可能不只是一个新模型,而是 Google 正在悄悄改变开发者战争的打法:多模态只是表面,真正的筹码是“谁的工具链能留下开发者”。这件事,值得每个 AI 从业者认真看完。

Gemini 截图疑似泄露,真正危险的不是模型,而是 Google 这一步棋

一组疑似泄露的 Google Gemini 截图,暴露的可能不只是一个新模型,而是 Google 正在悄悄改变开发者战争的打法:多模态只是表面,真正的筹码是“谁的工具链能留下开发者”。这件事,值得每个 AI 从业者认真看完。

截图没那么重要,重要的是 Google 开始“不装了”

先说结论:这次 Gemini 的“泄露”,即便有夸大、甚至部分不真实,它依然释放了一个非常清晰的信号——Google 已经不满足于把 Gemini 当成 Bard 的升级版。

在流出的 MakerSuite 截图中,Gemini 被明确标识为一个可选模型,甚至区分了“文本模型”和“多模态模型”,还能直接处理图片输入:文字识别、目标检测、图像理解、自动生成 caption。更关键的是,这一切不是在聊天框里发生的,而是在一个“开发者工具”里。

这意味着什么?意味着 Google 想把 Gemini 放进开发者的工作流,而不是放在产品发布会上炫技。它不是在说“看我们模型多强”,而是在说“你每天写 prompt、调 API 的地方,应该在我这”。

这点非常不 Google。过去的 Google 更擅长模型论文和 demo,但这次泄露的信息里,几乎没有“学术味”,全是 UI、设置项、代码片段。哪怕截图是假的,这个方向也极其真实。

MakerSuite + 多模态:这不是对标 GPT-4,而是对标“开发者习惯”

MakerSuite 本身并不神秘:一个让你写 prompt、生成代码、快速做生成式 AI 应用的地方。它刚上线时,只有文本能力,看起来更像 Google 版的 Prompt Playground。

但泄露信息的关键在于两点:

第一,多模态被“原生”塞进了开发流程。不是额外的 API,不是实验性功能,而是直接勾选一个 checkbox:是否启用图像输入、是否允许图像作为输出。这对开发者来说意味着什么?意味着多模态不再是一个项目级决策,而是一次 prompt 级决策。

第二,数据型 prompt 也支持多模态。这个细节非常狠。因为数据 prompt 通常用于“稳定、可重复”的任务,比如 OCR、图像分类、结构化输出。一旦这里支持多模态,Gemini 的目标就不只是聊天,而是生产力工具。

这其实是在正面挑战 GPT-4 的一个隐性优势:开发者已经习惯在 OpenAI 的工具体系里“凑合着用”。Google 现在做的,是试图重新定义:什么才是顺手的 AI 开发体验。

真正被低估的,是那个叫 Stubs 的东西

如果你只盯着 Gemini,你可能会错过这次最有意思的部分:Stubs。

Stubs 本质上不是“生成代码”,而是生成一个可以直接跑、可以分享、可以 remix 的 AI 应用原型。更像什么?像 AI 版的 Figma,而不是 AI 版的 IDE。

你可以公开你的 Stubs,别人可以直接复用、改造。它不是给工程师写生产代码用的,而是用来极速验证想法的。这个设计背后的逻辑非常清晰:

当 AI 降低了“写代码”的门槛,下一个瓶颈就变成了“谁能更快试错”。而试错速度,决定了谁能留住最多开发者。

这和 Google 5 月那篇内部泄露的备忘录《We Have No Moat》形成了诡异的呼应。那篇 memo 里最刺痛人的一句话是:

“我们和 OpenAI 都没护城河,真正吃掉我们的是开源。”

Stubs + 社区 Gallery,本质上就是在用“产品化体验”对抗开源社区的创造力外溢。

Gemini 的真正对手,不只是 GPT-4,而是整个开发者生态

把视角拉远,你会发现这不是 Google 一家的动作。

OpenAI 在 11 月 6 日办 DevDay,Sam Altman 明确说不会发 GPT-5,却反复暗示“开发者会很兴奋”。市场的猜测集中在两个点:更便宜的 API,以及面向 AI Agent 的新工具。

Meta 通过 Llama 和 Llama 2,已经事实上掌控了开源模型阵地。

Apple 被曝正在把生成式 AI 塞进 Xcode,对标 GitHub Copilot。

Replit 直接把 AI 编程工具 Ghostwriter 下放给所有用户,喊出“AI for all”。

你会发现一个共同点:大家都不再只谈模型能力,而是在拼谁能成为开发者的“默认选择”。

从这个角度看,Gemini 是否真的超过 GPT-4,反而没那么重要。真正重要的是:当一个开发者准备做下一个 AI 应用时,他第一时间会打开哪一个工具。

总结

如果你是 AI 从业者,这次泄露最值得记住的不是某个模型参数,而是一个趋势:AI 的竞争,正在从“模型谁更强”,转向“谁的工具链更顺手”。

对开发者来说,行动建议很现实:不要只押一个生态。多试 MakerSuite、关注 OpenAI DevDay、理解开源模型的边界和优势。未来 12 个月,决定你效率上限的,可能不是你会不会调参,而是你选对了哪套工具。

留一个判断题:一年后,你觉得新一代 AI 应用,会更多诞生在封闭平台,还是半开源工具之上?这个答案,可能直接决定你现在该把时间投到哪里。


关键词: Gemini, Google MakerSuite, 多模态AI, 开发者生态, 生成式AI

事实核查备注: 需要核查:Gemini 截图的真实性;MakerSuite 发布时间为 2023-09-26;OpenAI DevDay 时间为 2023-11-06;《We Have No Moat》备忘录泄露时间为 2023 年 5 月;Replit Ghostwriter 全量开放时间为 2023-10-09