Gemini 截图疑似泄露，真正危险的不是模型，而是 Google 这一步棋

AI PM 编辑部 · 2023年10月24日 · 7 阅读 · AI/人工智能

Sam Altman 多模态 AI应用开源模型大语言模型 AI Agent 计算机视觉目标检测生成式AI 文字识别

正在加载视频...

视频章节

一组疑似泄露的 Google Gemini 截图，暴露的可能不只是一个新模型，而是 Google 正在悄悄改变开发者战争的打法：多模态只是表面，真正的筹码是“谁的工具链能留下开发者”。这件事，值得每个 AI 从业者认真看完。

Gemini 截图疑似泄露，真正危险的不是模型，而是 Google 这一步棋

一组疑似泄露的 Google Gemini 截图，暴露的可能不只是一个新模型，而是 Google 正在悄悄改变开发者战争的打法：多模态只是表面，真正的筹码是“谁的工具链能留下开发者”。这件事，值得每个 AI 从业者认真看完。

截图没那么重要，重要的是 Google 开始“不装了”

先说结论：这次 Gemini 的“泄露”，即便有夸大、甚至部分不真实，它依然释放了一个非常清晰的信号——Google 已经不满足于把 Gemini 当成 Bard 的升级版。

在流出的 MakerSuite 截图中，Gemini 被明确标识为一个可选模型，甚至区分了“文本模型”和“多模态模型”，还能直接处理图片输入：文字识别、目标检测、图像理解、自动生成 caption。更关键的是，这一切不是在聊天框里发生的，而是在一个“开发者工具”里。

这意味着什么？意味着 Google 想把 Gemini 放进开发者的工作流，而不是放在产品发布会上炫技。它不是在说“看我们模型多强”，而是在说“你每天写 prompt、调 API 的地方，应该在我这”。

这点非常不 Google。过去的 Google 更擅长模型论文和 demo，但这次泄露的信息里，几乎没有“学术味”，全是 UI、设置项、代码片段。哪怕截图是假的，这个方向也极其真实。

MakerSuite + 多模态：这不是对标 GPT-4，而是对标“开发者习惯”

MakerSuite 本身并不神秘：一个让你写 prompt、生成代码、快速做生成式 AI 应用的地方。它刚上线时，只有文本能力，看起来更像 Google 版的 Prompt Playground。

但泄露信息的关键在于两点：

第一，多模态被“原生”塞进了开发流程。不是额外的 API，不是实验性功能，而是直接勾选一个 checkbox：是否启用图像输入、是否允许图像作为输出。这对开发者来说意味着什么？意味着多模态不再是一个项目级决策，而是一次 prompt 级决策。

第二，数据型 prompt 也支持多模态。这个细节非常狠。因为数据 prompt 通常用于“稳定、可重复”的任务，比如 OCR、图像分类、结构化输出。一旦这里支持多模态，Gemini 的目标就不只是聊天，而是生产力工具。

这其实是在正面挑战 GPT-4 的一个隐性优势：开发者已经习惯在 OpenAI 的工具体系里“凑合着用”。Google 现在做的，是试图重新定义：什么才是顺手的 AI 开发体验。

真正被低估的，是那个叫 Stubs 的东西

如果你只盯着 Gemini，你可能会错过这次最有意思的部分：Stubs。

Stubs 本质上不是“生成代码”，而是生成一个可以直接跑、可以分享、可以 remix 的 AI 应用原型。更像什么？像 AI 版的 Figma，而不是 AI 版的 IDE。

你可以公开你的 Stubs，别人可以直接复用、改造。它不是给工程师写生产代码用的，而是用来极速验证想法的。这个设计背后的逻辑非常清晰：

当 AI 降低了“写代码”的门槛，下一个瓶颈就变成了“谁能更快试错”。而试错速度，决定了谁能留住最多开发者。

这和 Google 5 月那篇内部泄露的备忘录《We Have No Moat》形成了诡异的呼应。那篇 memo 里最刺痛人的一句话是：

“我们和 OpenAI 都没护城河，真正吃掉我们的是开源。”

Stubs + 社区 Gallery，本质上就是在用“产品化体验”对抗开源社区的创造力外溢。

Gemini 的真正对手，不只是 GPT-4，而是整个开发者生态

把视角拉远，你会发现这不是 Google 一家的动作。

OpenAI 在 11 月 6 日办 DevDay，Sam Altman 明确说不会发 GPT-5，却反复暗示“开发者会很兴奋”。市场的猜测集中在两个点：更便宜的 API，以及面向 AI Agent 的新工具。

Meta 通过 Llama 和 Llama 2，已经事实上掌控了开源模型阵地。

Apple 被曝正在把生成式 AI 塞进 Xcode，对标 GitHub Copilot。

Replit 直接把 AI 编程工具 Ghostwriter 下放给所有用户，喊出“AI for all”。

你会发现一个共同点：大家都不再只谈模型能力，而是在拼谁能成为开发者的“默认选择”。

从这个角度看，Gemini 是否真的超过 GPT-4，反而没那么重要。真正重要的是：当一个开发者准备做下一个 AI 应用时，他第一时间会打开哪一个工具。

总结

如果你是 AI 从业者，这次泄露最值得记住的不是某个模型参数，而是一个趋势：AI 的竞争，正在从“模型谁更强”，转向“谁的工具链更顺手”。

对开发者来说，行动建议很现实：不要只押一个生态。多试 MakerSuite、关注 OpenAI DevDay、理解开源模型的边界和优势。未来 12 个月，决定你效率上限的，可能不是你会不会调参，而是你选对了哪套工具。

留一个判断题：一年后，你觉得新一代 AI 应用，会更多诞生在封闭平台，还是半开源工具之上？这个答案，可能直接决定你现在该把时间投到哪里。

关键词： Gemini， Google MakerSuite，多模态AI，开发者生态，生成式AI

事实核查备注：需要核查：Gemini 截图的真实性；MakerSuite 发布时间为 2023-09-26；OpenAI DevDay 时间为 2023-11-06；《We Have No Moat》备忘录泄露时间为 2023 年 5 月；Replit Ghostwriter 全量开放时间为 2023-10-09

返回文章列表