别只盯着1M上下文：Gemini 1.5真正颠覆的是“第二大脑”

AI PM 编辑部 · 2024年03月05日 · 8 阅读 · AI/人工智能

Token 多模态 AI应用上下文窗口 AI工具生成式AI 提示工程 Gemini Pro ChatGPT Gemini

正在加载视频...

视频章节

当所有人还在讨论“100万Token有多大”时，这支视频给了一个更狠的答案：真正的变革不是更长的上下文，而是你第一次可以把“自己的人生”交给AI理解、总结和创作。Gemini 1.5，被严重低估了。

别只盯着1M上下文：Gemini 1.5真正颠覆的是“第二大脑”

当所有人还在讨论“100万Token有多大”时，这支视频给了一个更狠的答案：真正的变革不是更长的上下文，而是你第一次可以把“自己的人生”交给AI理解、总结和创作。Gemini 1.5，被严重低估了。

100万Token不是炫技，而是一次量级断层

Gemini 1.5 Pro 最容易被低估的一点，是它把“上下文窗口”从一个参数，变成了一种能力跃迁。

Riley Brown 在视频一开始就抛出一个看似夸张、但完全真实的数字：100万Token 的上下文窗口。这意味着什么？不是“多塞几篇PDF”，而是——1小时视频、11小时音频、3万行代码、70万字文本，可以一次性交给模型理解。

他现场演示：把一份147页、约2.2万Token的研究论文合集直接丢进 Gemini，让模型“列出所有论文，并用最简单的话总结每篇的目的和结论”。结果不是泛泛而谈，而是清晰、结构化、可复用的总结。

这里有个关键对比：ChatGPT 最初的上下文窗口大约是 4，000 Token。就算放大 10 倍到 40，000，你仍然需要 再乘 25 倍，才能触及 Gemini 1.5 的量级。这不是线性升级，而是工作方式的断层变化。

当上下文足够大，模型不再“健忘”，你也不必为了迁就模型而不断裁剪、压缩、拆分信息。信息第一次可以“按原样存在”。

真正危险的想法：如果上下文就是我的一生呢？

视频中最有冲击力的，不是技术演示，而是 Riley 提出的一个问题：

“如果上下文不再是一堆文件，而是我的人生呢？”

这句话点破了 AI 可穿戴设备和“长期记忆模型”的核心趋势。从 Humane AI Pin，到 Rewind Pendant，这些设备的本质不是硬件，而是持续采集你的所见、所听、所想，作为 AI 的长期上下文。

Riley 意识到：其实不需要等未来产品，现在就能手动构建一个“低配版”。

他的做法非常朴素：用 Readwise 保存所有他觉得有价值的内容——网页、文章、推文、YouTube 视频片段；不仅保存，还随手加一句自己的想法。重点不在信息，而在“信息 + 你的态度”。

这一点非常关键。因为当 AI 回看这些内容时，它看到的不是冷冰冰的资料，而是你在不同时间点的判断、犹豫、兴奋和反对。这才是“你”的一部分。

从笔记到“AI第二大脑”，只差自动化

如果只是做笔记，那并不新鲜。真正让系统产生质变的，是自动化。

Riley 的流程是这样的：Readwise → 自动同步到 Google Docs → 再通过 Zapier 汇总成一个他称之为 “AI powered second brain” 的中央数据库。

结果是什么？当他把这个文档整个丢进 Gemini 1.5 Pro 后，提问方式彻底变了。

他不再问“某个观点是什么”，而是直接问：
- 我保存过哪些关于 AI 视频的有趣内容？
- 把它们分成几类。
- 告诉我你看到的模式，以及我对这些趋势的情绪是偏正面还是负面。

Gemini 的回答把所有内容自动归纳为：技术进展、应用场景、对好莱坞的影响、总体预测，并给出一种近似“自我洞察”的总结。

这一步的本质是：AI 不再只是你的搜索引擎，而是开始理解你的认知轨迹。

当模型开始替你创作：从视频脚本到一本书

事情到这里已经很强，但 Riley 继续加码。

他让 Gemini 做了一件更激进的事：

“从我的第二大脑中，找一个有意思的趋势，用所有来源的引用，写一个完整的视频叙事大纲，并附上每个来源的链接。”

55 秒后，模型交付了一份完整的视频结构稿，主题明确，论点递进，每个观点都有他过去保存过的材料作为支撑。

接下来，是更疯狂的一步：

写《AI 时代的 25 条法则》，模仿《权力的48法则》
视角必须是 Riley 本人
每一条法则都要有来源链接

Gemini 不仅完成了列表，还进一步扩展成书籍章节：有 hook、有论点、有引用，甚至串联到他保存过的 Ethan Mollick、AI 视频模型（如 Sora）的讨论。

这意味着什么？

创作的单位，从“我写一句”变成了“我定义方向”。 而前提，正是那个看似不起眼的 100 万 Token 上下文。

总结

Gemini 1.5 最被低估的地方，不是它能装多少内容，而是它第一次让“长期个人上下文”变得可用、可对话、可创作。对 AI 从业者来说，这意味着三个行动点：第一，开始系统性地保存“信息 + 你的判断”；第二，用自动化工具把零散输入汇成单一知识体；第三，练习向模型提“高阶问题”，而不是要答案。未来真正拉开差距的，不是谁用哪个模型，而是谁拥有一个被 AI 深度理解的第二大脑。

关键词： Gemini 1.5，上下文窗口，第二大脑， AI应用，多模态

事实核查备注： Gemini 1.5 Pro 上下文窗口为 100 万 Token；可处理 1 小时视频、11 小时音频、约 70 万字文本；ChatGPT 初始上下文约 4，000 Token；工具链涉及 Readwise、Zapier、Google Docs；视频发布时间 2024-03-05。

返回文章列表