别只盯着1M上下文:Gemini 1.5真正颠覆的是“第二大脑”

AI PM 编辑部 · 2024年03月05日 · 8 阅读 · AI/人工智能

正在加载视频...

视频章节

当所有人还在讨论“100万Token有多大”时,这支视频给了一个更狠的答案:真正的变革不是更长的上下文,而是你第一次可以把“自己的人生”交给AI理解、总结和创作。Gemini 1.5,被严重低估了。

别只盯着1M上下文:Gemini 1.5真正颠覆的是“第二大脑”

当所有人还在讨论“100万Token有多大”时,这支视频给了一个更狠的答案:真正的变革不是更长的上下文,而是你第一次可以把“自己的人生”交给AI理解、总结和创作。Gemini 1.5,被严重低估了。

100万Token不是炫技,而是一次量级断层

Gemini 1.5 Pro 最容易被低估的一点,是它把“上下文窗口”从一个参数,变成了一种能力跃迁。

Riley Brown 在视频一开始就抛出一个看似夸张、但完全真实的数字:100万Token 的上下文窗口。这意味着什么?不是“多塞几篇PDF”,而是——1小时视频、11小时音频、3万行代码、70万字文本,可以一次性交给模型理解

他现场演示:把一份147页、约2.2万Token的研究论文合集直接丢进 Gemini,让模型“列出所有论文,并用最简单的话总结每篇的目的和结论”。结果不是泛泛而谈,而是清晰、结构化、可复用的总结。

这里有个关键对比:ChatGPT 最初的上下文窗口大约是 4,000 Token。就算放大 10 倍到 40,000,你仍然需要 再乘 25 倍,才能触及 Gemini 1.5 的量级。这不是线性升级,而是工作方式的断层变化

当上下文足够大,模型不再“健忘”,你也不必为了迁就模型而不断裁剪、压缩、拆分信息。信息第一次可以“按原样存在”。

真正危险的想法:如果上下文就是我的一生呢?

视频中最有冲击力的,不是技术演示,而是 Riley 提出的一个问题:

“如果上下文不再是一堆文件,而是我的人生呢?”

这句话点破了 AI 可穿戴设备和“长期记忆模型”的核心趋势。从 Humane AI Pin,到 Rewind Pendant,这些设备的本质不是硬件,而是持续采集你的所见、所听、所想,作为 AI 的长期上下文

Riley 意识到:其实不需要等未来产品,现在就能手动构建一个“低配版”。

他的做法非常朴素:用 Readwise 保存所有他觉得有价值的内容——网页、文章、推文、YouTube 视频片段;不仅保存,还随手加一句自己的想法。重点不在信息,而在“信息 + 你的态度”。

这一点非常关键。因为当 AI 回看这些内容时,它看到的不是冷冰冰的资料,而是你在不同时间点的判断、犹豫、兴奋和反对。这才是“你”的一部分。

从笔记到“AI第二大脑”,只差自动化

如果只是做笔记,那并不新鲜。真正让系统产生质变的,是自动化。

Riley 的流程是这样的:Readwise → 自动同步到 Google Docs → 再通过 Zapier 汇总成一个他称之为 “AI powered second brain” 的中央数据库。

结果是什么?当他把这个文档整个丢进 Gemini 1.5 Pro 后,提问方式彻底变了。

他不再问“某个观点是什么”,而是直接问:
- 我保存过哪些关于 AI 视频的有趣内容?
- 把它们分成几类。
- 告诉我你看到的模式,以及我对这些趋势的情绪是偏正面还是负面。

Gemini 的回答把所有内容自动归纳为:技术进展、应用场景、对好莱坞的影响、总体预测,并给出一种近似“自我洞察”的总结

这一步的本质是:AI 不再只是你的搜索引擎,而是开始理解你的认知轨迹

当模型开始替你创作:从视频脚本到一本书

事情到这里已经很强,但 Riley 继续加码。

他让 Gemini 做了一件更激进的事:

“从我的第二大脑中,找一个有意思的趋势,用所有来源的引用,写一个完整的视频叙事大纲,并附上每个来源的链接。”

55 秒后,模型交付了一份完整的视频结构稿,主题明确,论点递进,每个观点都有他过去保存过的材料作为支撑。

接下来,是更疯狂的一步:

  • 写《AI 时代的 25 条法则》,模仿《权力的48法则》
  • 视角必须是 Riley 本人
  • 每一条法则都要有来源链接

Gemini 不仅完成了列表,还进一步扩展成书籍章节:有 hook、有论点、有引用,甚至串联到他保存过的 Ethan Mollick、AI 视频模型(如 Sora)的讨论。

这意味着什么?

创作的单位,从“我写一句”变成了“我定义方向”。 而前提,正是那个看似不起眼的 100 万 Token 上下文。

总结

Gemini 1.5 最被低估的地方,不是它能装多少内容,而是它第一次让“长期个人上下文”变得可用、可对话、可创作。对 AI 从业者来说,这意味着三个行动点:第一,开始系统性地保存“信息 + 你的判断”;第二,用自动化工具把零散输入汇成单一知识体;第三,练习向模型提“高阶问题”,而不是要答案。未来真正拉开差距的,不是谁用哪个模型,而是谁拥有一个被 AI 深度理解的第二大脑。


关键词: Gemini 1.5, 上下文窗口, 第二大脑, AI应用, 多模态

事实核查备注: Gemini 1.5 Pro 上下文窗口为 100 万 Token;可处理 1 小时视频、11 小时音频、约 70 万字文本;ChatGPT 初始上下文约 4,000 Token;工具链涉及 Readwise、Zapier、Google Docs;视频发布时间 2024-03-05。