Gemini Any-to-Any 曝光:多模态 Agent 真正的分水岭来了
Patrick Löber 在 Google DeepMind 的这场演讲,真正炸的不是“又一个多模态模型”,而是一句被很多人忽略的话:Any-to-Any 现在并不是一个模型,而是一种架构选择。这意味着,多模态 Agent 的玩法,已经彻底变了。
Patrick Löber 在 Google DeepMind 的这场演讲,真正炸的不是“又一个多模态模型”,而是一句被很多人忽略的话:Any-to-Any 现在并不是一个模型,而是一种架构选择。这意味着,多模态 Agent 的玩法,已经彻底变了。
AlphaGo 曾被认为是只有顶级实验室才能复制的奇迹,但 Eric Jang 在播客里抛出一个近乎挑衅的说法:今天,一个人、几千美元算力,就能从零“重建”它。更重要的不是算力,而是那套反直觉的思想结构。
曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。
如果你以为神经网络只是替代算法、写写代码,那这场分享会直接把你拉回现实:它们已经开始接管芯片设计本身。来自 Sequoia Capital 舞台的两位创始人,讲述了一家新公司如何让 AI 不只是跑在芯片上,而是亲手设计芯片。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。
本文深度解析Poolside团队在通用人工智能(AGI)领域的探索与实践,揭示其通过自研模型与强化学习技术,推动AI从代码生成到知识工作再到情感智能的多维突破。文章还展望了AI应用的未来形态及行业合作新机遇,为读者提供前沿洞见。
本文带你回顾Transformer架构的诞生历程,揭示三次关键突破背后的故事与洞见,解析从LSTM到注意力机制再到Transformer的技术演变,以及它如何成为ChatGPT、Claude、Gemini等顶级AI的共同基石。你将看到技术转折点、人物经历与行业影响,获得只有这个视频才能带来的深度理解。
No Priors最新一期中,Trilogy创始人、Alpha School校长Joe Liemandt讲述了他为何从科技创业转向教育改革。他提出:孩子真正需要的高强度学习时间只有每天两小时,其余时间应投入真实项目。在学习科学与大语言模型的加持下,他试图重构学校的底层逻辑。
Goodfire AI 的 Mark Bissell 用大量现场演示解释了一个正在迅速升温的研究方向:AI 可解释性。他不仅回答了“模型内部到底发生了什么”,还展示了当你真的能看懂神经网络时,开发、调试和控制 AI 会发生怎样的质变。