Google把最强模型开源了,但真正颠覆行业的不是参数规模
在这期 Latent Space 的对话中,DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点:开源模型的未来,不在于更大,而在于“更聪明地变小”。Gemma 4 的发布,只是表面,真正的变化发生在架构、部署方式和研究范式上。
在这期 Latent Space 的对话中,DeepMind 的 Omar Sanseviero 抛出了一个足以让很多 AI 从业者重新思考路线的观点:开源模型的未来,不在于更大,而在于“更聪明地变小”。Gemma 4 的发布,只是表面,真正的变化发生在架构、部署方式和研究范式上。
Patrick Löber 在 Google DeepMind 的这场演讲,真正炸的不是“又一个多模态模型”,而是一句被很多人忽略的话:Any-to-Any 现在并不是一个模型,而是一种架构选择。这意味着,多模态 Agent 的玩法,已经彻底变了。
这是一场长达4小时的深度访谈,但真正炸场的只有一句话:AI行业已经不需要个人英雄主义。曾在Anthropic与Gemini训练模型的姚舜宇,用自己的路径、判断与犹豫,拆解了模型能力、应用创业、组织文化与个人选择的真实现状。
曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。
当大多数人还在讨论“哪个API更强”时,这场工作坊直接把话说透:你完全可以在本地,从零开始,亲手训练一个大语言模型。没有云算力神话,没有巨头资源,只有最朴素、也最容易被忽略的四个核心模块。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
YC 最新一期《Light Cone》抛出一个让人坐不住的判断:机器人不是慢慢变好,而是刚刚跨过一个临界点。成本在塌陷、模型在统一、数据在重组,最重要的是——机器人第一次开始遵循我们在 AI 软件世界里熟悉的 scaling 逻辑。
很多人以为AI安全只能靠更大的模型、更贵的系统。但这支视频抛出一个反直觉的结论:用一个成本低到“1美元级别”的微调ModernBERT,就能构建有效的LLM安全护栏,而且不是纸上谈兵,而是真正跑过攻击向量的实战方案。
一场针对 Sam Altman 家庭的暴力事件,把 AI 争论从推特口水战拖进了现实世界。视频抛出一个刺痛行业的问题:当“为人类而战”的叙事开始合理化暴力,AI 从业者是否正在低估自己制造的社会情绪炸药?
如果你以为谷歌在AI竞赛中只是“后来追赶”,Sundar Pichai会当场否定你。在这场罕见的长谈中,他首次把Transformer、Search、LaMDA、Gemini,以及1750亿美元级别的资本投入,串成一条完整的AI时间线。