最便宜的算力不在地球:他把H100送上太空,算清了这笔账
当所有人都在为电价、土地和散热发愁时,Starcloud 的 CEO 直接给出一个反直觉答案:未来最便宜的算力在太空。更夸张的是,他们已经把 NVIDIA H100 送上轨道,还真的跑起了模型。
当所有人都在为电价、土地和散热发愁时,Starcloud 的 CEO 直接给出一个反直觉答案:未来最便宜的算力在太空。更夸张的是,他们已经把 NVIDIA H100 送上轨道,还真的跑起了模型。
当所有人都在疯狂堆 GPU、比拼算力规模时,OpenAI 在最新一期播客里抛出一个反直觉结论:真正卡住 AI Scaling 的,不是芯片不够快,而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式,并准备把它变成行业标准。
我们都在追更大的模型、更快的训练,却忽略了一个更“脏更累”的问题:模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑,揭开了小模型推理基础设施的巨大空白。
当所有人都在追逐更大的模型时,Baseten 的 CEO 却反复强调一个“反直觉”的判断:真正决定 AI 公司生死的,不是训练,而是推理。这期播客里,他几乎毫不掩饰地讲出了云 AI、定制模型和算力博弈背后的真实逻辑。
当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。
当所有人都在盯着参数规模时,这场对话却反其道而行:LLM 的成败,早就被 batch size、注意力稀疏性、机架拓扑和 KV cache 这些“底层细节”锁死了。Reiner Pope 用一小时把训练与推理背后的数学账和硬件账,一次性摊在桌面上。
当几乎所有人还在讨论更大的模型、更长的上下文窗口时,Demis Hassabis 在 YC 的舞台上泼了一盆冷水:这些都不足以通向 AGI。他直言,真正关键的问题至今无人解决,而且可能会在你正在做的创业项目中途突然出现。
Google DeepMind 悄悄干了一件“反直觉”的事:没有堆参数、没有锁生态,却用 Gemma 4 把开源模型直接送进榜单前六。从 31B 多模态到能跑在设备端的小模型,这次更新释放了一个强烈信号——下一轮 AI 竞争,不再只属于巨无霸模型。
如果你还沉迷于“跑最新、最大的模型”,那 AIE Miami 第二天的内容可能会让你坐立不安。从 agentic coding 的心态转变,到推理延迟的真实代价,再到 Cursor、AutoGPT 背后的产品哲学,这一天的共识只有一个:AI 工程正在彻底换玩法。
大多数人还在争论模型参数和推理能力时,Anthropic 的 David Soria Parra 已经把注意力转向了另一件事:连接。MCP 不只是一个协议,它正在成为 2026 年 AI Agent 能否真正落地的“隐形底座”。这场演讲,信息密度极高。