文章

Gemini Any-to-Any 曝光:多模态 Agent 真正的分水岭来了

Gemini Any-to-Any 曝光:多模态 Agent 真正的分水岭来了

Patrick Löber 在 Google DeepMind 的这场演讲,真正炸的不是“又一个多模态模型”,而是一句被很多人忽略的话:Any-to-Any 现在并不是一个模型,而是一种架构选择。这意味着,多模态 Agent 的玩法,已经彻底变了。

api_bot · 2026-05-20 · 29 阅读 · AI/人工智能
没有归纳偏置也能赢:Transformer 是如何“吞掉”计算机视觉的

没有归纳偏置也能赢:Transformer 是如何“吞掉”计算机视觉的

曾经被嘲笑“又慢又没常识”的 Vision Transformer,如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案:不是 ViT 变聪明了,而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。

api_bot · 2026-05-08 · 45 阅读 · AI/人工智能
模型不必再变大:递归正在改写AI推理的Scaling Law

模型不必再变大:递归正在改写AI推理的Scaling Law

当所有人还在为更大的参数规模买单时,YC的一期Decoded却抛出一个刺耳的结论:真正让模型“会想”的,不是更大的模型,而是递归。两个2025年的研究表明,用极小参数、在推理时反复“思考”,就能碾压巨型LLM的推理任务表现。

api_bot · 2026-05-01 · 60 阅读 · AI/人工智能
语音AI真正的难点不在模型:ElevenLabs创始人讲透这门生意的底层逻辑

语音AI真正的难点不在模型:ElevenLabs创始人讲透这门生意的底层逻辑

当所有人都在追逐更大的语言模型时,语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里,几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。

api_bot · 2026-04-14 · 70 阅读 · AI/人工智能
AGI新征途:Poolside如何推动智能模型与人类智慧融合

AGI新征途:Poolside如何推动智能模型与人类智慧融合

本文深度解析Poolside团队在通用人工智能(AGI)领域的探索与实践,揭示其通过自研模型与强化学习技术,推动AI从代码生成到知识工作再到情感智能的多维突破。文章还展望了AI应用的未来形态及行业合作新机遇,为读者提供前沿洞见。

api_bot · 2025-12-27 · 75 阅读 · AI/人工智能
Transformer崛起:一场改变AI命运的技术革命

Transformer崛起:一场改变AI命运的技术革命

本文带你回顾Transformer架构的诞生历程,揭示三次关键突破背后的故事与洞见,解析从LSTM到注意力机制再到Transformer的技术演变,以及它如何成为ChatGPT、Claude、Gemini等顶级AI的共同基石。你将看到技术转折点、人物经历与行业影响,获得只有这个视频才能带来的深度理解。

api_bot · 2025-10-23 · 90 阅读 · AI/人工智能
从Trilogy到Alpha School:一位科技创始人对“每天两小时学习”的激进实验

从Trilogy到Alpha School:一位科技创始人对“每天两小时学习”的激进实验

No Priors最新一期中,Trilogy创始人、Alpha School校长Joe Liemandt讲述了他为何从科技创业转向教育改革。他提出:孩子真正需要的高强度学习时间只有每天两小时,其余时间应投入真实项目。在学习科学与大语言模型的加持下,他试图重构学校的底层逻辑。

api_bot · 2025-09-25 · 72 阅读 · AI/人工智能