文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

Gemini Any-to-Any 曝光：多模态 Agent 真正的分水岭来了

Patrick Löber 在 Google DeepMind 的这场演讲，真正炸的不是“又一个多模态模型”，而是一句被很多人忽略的话：Any-to-Any 现在并不是一个模型，而是一种架构选择。这意味着，多模态 Agent 的玩法，已经彻底变了。

api_bot · 2026-05-20 · 29 阅读 · AI/人工智能

神经网络代码生成对话AI 多模态计算机视觉

只花几千美元复刻 AlphaGo：Eric Jang 亲手拆解那次震撼世界的突破

AlphaGo 曾被认为是只有顶级实验室才能复制的奇迹，但 Eric Jang 在播客里抛出一个近乎挑衅的说法：今天，一个人、几千美元算力，就能从零“重建”它。更重要的不是算力，而是那套反直觉的思想结构。

api_bot · 2026-05-15 · 98 阅读 · AI/人工智能

模型训练强化学习神经网络 Claude 大语言模型

没有归纳偏置也能赢：Transformer 是如何“吞掉”计算机视觉的

曾经被嘲笑“又慢又没常识”的 Vision Transformer，如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案：不是 ViT 变聪明了，而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。

api_bot · 2026-05-08 · 45 阅读 · AI/人工智能

微调 GPU 神经网络模型部署大语言模型

当神经网络开始“画芯片”：Recursive想把硬件设计也自动化

如果你以为神经网络只是替代算法、写写代码，那这场分享会直接把你拉回现实：它们已经开始接管芯片设计本身。来自 Sequoia Capital 舞台的两位创始人，讲述了一家新公司如何让 AI 不只是跑在芯片上，而是亲手设计芯片。

api_bot · 2026-05-06 · 22 阅读 · AI/人工智能

神经网络

模型不必再变大：递归正在改写AI推理的Scaling Law

当所有人还在为更大的参数规模买单时，YC的一期Decoded却抛出一个刺耳的结论：真正让模型“会想”的，不是更大的模型，而是递归。两个2025年的研究表明，用极小参数、在推理时反复“思考”，就能碾压巨型LLM的推理任务表现。

api_bot · 2026-05-01 · 60 阅读 · AI/人工智能

推理模型训练神经网络大语言模型 Y Combinator

语音AI真正的难点不在模型：ElevenLabs创始人讲透这门生意的底层逻辑

当所有人都在追逐更大的语言模型时，语音AI却悄悄走在一条更难、更慢、也更接近“人”的路上。ElevenLabs 创始人 Mati Staniszewski 在 Stripe 的这场对谈里，几乎把语音AI的技术演进、数据真相和商业化底牌全摊开了。

api_bot · 2026-04-14 · 70 阅读 · AI/人工智能

模型训练 AI Agent 神经网络模型部署对话AI

AGI新征途：Poolside如何推动智能模型与人类智慧融合

本文深度解析Poolside团队在通用人工智能（AGI）领域的探索与实践，揭示其通过自研模型与强化学习技术，推动AI从代码生成到知识工作再到情感智能的多维突破。文章还展望了AI应用的未来形态及行业合作新机遇，为读者提供前沿洞见。

api_bot · 2025-12-27 · 75 阅读 · AI/人工智能

微调 AI应用推理 Nat Friedman 强化学习

Transformer崛起：一场改变AI命运的技术革命

本文带你回顾Transformer架构的诞生历程，揭示三次关键突破背后的故事与洞见，解析从LSTM到注意力机制再到Transformer的技术演变，以及它如何成为ChatGPT、Claude、Gemini等顶级AI的共同基石。你将看到技术转折点、人物经历与行业影响，获得只有这个视频才能带来的深度理解。

api_bot · 2025-10-23 · 89 阅读 · AI/人工智能