文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

从Anthropic到Gemini，他说AI不再需要英雄主义了

这是一场长达4小时的深度访谈，但真正炸场的只有一句话：AI行业已经不需要个人英雄主义。曾在Anthropic与Gemini训练模型的姚舜宇，用自己的路径、判断与犹豫，拆解了模型能力、应用创业、组织文化与个人选择的真实现状。

api_bot · 2026-05-11 · 85 阅读 · AI/人工智能

没有归纳偏置也能赢：Transformer 是如何“吞掉”计算机视觉的

曾经被嘲笑“又慢又没常识”的 Vision Transformer，如今却成了视觉领域的绝对主角。Roboflow 研究负责人 Isaac Robinson 用一场演讲给出答案：不是 ViT 变聪明了，而是预训练、算力和 LLM 基础设施把游戏规则彻底改写了。

api_bot · 2026-05-08 · 45 阅读 · AI/人工智能

微调 GPU 神经网络模型部署大语言模型

把大模型思路照搬到小模型，是边缘AI最大的误区

在所有人都在追逐更大参数、更强算力时，Liquid AI 的 Maxime Labonne 反其道而行：专注 3.5 亿到 240 亿参数的小模型，并且明确说——小模型不是大模型的“缩水版”。这场分享，几乎逐条拆掉了从大模型时代继承下来的错误直觉。

api_bot · 2026-04-29 · 56 阅读 · AI/人工智能

模型训练强化学习多模态预训练计算机视觉

客户服务模型干翻GPT‑5.4：垂直AI时代真的来了

一家做客服的软件公司，训练了一个“只会干一件事”的模型，却在真实指标上击败了GPT‑5.4和Opus 4.5。这不是个例，而是一个信号：在2026年，AI性能的主战场，正在从“更大的通用模型”转向“更狠的垂直模型”。

api_bot · 2026-03-29 · 67 阅读 · AI/人工智能

微调 AI应用强化学习开源模型代码生成

OpenAI 砍掉 Sora、合并团队、押注代码：为什么“Work AGI”成了唯一主线

OpenAI 做了一个极不“OpenAI”的决定：主动放弃 Sora 视频生成，终止和迪士尼的合作，把算力、组织和叙事全部押到一个方向——Work AGI。这不是一次产品调整，而是一场路线收缩的宣言。

api_bot · 2026-03-26 · 85 阅读 · AI/人工智能

Sam Altman AI应用通用人工智能代码生成生成式AI

黄仁勋亲口复盘：NVIDIA为何不再卖GPU，而是重造“AI工厂”

如果你还把 NVIDIA 当成一家“卖 GPU 的公司”，那你已经落后了至少一个时代。在这期 Lex Fridman 的长谈中，黄仁勋用近乎残酷的坦诚，讲清了 NVIDIA 为何押上整个组织，从芯片公司进化为“AI 工厂设计商”，以及这场转型对所有 AI 从业者意味着什么。

api_bot · 2026-03-23 · 113 阅读 · AI/人工智能

微调 AI应用推理模型训练模型部署

Claude Code一岁了：一年时间，AI把“写代码”这件事直接改写

如果你还把AI写代码当成“高级自动补全”，那你已经落后了一整年。Claude Code刚满一岁，却已经做到年化25亿美元收入、重塑Anthropic命运，甚至引发资本市场恐慌。这不是工具进化，而是软件工程的一次相变。

api_bot · 2026-02-26 · 99 阅读 · AI/人工智能

Sam Altman AI应用模型训练强化学习 AI Agent

Anthropic CEO 的最大赌局：AI 指数曲线，真的快到头了吗

如果你以为 AI 的指数增长已经开始放缓，Dario Amodei 可能会同意你一半，但反对你另一半。在这场对话中，他一边承认我们正逼近某些极限，一边又抛出一个更危险的判断：真正决定胜负的，不再是算力，而是验证、强化学习，以及谁能活到下一轮。

api_bot · 2026-02-13 · 84 阅读 · AI/人工智能

强化学习 Anthropic 预训练

一个海马表情，暴露了GPT-4的训练秘密

如果我告诉你，只靠几个奇怪的提示词和API调用，就能“反向工程”出GPT-4在不同阶段吃过什么数据，你会不会觉得有点越界？在这期 Latent Space Lightning Pod 里，Datology 创始成员 Pratyush Maini 用一系列看似玩笑的实验，揭开了大模型训练数据、预训练阶段，甚至安全机制的真实边界。

api_bot · 2026-02-10 · 89 阅读 · AI/人工智能

微调模型训练 AI安全预训练 GPT-4