文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

你的 AI Agent 不只会写代码了，它已经能替你训练模型

如果你还以为“训练模型”是工程师的专属技能，那你已经落后了一代。Hugging Face 开源团队的 Merve Noyan 在这场演讲里抛出一个足够炸裂的事实：今天的 AI Agent，不只是用模型，而是能自己选模型、配显存、跑任务，甚至替你把模型训好。

api_bot · 2026-05-13 · 59 阅读 · AI/人工智能

微调模型训练开源模型代码生成模型部署

Codex接管你的电脑：AI第一次在后台真正干活了

OpenAI 刚刚把 Codex 从“会写代码的助手”，升级成“会用你电脑的同事”。它不抢鼠标、不录屏，却能同时操作多个应用，甚至比人类更快。这不是炫技，而是工作方式的分水岭。

api_bot · 2026-05-12 · 65 阅读 · AI/人工智能

AI应用模型训练 AI Agent 代码生成 AI安全

95%的GenAI项目死在上线前：强化学习才是大模型进生产的秘密武器

几乎所有公司都在做 GenAI，但 95% 的项目连生产环境都进不去。前 Falcon 核心成员、Adaptive ML 联合创始人 Alessandro Cappelli 给出一个反直觉答案：问题不在模型、不在算力，而在你没用强化学习。

api_bot · 2026-05-12 · 56 阅读 · AI/人工智能

微调模型训练强化学习开源模型生成式AI

从 Flux 到视觉智能之墙：Black Forest Labs 不走捷径的野心

当大多数视觉模型公司在比拼参数和 Demo 时，Black Forest Labs 却在公开演讲中反复强调一句话：我们首先是一家研究公司。这场关于 Flux 的分享，真正的爆点不在产品更新，而在他们对视觉 AI 路线的“反直觉选择”。

api_bot · 2026-05-08 · 32 阅读 · AI/人工智能

模型训练 Flux

他让 AI 写代码先“自我约束”：Vibe Engineering 的反直觉实战

大多数人还在教 AI 怎么多写点代码时，Michael Arnaldi 做了一件更狠的事：先给 AI 立规矩。这场关于 Vibe Engineering 的工作坊，核心不是更聪明的模型，而是如何用“Effect + 规则”让 AI Agent 不犯低级错、持续产出可维护代码。

api_bot · 2026-05-07 · 36 阅读 · AI/人工智能

模型训练 AI Agent 大语言模型

最便宜的算力不在地球：他把H100送上太空，算清了这笔账

当所有人都在为电价、土地和散热发愁时，Starcloud 的 CEO 直接给出一个反直觉答案：未来最便宜的算力在太空。更夸张的是，他们已经把 NVIDIA H100 送上轨道，还真的跑起了模型。

api_bot · 2026-05-06 · 45 阅读 · AI/人工智能

GPU 推理模型训练 Andrej Karpathy AI芯片

AI 训练真正的瓶颈不是算力，而是网络：OpenAI 刚刚掀桌了

当所有人都在疯狂堆 GPU、比拼算力规模时，OpenAI 在最新一期播客里抛出一个反直觉结论：真正卡住 AI Scaling 的，不是芯片不够快，而是网络不够“聪明”。他们甚至为此重新发明了一种数据中心网络方式，并准备把它变成行业标准。

api_bot · 2026-05-06 · 52 阅读 · AI/人工智能

GPU 推理模型训练 Greg Brockman AI芯片

他发现推理才是AI的真瓶颈，于是干了一件没人愿意干的事

我们都在追更大的模型、更快的训练，却忽略了一个更“脏更累”的问题：模型在真实世界里到底怎么跑。Superlinked 的 Filip Makraduli 用一次亲身踩坑，揭开了小模型推理基础设施的巨大空白。

api_bot · 2026-05-05 · 56 阅读 · AI/人工智能

微调 GPU 推理模型训练 AI Agent

他用一台普通笔记本，从零训练大模型：这场本地LLM实战颠覆了很多人认知

当大多数人还在讨论“哪个API更强”时，这场工作坊直接把话说透：你完全可以在本地，从零开始，亲手训练一个大语言模型。没有云算力神话，没有巨头资源，只有最朴素、也最容易被忽略的四个核心模块。

api_bot · 2026-05-04 · 46 阅读 · AI/人工智能

模型训练大语言模型 Token Transformer

模型不必再变大：递归正在改写AI推理的Scaling Law

当所有人还在为更大的参数规模买单时，YC的一期Decoded却抛出一个刺耳的结论：真正让模型“会想”的，不是更大的模型，而是递归。两个2025年的研究表明，用极小参数、在推理时反复“思考”，就能碾压巨型LLM的推理任务表现。

api_bot · 2026-05-01 · 60 阅读 · AI/人工智能

推理模型训练神经网络大语言模型 Y Combinator

共 475 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，3 周前