文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全模型训练代码生成 Sam Altman 对话AI 多模态开源模型提示工程

他们让GPT当考古学家，在亚马逊森林里“找文明”

一群并非考古出身的工程师，用深度学习+ChatGPT，在亚马逊雨林中筛出100多个潜在遗址点，并拿下 OpenAI to Z Challenge。最炸裂的不是模型，而是他们把对话式 AI 当成“长期合作者”的方式。

api_bot · 2025-08-28 · 64 阅读 · AI/人工智能

把实时语音AI成本打到1美元/小时，他们是怎么做到的

Gabber CTO Neil Dwyer 分享了他们托管开源语音模型 Orpheus 的一线经验：从实时语音的成本压力出发，深入讲述音频 token、LoRA 微调、延迟控制与一致性哈希负载均衡，解释如何在真实生产环境中把语音 AI 的单位成本压到极低。

api_bot · 2025-07-31 · 75 阅读 · AI/人工智能

微调推理模型训练 Token 视觉语言模型

为什么通用机器人现在才真正起步？一场来自Physical Intelligence的现场答案

这场演讲围绕一个核心问题展开：为什么“通用机器人”在今天才变得可行？两位来自Physical Intelligence的研究者，从视觉-语言-动作模型（VLA）的技术突破、数据引擎的构建方式，到真实家庭场景中的机器人演示，给出了一个比“算力更强了”更具体、更残酷也更乐观的答案。

api_bot · 2025-07-26 · 62 阅读 · AI/人工智能

模型训练开源模型大语言模型多模态 Transformer

Waymo 的 EMMA：自动驾驶如何从“能跑”走向“会思考”

这场来自 Waymo 的技术分享，讲述了自动驾驶从早期神经网络到基础模型时代的关键跃迁。核心不在于“再堆一点模型”，而是如何用多模态、可解释的方式，解决规模化中最棘手的长尾安全问题。

api_bot · 2025-07-26 · 79 阅读 · AI/人工智能

模型训练神经网络生成式AI AI安全多模态

浏览器代理现状：为什么“会点网页”比你想象的难

Jerry Wu 和 Wyatt Marshall 系统梳理了浏览器代理的真实能力边界：读网页已接近可用，写网页却仍是硬骨头。他们用一个5000任务的真实基准，揭示了性能、失败模式和基础设施为何才是决定性因素。

api_bot · 2025-06-03 · 60 阅读 · AI/人工智能

AI Agent 大语言模型 OpenAI 视觉语言模型

o3 到底强在哪？OpenAI 推理模型的一次质变时刻

OpenAI 发布的 o3 与 o4 Mini 并非又一次例行升级，而是一次“体验层级”的跃迁。从能把图像纳入推理，到在工具使用和反幻觉上出现突破，这期 AI Daily Brief 给出了多个真实案例，解释为什么很多一线用户觉得：这次真的不一样。

api_bot · 2025-04-20 · 63 阅读 · AI/人工智能

Sam Altman AI应用强化学习 AI工具幻觉

他没学过设计，却用GPT-4o Vision一口气做完一款AI聊天App

如果你还以为“做一个好看的AI应用”需要设计稿、UI库和审美天赋，这个视频会直接打脸。Riley Brown 用 GPT-4o Vision 截图+一句话提示，在一个下午里把一款 Claude 聊天应用从“能用”改到“好看、好玩、还想用”。更重要的是，这背后透露出一个正在改变AI产品形态的信号。

api_bot · 2025-03-29 · 59 阅读 · AI/人工智能

AI应用生成式AI 对话AI Cursor 多模态

当AI真正长出手和眼：机器人迎来自己的ChatGPT时刻

从Google发布Gemini Robotics开始，具身智能正在跨过一个关键门槛。本篇文章通过具体案例与行业对比，解释为什么通用机器人第一次看起来“真的可行”，以及这对科技公司、创业者和普通人意味着什么。

api_bot · 2025-03-14 · 64 阅读 · AI/人工智能

AI应用 AI Agent 多模态 Elon Musk ChatGPT

从参数狂飙到“思考算力”：Scaling Laws如何改写AI进化路线

这篇文章还原了YC Decoded对“Scaling Laws”的完整叙事：从GPT-2到GPT-3确立规模定律，从Chinchilla纠偏“只堆参数”的误区，再到OpenAI用推理模型与测试时算力开启新一轮扩展路径。你将理解：为什么AI并未撞墙，而是正在换一条更陡峭的增长曲线。

api_bot · 2025-01-23 · 59 阅读 · AI/人工智能

GPU 推理模型训练通用人工智能神经网络

Claude学会用电脑：AI代理从工具走向行动者

Anthropic推出的Claude Computer Use，让AI第一次像人一样“看屏幕、点按钮、填表格”。这不仅是功能升级，而是软件范式的转折点：模型开始适配现实世界的工具，AI代理时代真正到来。

api_bot · 2024-12-06 · 49 阅读 · AI/人工智能

Sam Altman AI应用模型训练 AI Agent 代码生成

共 43 篇文章

社群

AI产品训练营核心群

付费群测试2

付费群测试3

付费群测试4

付费社群测试5

快讯

测试快讯1

4 月，3 周前