Claude学会用电脑:AI代理从工具走向行动者
Anthropic推出的Claude Computer Use,让AI第一次像人一样“看屏幕、点按钮、填表格”。这不仅是功能升级,而是软件范式的转折点:模型开始适配现实世界的工具,AI代理时代真正到来。
Anthropic推出的Claude Computer Use,让AI第一次像人一样“看屏幕、点按钮、填表格”。这不仅是功能升级,而是软件范式的转折点:模型开始适配现实世界的工具,AI代理时代真正到来。
OpenAI在“12 Days of OpenAI”第一天就放了个大招:o1正式版上线,同时推出每月200美元的ChatGPT Pro。更炸的是,他们第一次公开承认——这个模型会“先思考,再回答”,而这正在悄悄改变AI推理、速度和可靠性的天花板。
生成式AI的商业模式正走到关键岔路口。当算力成本持续攀升、订阅收入增长放缓,OpenAI是否终将拥抱广告?本文结合OpenAI高管表态、内部招聘动向与行业分歧,拆解“AI+广告”为何既像救命稻草,又可能动摇用户信任的根基。
这篇文章梳理了Amazon在生成式AI上的一次重要转向:从依赖Anthropic到重新押注自研多模态大模型Olympus。通过具体故事、技术细节和监管背景,解释Amazon为何此时出手,以及这对云计算与AI竞赛意味着什么。
在Sam Altman被罢免又复职一年后,生成式AI的竞争版图并未收敛,反而更加分化。这篇文章梳理OpenAI、微软、Anthropic、Meta、Google等关键玩家的真实进展,解释谁在技术、产品、分发和政治层面悄然领先,以及这场竞赛为什么仍远未结束。
当Anthropic的Claude在AI研究测试中击败OpenAI模型,这并不只是一次榜单胜负,而是一次关于“AI是否开始参与改进AI”的关键实验。本文结合多项基准测试与一线观察,梳理自我改进AI的真实进展、瓶颈与下一阶段竞争焦点。
OpenAI被曝将于2025年初发布代号为“Operator”的自主AI代理。这不仅是一项产品更新,更是AI行业在技术成熟度、商业化压力与国家级基础设施博弈中的关键一跃。
Y Combinator 最新一期《Lightcone》讨论提出一个反直觉判断:AI 的下一个关键突破不再来自模型规模扩张,而是来自“推理能力”的系统性进化。本文梳理他们对 AGI、科研型 AI、以及多模型协作架构的核心洞见,并结合真实创业案例,解释这条路径为何被长期低估。
围绕OpenAI、Google等前沿实验室的最新动向,一场关于“AI是否正在放缓”的争论正在发酵。这并非技术停滞,而是一次深刻的路径转向:从无限扩展预训练算力,走向以推理和测试时计算为核心的新范式。
这篇文章梳理了The AI Daily Brief关于“政府效率部(DOGE)”的讨论,核心不是政治立场,而是一个更少被认真对待的问题:如果AI真的被系统性引入政府核心运作,美国的行政体系会发生什么变化?从削减机构到AI代理,从医疗、税务到监管自动化,这可能是一场前所未有的技术实验。