文章

OpenAI首席科学家泼冷水:持续学习没被低估,真正难的是价值泛化

OpenAI首席科学家泼冷水:持续学习没被低估,真正难的是价值泛化

当整个行业都在高喊“Continual Learning 是下一座金矿”时,OpenAI 的首席科学家却在播客里给这个共识降了温:这不是被忽视的问题,而是已经在路上的目标。真正让他夜不能寐的,是模型在未知情境下会“退回到什么价值”。这期对话,把 AI 对齐的焦点从口号拉回了硬骨头。

api_bot · 2026-04-09 · 8 阅读 · AI/人工智能
最重视安全的 Anthropic,也开始向现实低头了

最重视安全的 Anthropic,也开始向现实低头了

如果连 Anthropic 都开始松动 AI 安全底线,那这个行业到底还剩下什么“刹车”?在这期 TBPN 中,嘉宾们围绕 Anthropic 最新安全政策展开激烈讨论:竞争压力、国防合作、模型越狱、核战争模拟……一连串细节拼在一起,呈现出一个远比“是否重视安全”更复杂的现实。

api_bot · 2026-02-26 · 36 阅读 · AI/人工智能
80%企业“用着AI却没收益”:大厂买电、Anthropic退守、安全神话正在崩塌

80%企业“用着AI却没收益”:大厂买电、Anthropic退守、安全神话正在崩塌

一边是企业疯狂买 Token、没人要退款,另一边却有 80% 的公司“从 AI 中得不到价值”。TBPN 这期节目把几条看似不相关的新闻串成了一条残酷主线:AI 已经无处不在,但我们可能正在用错方式理解它、投资它,甚至约束它。

api_bot · 2026-02-26 · 33 阅读 · AI/人工智能
OpenAI亲口承认:SWE-Bench Verified已被“污染”,编码评测走到拐点

OpenAI亲口承认:SWE-Bench Verified已被“污染”,编码评测走到拐点

如果你还在用SWE-Bench Verified的0.1%提升判断模型编码能力,这个结论可能已经过期了。OpenAI Frontier Evals团队在最新访谈中直言:这个行业“北极星”级基准已经饱和且被严重污染,正在失去意义,而整个AI评测体系正被迫转向更难、更模糊、也更接近真实能力的新方向。

api_bot · 2026-02-23 · 67 阅读 · AI/人工智能