文章

最新幻觉排行榜曝光:GPT‑4最稳,Google却垫底,AI真能进生产了吗

最新幻觉排行榜曝光:GPT‑4最稳,Google却垫底,AI真能进生产了吗

当所有公司都在把大模型塞进真实业务,一个残酷问题被摆上台面:谁最爱“编故事”?一份登上《Nature》的研究,首次给出了大模型“幻觉率排行榜”,结果既打脸直觉,也直接影响你该不该把 AI 用进医疗、金融和内容生产。

api_bot · 2023-11-15 · 26 阅读 · AI/人工智能
OpenAI这场发布会真正的主角不是模型,而是“会干活的GPT”

OpenAI这场发布会真正的主角不是模型,而是“会干活的GPT”

很多人以为这是一场“新功能发布会”,但看完你会发现:OpenAI其实在悄悄重构ChatGPT的角色——从聊天工具,变成可以被任何人定制、接入现实世界、真正执行任务的AI Agent平台。这一次,变化比模型升级更大。

api_bot · 2023-11-13 · 28 阅读 · AI/人工智能
OpenAI 内部坦白局:把大模型做强,90%的人第一步就走错了

OpenAI 内部坦白局:把大模型做强,90%的人第一步就走错了

在 OpenAI 首届开发者大会上,一场看似“基础”的分享却抛出了一个让无数团队踩坑的真相:微调不是万能钥匙,甚至常常是最后一步。这场45分钟的技术演讲,实际上给出了一个极其清醒、反直觉的 LLM 性能优化路线图。

api_bot · 2023-11-13 · 35 阅读 · AI/人工智能
马斯克放出Grok:不是更聪明,而是更敢说的ChatGPT对手

马斯克放出Grok:不是更聪明,而是更敢说的ChatGPT对手

Elon Musk 终于掀开了 xAI 的第一张底牌:Grok。它不只是一个聊天机器人,而是一个“有态度、有情绪、还连着 X 实时数据”的模型。更快的推出速度、更强的讽刺语气、更赤裸的价值立场,这一次,马斯克显然不打算按 OpenAI 的规则玩。

api_bot · 2023-11-04 · 24 阅读 · AI/人工智能
Ilya Sutskever亲述:从“能跑就行”到超级对齐,OpenAI的真实方法论

Ilya Sutskever亲述:从“能跑就行”到超级对齐,OpenAI的真实方法论

这是一篇基于OpenAI联合创始人兼首席科学家Ilya Sutskever长谈的深度文章,完整还原他对深度学习起源、OpenAI早期试错、大模型为何必须“尽可能大”,以及为什么“超级对齐”将成为AGI时代生死线的真实思考。

api_bot · 2023-11-02 · 29 阅读 · AI/人工智能