文章

为什么真正的AI Agent不能只靠大语言模型

为什么真正的AI Agent不能只靠大语言模型

Imbue两位创始人在这期播客中反复强调:如果目标是构建能长期推理、执行任务的AI Agent,仅靠大语言模型远远不够。本文围绕他们的创业故事、对推理型模型的判断、为何从“写代码”切入,以及他们对未来人机交互的预判,提炼出这场对话中最值得反复思考的洞见。

api_bot · 2023-11-16 · 3 阅读 · AI/人工智能
最新幻觉排行榜曝光:GPT‑4最稳,Google却垫底,AI真能进生产了吗

最新幻觉排行榜曝光:GPT‑4最稳,Google却垫底,AI真能进生产了吗

当所有公司都在把大模型塞进真实业务,一个残酷问题被摆上台面:谁最爱“编故事”?一份登上《Nature》的研究,首次给出了大模型“幻觉率排行榜”,结果既打脸直觉,也直接影响你该不该把 AI 用进医疗、金融和内容生产。

api_bot · 2023-11-15 · 12 阅读 · AI/人工智能
一个“10年一夜成名”的AI法律创业故事

一个“10年一夜成名”的AI法律创业故事

这是一个关于耐心、技术拐点与真实需求的故事。Casetext联合创始人Jake Heller用10年时间,把律师数周的工作压缩到几分钟,最终以6.5亿美元卖出公司。这篇文章带你理解:为什么大模型让法律行业发生质变,以及真正的AI产品是如何被“磨”出来的。

api_bot · 2023-11-15 · 22 阅读 · AI/人工智能
ChatGPT不是产品奇迹,而是一次研究向现实低头的冒险

ChatGPT不是产品奇迹,而是一次研究向现实低头的冒险

ChatGPT 的成功,并不是一次“技术碾压”,而是一次充满犹豫、妥协与反直觉决策的产品实验。OpenAI 研究团队原本并不确定用户会不会买账,甚至不敢用最强模型上线。这段 Research × Product 的幕后故事,几乎重写了 AI 产品该如何诞生的逻辑。

api_bot · 2023-11-13 · 7 阅读 · AI/人工智能
OpenAI 内部坦白局:把大模型做强,90%的人第一步就走错了

OpenAI 内部坦白局:把大模型做强,90%的人第一步就走错了

在 OpenAI 首届开发者大会上,一场看似“基础”的分享却抛出了一个让无数团队踩坑的真相:微调不是万能钥匙,甚至常常是最后一步。这场45分钟的技术演讲,实际上给出了一个极其清醒、反直觉的 LLM 性能优化路线图。

api_bot · 2023-11-13 · 12 阅读 · AI/人工智能
2万亿参数的奥林匹斯山:亚马逊真要正面硬刚GPT-4了

2万亿参数的奥林匹斯山:亚马逊真要正面硬刚GPT-4了

就在外界还在讨论亚马逊为何豪掷40亿美元押注 Anthropic 时,一条更猛的消息传出:亚马逊正在秘密训练一款代号 Olympus 的自研大模型,参数规模可能是 GPT-4 的两倍。这不仅是一场参数竞赛,更是 AWS、Bedrock、Alexa 以及整个生成式 AI 格局的关键转折点。

api_bot · 2023-11-09 · 7 阅读 · AI/人工智能