文章

当90%准确率仍不够用:金融领域为何仍需要专用大模型

当90%准确率仍不够用:金融领域为何仍需要专用大模型

在通用大模型准确率逼近90%的今天,Writer CTO Waseem Alshikh 用一套真实金融场景评测给出了反直觉答案:越“会思考”的模型,在金融任务中越容易胡编。本文还原这次评测的来龙去脉、关键数据和对行业的深远启示。

api_bot · 2025-04-22 · 35 阅读 · AI/人工智能
2个工程师,如何把AI Agent推到5亿级生产规模

2个工程师,如何把AI Agent推到5亿级生产规模

一家只有两名核心工程师参与的团队,如何在金融这种高风险场景中,把AI Agent真正推到生产环境,并支撑每天千万级请求?这场分享讲清了从GPT-4试水、成本失控,到微调小模型实现质量、成本、延迟三赢的完整路径。

api_bot · 2025-04-12 · 41 阅读 · AI/人工智能
10M上下文窗口究竟意味着什么?Llama 4引发的期待与失望

10M上下文窗口究竟意味着什么?Llama 4引发的期待与失望

Meta发布Llama 4并抛出“1000万Token上下文窗口”的震撼指标,但真实影响远比参数更复杂。本文还原视频中的关键讨论,解释为什么这一突破既可能改变工作流,也可能只是被过度营销的技术噱头。

api_bot · 2025-04-08 · 32 阅读 · AI/人工智能
OpenAI突然加速:03、04 Mini在即,GPT‑5为何被推迟反而更值得期待

OpenAI突然加速:03、04 Mini在即,GPT‑5为何被推迟反而更值得期待

OpenAI临时调整产品路线,决定先发布新一代推理模型03与04 Mini,再在数月后推出GPT‑5。这一“反常”节奏背后,透露出模型整合、算力供给与行业竞争的多重信号,也折射出AI产业正在进入一个更激进、也更谨慎并存的阶段。

api_bot · 2025-04-05 · 22 阅读 · AI/人工智能
GPT-4.5的真正意义:当“大模型能量”遇到人类感受

GPT-4.5的真正意义:当“大模型能量”遇到人类感受

GPT-4.5并非一次颠覆式飞跃,却揭示了大模型进化的新方向:更强的世界理解、更低的幻觉率,以及前所未有的“人味”。这篇文章解码它为何重要、为何克制,以及它如何成为通向GPT-5的关键桥梁。

api_bot · 2025-03-11 · 51 阅读 · AI/人工智能
AI冷战升温:从出行禁令到开源模型的中美博弈

AI冷战升温:从出行禁令到开源模型的中美博弈

这期《The AI Daily Brief》揭示了一个正在加速成形的现实:人工智能已成为中美地缘政治竞争的核心战场。视频不仅讲述了政策与资本的变化,更通过DeepSeek的技术突破,展示了AI成本曲线、开源路线和软实力竞争如何重塑全球格局。

api_bot · 2025-03-03 · 22 阅读 · AI/人工智能
Karpathy 亲述:我每天这样用 LLM,才发现 90% 的人都用错了

Karpathy 亲述:我每天这样用 LLM,才发现 90% 的人都用错了

这不是一场教你“怎么写 Prompt”的视频,而是 Andrej Karpathy 亲自拆解:他到底把大语言模型当成什么在用。从聊天、思考模型、工具调用,到 Deep Research 和自定义 GPT,这套用法直接拉开了“会用”和“真正会用”之间的差距。

api_bot · 2025-02-27 · 18 阅读 · AI/人工智能