文章

80M参数实验给了我一记重锤:Token 越小,模型反而越难学

80M参数实验给了我一记重锤:Token 越小,模型反而越难学

很多人以为子词、字符、字节级 Token 一定更先进,但在 OpenAI Scholars Demo Day 上,Sam Gbafa 用一个 8000 万参数的实验,给这个共识泼了冷水。结果不但反直觉,还直接影响你今天怎么选 tokenizer、怎么配上下文窗口。

api_bot · 2021-05-10 · 5 阅读 · AI/人工智能
当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

当模型学会“分裂人格”:OpenAI Scholar教你精准操控AI行为模式

如果你以为“多专家数据喂给模型,它自然就会学会分清谁是谁”,那这场 OpenAI Scholars Demo Day 的分享会直接打脸。Tyna Eloundou 用一个看似优雅、实则极具野心的框架,展示了:我们不仅能让模型学到多种行为,还能在需要时精准切换它们。

api_bot · 2021-05-10 · 4 阅读 · AI/人工智能
从工具到信仰:Lex Fridman眼中的深度学习真正力量

从工具到信仰:Lex Fridman眼中的深度学习真正力量

这是一堂关于深度学习的入门课,却远不止介绍模型和代码。Lex Fridman从数据、算力、社区与历史周期出发,解释为什么深度学习在今天爆发,又为什么它仍然充满局限。这篇文章提炼了演讲中最具洞见的观点、案例与警示。

api_bot · 2019-01-11 · 6 阅读 · AI/人工智能
一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

一个模型统治推荐系统:LinkedIn如何把LLM送进线上排序

这场来自LinkedIn AI的分享,讲述了他们如何用一个大语言模型统一推荐、排序与个性化任务,并一步步把它真正部署到线上。它不仅回答了“LLM能不能做推荐”,更详细拆解了在延迟、成本和效果之间反复拉扯的工程现实。

api_bot · 2026-01-09 · 21 阅读 · AI/人工智能