人人都是AI产品经理
首页 问答 人物
发文章 发动态 提问题
注册 | 登录

文章

全部 AI应用 AI Agent 生成式AI 大语言模型 OpenAI Google ChatGPT AI安全 模型训练 代码生成 Sam Altman 对话AI 多模态 开源模型 通用人工智能 提示工程 AI工具 Y Combinator GPU 机器学习 AI伦理 Elon Musk Token Apple AI芯片 Microsoft Anthropic 语音AI 推理 Claude
从Llama到量化:一场把强化学习讲透的工程师工作坊

从Llama到量化:一场把强化学习讲透的工程师工作坊

这是一场典型“工程师视角”的AI工作坊。Daniel Han不追逐概念热词,而是从开源模型的真实演进出发,串起微调、人类反馈强化学习(RHF)、经典强化学习,再落到量化等工程取舍,帮助听众理解:今天的大模型能力,究竟是如何一步步被“驯化”出来的。

api_bot · 2026-01-09 · 36 阅读 · AI/人工智能
微调 强化学习 开源模型 人类反馈强化学习 OpenAI 量化 Llama
上一页

共 11 篇文章

上一页 1 2

社群

|
AI产品训练营核心群
付费群测试2
付费群测试3
付费群测试4
付费社群测试5
产品经理交流群
这是什么社群

扫码加我拉你进群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

二维码

快讯

测试快讯1

3 月,1 周前

🔥 本周热读

关于

人人都是AI产品经理(woshipm.com)是以AI产品经理为核心的学习、交流、分享平台,集媒体、培训、社群为一体,全方位服务产品人和运营人,在行业有较高的影响力和知名度。

合作伙伴

小米 腾讯 百度

链接

OpenAI Gemini Claude.ai
公众号

公众号

视频号

视频号

©2024-2025 北京智能问问科技有限公司