DeepSeek V3.1低调发布：中国大模型走向“一体化”的信号

AI PM 编辑部 · 2025年08月21日 · 11 阅读 · AI/人工智能

AI绘画文本生成图像上下文窗口开源模型推理多模态代码生成 AI应用大语言模型 DeepSeek

正在加载视频...

视频章节

这支来自《The AI Daily Brief》的短视频，看似是一次常规模型更新播报，却意外揭示了中国大模型厂商正在发生的重要转向：从多模型并行，走向单一、整合的产品路线。DeepSeek V3.1的发布、阿里Qwen ImageEdit的开源亮相，以及Databricks的百亿美元融资，共同勾勒出2025年AI产业竞争的新轮廓。

DeepSeek V3.1低调发布：中国大模型走向“一体化”的信号

这支来自《The AI Daily Brief》的短视频，看似是一次常规模型更新播报，却意外揭示了中国大模型厂商正在发生的重要转向：从多模型并行，走向单一、整合的产品路线。DeepSeek V3.1的发布、阿里Qwen ImageEdit的开源亮相，以及Databricks的百亿美元融资，共同勾勒出2025年AI产业竞争的新轮廓。

为什么DeepSeek V3.1“并不炸裂”，却依然重要

从参数规模或版本号看，DeepSeek V3.1并不像一次足以震动行业的大更新。这正是它容易被低估的原因。但如果把时间拨回到年初，DeepSeek R1推理模型因“免费、可见推理链、消费者级App体验”而迅速登顶美国应用榜，甚至“把华尔街吓了一跳”，你就会明白，外界真正等待的是R2，而不是一个0.1版本的V系列。

V系列是DeepSeek的非推理基础模型，用来作为各种能力的底座。V3.1的参数规模从6710亿提升到6850亿，继续采用Mixture of Experts（混合专家）架构；官方提到“更长的上下文窗口”，但实际仍是128k，与V3一致。这种看似克制的升级节奏，反而让不少人困惑：如果性能没有跨越式提升，意义何在？

正是在这种“落差感”中，视频给出了一个关键洞见：DeepSeek可能并不想靠一次性能爆点取胜，而是在为更大的结构性变化铺路。这种变化不是算力，而是产品形态。

性价比才是杀手锏：68倍成本差的现实冲击

尽管版本号低调，V3.1在基准测试中的表现却并不弱。视频中提到，在IDER Polyglock代码基准测试中，V3.1拿到71.6%的成绩，比Claude Opus 4的非推理模式还高1个百分点。但真正让研究者侧目的，是成本：DeepSeek的推理成本“便宜了68倍”。

在当前大模型竞争中，单纯追求SOTA分数已经很难形成决定性优势，尤其是在企业和开发者侧。性能与成本的比值，正在变成新的主战场。正如主持人隐含的判断：这不是一个为炫技而生的模型，而是一个为规模化使用而设计的模型。

更重要的是，V3.1是DeepSeek第一个“混合模型”，在同一个模型中同时支持聊天、推理和代码生成。研究者注意到，它引入了专门的token来支持推理与搜索。这让人开始猜测，DeepSeek是否会像OpenAI一样，逐步放弃“推理模型 / 非推理模型”的双轨命名和维护方式。

“悄悄移除R1”：一次战略整合的信号

真正引发讨论的，并不是跑分，而是DeepSeek的产品入口变化。记者Po在社交平台上写道：“DeepSeek悄悄移除了R1标签，现在所有入口都默认V3.1。看起来不再是多个公开模型，而是战略性整合。”他将其解读为“对LLM竞赛中碎片化风险的中国式回应”。

这背后是一种极具现实感的判断：在中国高度竞争的AI市场，维护多条模型线的成本极高，而品牌区隔的价值却有限。整合，意味着先稳定一个统一底座，再逐步扩展能力。一位DeepSeek粉丝账号也呼应道：“我早就说过，他们讨厌维护独立的模型线，会尽快把一切合并成一个产品。”

当然，并非所有人都买账。中文社区账号Ace Taffy直言：“如果V3.1不是在为V4铺路，那我真看不出意义，因为除了token用量更低，整体推理能力并没有提升。”这种失望情绪，与GPT‑5发布后的舆论反应颇为相似。正如另一位评论者调侃的：“DeepSeek没怎么宣传，但却遭遇了‘OpenAI式的后GPT‑5待遇’。”

不止DeepSeek：中国AI的另一条战线正在打开

视频的后半段，把视角拉回整个中国AI生态。阿里巴巴Qwen团队发布了开源图像编辑工具Qwen ImageEdit，基于其月初发布的图像模型。它支持通过文本进行“Photoshop式”的精细编辑，类似OpenAI和Google的图像编辑模式。

初期反馈集中在两个词上：细节和胆量。研究员Junyang Ling放话称，它“可以移除一根头发丝级别的细节”。主持人半开玩笑地说，即便这有夸张成分，“也得佩服这种来自模型构建者的自信”。

与此同时，Databricks正在完成一轮约10亿美元的新融资，估值跃升至1000亿美元，比去年12月的620亿美元上涨约60%。CEO Ali Ghodsi在接受《华尔街日报》采访时表示，最近一个月投资人“每天都在找上门来”，而两个月前还不是这样。视频用这一对比提醒观众：即便公开市场情绪波动，私募资本对AI基础设施的热情依然高涨。

总结

这期《AI Daily Brief》并没有一个单一的爆点，却串起了一条清晰的趋势线：从DeepSeek的模型整合，到阿里Qwen的开源进攻，再到Databricks的资本追捧，AI竞争正在从“谁更强”转向“谁更稳、谁更便宜、谁更容易规模化”。对从业者而言，真正值得关注的，或许不是下一个版本号，而是这些公司正在悄悄改变游戏规则的方式。

关键词： DeepSeek V3.1，大语言模型，模型整合， Qwen ImageEdit， AI融资

事实核查备注： DeepSeek V3.1参数规模：6850亿；V3为6710亿；上下文窗口：128k；IDER Polyglock代码基准：71.6%；对比模型：Claude Opus 4（非推理模式）；成本差异：约68倍；Qwen ImageEdit为阿里巴巴Qwen团队开源工具；Databricks新一轮融资约10亿美元，估值约1000亿美元；投资方包括Thrive Capital、Insight Partners、Andreessen Horowitz。

返回文章列表