2025年三大AI模型对决：选对工具，比选最强模型更重要

AI PM 编辑部 · 2025年06月04日 · 16 阅读 · AI/人工智能

计算机视觉上下文窗口多模态代码生成生成式AI AI应用对话AI ChatGPT Claude Gemini

正在加载视频...

视频章节

Peter Yang通过一系列真实演示，对ChatGPT、Claude和Gemini在2025年的核心能力进行了正面对比。这不是一场“谁最强”的评测，而是一份清晰的使用指南：在不同场景下，如何选到最合适、性价比最高、最省心的AI。

2025年三大AI模型对决：选对工具，比选最强模型更重要

Peter Yang通过一系列真实演示，对ChatGPT、Claude和Gemini在2025年的核心能力进行了正面对比。这不是一场“谁最强”的评测，而是一份清晰的使用指南：在不同场景下，如何选到最合适、性价比最高、最省心的AI。

为什么“用例”比“排行榜”更重要

这场对比的出发点就很务实。Peter Yang在视频一开始就强调，他想做的是“一份超级实用的指南”，而不是参数或基准测试的比拼。他直言：“As you can see in this table， all three models are good at different things. But don't take my word for it.”这句话点出了核心方法论：AI已经进入高度分化阶段，脱离具体任务谈优劣，意义不大。

为了验证这一点，他设计了一组覆盖真实工作场景的测试：从程序员最关心的代码生成，到创作者每天都要面对的写作编辑，再到深度研究和多模态能力。重要的是，这些测试并非玩具示例，而是完整应用级别的需求，比如“做一个完整可玩的俄罗斯方块”，或者“生成一个可交互的3D太阳系”。这让结果具备了很强的参考价值。

贯穿视频的一个隐含观点是：2025年的AI选择，本质上是一个“工具组合”的问题。你不需要、也不应该只押注一个模型。真正拉开效率差距的，是你是否清楚在什么场景下切换到最合适的那一个。

代码生成实测：Claude为何频频胜出

代码能力是整个视频中对比最激烈、也最有戏剧性的部分。第一个测试是生成一款“功能完整、画面漂亮、可操作”的俄罗斯方块。结果非常直观：Claude几乎一次性生成了一个功能齐全、视觉精致的版本；ChatGPT能运行，但功能明显简化；Gemini整体可用，但在视觉和细节打磨上略逊一筹。Peter给出的结论很直接：在这个测试里，Claude是最强的。

接下来的3D太阳系模拟器进一步拉开差距。Claude生成的是一个“可交互、带教学属性”的模拟系统；ChatGPT的版本无法正常运行；Gemini虽然成功运行，但行星比例偏小，也缺乏解释信息。连续两次测试后，Claude在复杂前端和交互式应用上的优势已经非常明显。

高潮出现在Super Mario关卡复刻。Peter并没有一次性成功，而是通过多轮对话逐步逼近目标。最终，Claude在不借助外部工具的情况下，生成了一个包含物理效果、敌人和道具的可玩关卡。这一过程本身就是一个故事：它展示了Claude不仅能“写代码”，还能在上下文中持续理解目标、修正实现路径。

写作、研究与“个人化”：ChatGPT的隐藏优势

如果说Claude是代码场景下的明星，那么在写作和研究上，胜负就变得微妙起来。写作是Peter最常用的AI场景，他使用了一个高度结构化的编辑提示词来测试三款模型。结果是：Claude最接近他的个人写作风格；ChatGPT的输出偏短；Gemini则“过于啰嗦，而且明显跑偏”。因此，Claude被他选为“daily writing workhorse（日常写作主力）”。

但ChatGPT并没有在这一部分出局。相反，它在另一个维度展现了独特价值——记忆功能。Peter特别强调，ChatGPT能够记住长期偏好，这让它在自我反思、个性化建议和“残酷但诚实的反馈”方面几乎无可替代。他分享了自己常用的自省提示，认为这是Claude和Gemini目前都无法完全替代的能力。

在深度研究测试中，三者再次分化。Claude的报告简洁但偏泛；Gemini信息极其全面，却显得冗长；ChatGPT给出的则是“最可执行的战略总结”。在需要快速形成判断和行动方案时，ChatGPT成为最终胜出者。

成本、多模态与Gemini的性价比逻辑

在视频后半段，讨论从“能力”转向“现实约束”。Peter明确指出：Claude的成本显著高于Gemini，而Gemini在价格与性能之间取得了非常好的平衡，尤其是在上下文窗口更大的前提下。这让它在预算敏感型团队中极具吸引力。

Gemini Diffusion的演示是一个典型例子。Peter只用了极短时间，就生成了一个可运行的打砖块小游戏，整个过程几乎是“闪电式”的。这种“vibe coding”非常适合快速原型、简单应用和创意验证，而不是追求极致打磨的长期项目。

在多模态能力上，三者也各有所长：ChatGPT在图像和语音交互上体验成熟；Gemini在视频生成和实时摄像头理解上更突出；OpenAI Operator则展示了直接操作电脑的潜力。视频最后的总结非常克制：Claude适合高质量代码和写作，ChatGPT擅长个性化和研究，Gemini则在成本效率和视频能力上占优。

总结

这场对比最大的价值，不在于给出一个“年度最强AI”的答案，而是提供了一种清晰的选择框架。2025年的AI使用，更像是在搭建一套工具箱：用Claude攻坚复杂代码和高质量文本，用ChatGPT做深度思考和自我反馈，用Gemini完成低成本、快节奏的原型和多模态实验。真正成熟的使用者，不再纠结于站队，而是懂得在合适的时刻，切换到最合适的模型。

关键词： ChatGPT， Claude， Gemini，代码生成，多模态AI

事实核查备注：视频作者：Peter Yang；发布时间：2025-06-04；涉及产品：ChatGPT（OpenAI）、Claude（Anthropic）、Gemini（Google）；关键测试案例：俄罗斯方块、3D太阳系、Super Mario关卡复刻；功能点：ChatGPT记忆功能、Gemini Diffusion、上下文窗口、OpenAI Operator。

返回文章列表