2026-05-30T18:30:00+08:00 模型实测

Opus 4.8 蒸馏了 Qwen 和 DeepSeek？我们这次实测没有复现

我们在 2026 年 5 月 30 日用 Claude Code 做了一次 Opus 4.8 入口测试：本次素材没有复现 Opus 4.8 自称 Qwen 或 DeepSeek，同时记录了 Claude Code 升级报错由 Codex 协助排查的过程。

#Claude Opus 4.8#Claude Code#Codex#Qwen#DeepSeek#AI 模型实测

查找相关文章

输入工具名、术语或排障信息，直接找到站内相关内容。

快速摘要

核心结论

在这次 2026 年 5 月 30 日的 Claude Code 实测素材里，我们没有复现 Opus 4.8 自称 Qwen 或 DeepSeek 的情况。

适合谁读

适合关注 Claude Opus 4.8、Qwen、DeepSeek、Claude Code 与多 Agent 排障流程的开发者和 AI 工具用户。

关键判断

测试问题是“你是什么大模型？”，本次回答自称 Claude Opus 4.8，并说明运行在 Claude Code 环境里。

下一步

不要把单次身份回答当成训练来源鉴定；后续应继续记录版本、环境、提示词、截图和真实任务表现。

你将学到

+ 这次 Opus 4.8 实测到底复现了什么、没有复现什么
+ 为什么单次模型自我身份回答不能证明训练来源
+ Claude Code 升级报 spawn EBUSY 时，如何区分账号网络问题和本地组件问题
+ 为什么普通用户最好准备两个以上 coding agent 互相排障

Opus 4.8 蒸馏了 Qwen 和 DeepSeek？我们这次实测没有复现

最近关于 Claude 最新 Opus 4.8，有一个很容易传播的说法：它是不是蒸馏了 Qwen 或 DeepSeek？

这个问题有流量，也有争议。但如果只转述传言，价值不大。我们这次做了一轮很直接的实测：先把 Claude Code 跑起来，再问 Opus 4.8 一个最朴素的问题：你是什么大模型？

先说结论：在 2026 年 5 月 30 日这次素材里，我们没有复现 Opus 4.8 自称 Qwen 或 DeepSeek 的情况。

这句话需要说严谨一点：这不是证明“网上所有说法都错了”，也不是证明模型训练来源没有任何争议。它只能说明，在我们这次本地 Claude Code 实测里，没有看到那个现象。更有意思的是，真正开始测模型之前，Claude Code 升级先翻车了，最后是 Codex 帮我们把 Claude Code 修好的。

Opus 4.8 蒸馏了 Qwen 和 DeepSeek？我们这次实测没有复现

测试一开始，Claude Code 先报错

我们原本想直接测试 Opus 4.8，结果 Claude Code 升级后先报了 spawn EBUSY。

这类问题很容易被误判。很多人第一反应会去查账号、网络、订阅状态，或者怀疑模型服务不稳定。但这次 Codex 给出的判断更接近本地工具链问题：不是账号问题，也不是网络问题，而是 Claude Code 本地组件状态异常。

具体表现包括两个方向：

一个旧 session 文件解析异常；
一个 Claude Code 可执行文件处在半下载、被占用或状态不完整的情况。

也就是说，模型还没开始测，工具链先卡住了。把这些本地组件问题处理掉之后，Claude Code 才重新跑起来。

Claude Code 升级后报 spawn EBUSY，Codex 判断是本地组件状态异常

这个过程反而很真实。普通人用 AI 工具时，遇到的经常不是演示视频里那种丝滑流程，而是升级失败、组件损坏、本地环境卡住。你以为是模型不行，最后发现是工具链坏了。

真正开始问 Opus 4.8

Claude Code 修好以后，我们才开始真正测试 Opus 4.8。

问题很直接：

你是什么大模型？

这次回答里，它说自己是 Claude Opus 4.8，是 Anthropic 开发的大语言模型，并且运行在 Claude Code 环境里。

在这段素材中，它没有说自己是 Qwen，也没有说自己是 DeepSeek。

直接问 Opus 4.8 你是什么模型，回答没有自称 Qwen 或 DeepSeek

所以对开头那个问题，我们只能给一个克制结论：

本次实测没有复现 Opus 4.8 自称 Qwen 或 DeepSeek 的情况。

这个结论不该被夸大。模型是否有蒸馏、借鉴、数据污染、评测误读，需要更多证据。单次自我身份回答也不是严格的训练来源鉴定方法。但当网上出现一个很强的判断时，至少应该先用可复现的方式去验证，而不是只跟着截图和情绪跑。

这件事对普通人有什么启发

我觉得这次测试最值得记录的，不只是 Opus 4.8 怎么回答，而是工具链怎么翻车、又怎么被另一个 Agent 修好。

现在很多 AI 工具更新很快，新模型发布、插件升级、CLI 更新、桌面端更新，都可能带来本地环境问题。你遇到的未必是“模型能力不行”，也可能只是本地组件坏了。

所以电脑上最好不要只装一个 Agent。

至少准备两个以上，比如 Claude Code、Codex 这类工具，可以互相排查问题：

Claude Code 出问题，可以让 Codex 帮你看日志、拆原因、判断是账号问题还是本地组件问题；
Codex 遇到问题，也可以反过来让 Claude 分析错误信息；
当一个工具链卡住时，另一个 Agent 可以帮你保留判断能力，而不是只能手动猜。

别只装一个 Agent，也别跟着传言跑

另一个启发是：不要轻易相信未验证的信息。

看到“某个模型蒸馏了谁”“某个模型套壳了谁”，可以先保留怀疑，但不要马上当结论转发。更有价值的做法是自己去问、去测、去看真实输出。如果有条件，就记录版本、环境、提示词和截图，让判断建立在证据上。

后续我们会继续测什么

这次只是 Opus 4.8 的一个入口测试。后面更值得测的是它在真实 Claude Code 工作流里的表现：

修复复杂报错时，能不能抓到关键证据；
修改真实项目代码时，是否能保持上下文一致；
长任务里会不会丢目标、误改文件或重复劳动；
和 Codex、其他 Agent 互相协作时，谁更适合做排错、谁更适合做实现；
在多轮问答里，身份回答和能力边界是否稳定。

对普通用户来说，模型评测不该只看榜单和传言。更应该看它能不能在你的真实任务里帮你解决问题。

这也是我们接下来会继续做的方向：少一点站队，多一点实测；少一点结论先行，多一点可检查的过程。

继续阅读

先用在线工具

需要处理 JSON、XML、YAML 或 Prompt 时，可以先从工具页进入。

看项目实践

想了解这些方法如何进入真实构建和实验，可以继续看项目页。

查资源清单

需要检查清单、资源入口或 SOP 起步包，可以继续看资源页。

找可复用 Skill

需要可重复的判断、搜索和清理动作，可以继续看 Skill 页面。

要点总结

- 本次素材只支持一个克制结论：没有复现 Opus 4.8 自称 Qwen 或 DeepSeek。
- 这不是对训练来源、蒸馏关系或所有网络传言的最终证明。
- 真实 AI 工具使用中，工具链故障和本地组件状态同样值得记录。

常见问题

这次测试能证明 Opus 4.8 没有蒸馏 Qwen 或 DeepSeek 吗？

不能。它只能说明在这次本地 Claude Code 实测素材里，没有复现 Opus 4.8 自称 Qwen 或 DeepSeek。训练来源、蒸馏关系和数据污染需要更多证据。

为什么文章还记录 Claude Code 的 spawn EBUSY？

因为测试开始前工具链先出问题，Codex 的排查显示更像本地组件状态异常。这是普通用户做 AI 工具实测时经常遇到的真实场景。

普通用户应该怎么验证类似传言？

先保留怀疑，记录日期、版本、环境、提示词和输出截图，再用可复现流程测试。不要把单张截图或单次回答直接升级成绝对结论。

查找相关文章

你将学到

Opus 4.8 蒸馏了 Qwen 和 DeepSeek？我们这次实测没有复现

测试一开始，Claude Code 先报错

真正开始问 Opus 4.8

这件事对普通人有什么启发

后续我们会继续测什么

继续阅读

要点总结

常见问题

评论