刚刚!Claude 彻底断更,但被这个国产模型超越只是时间问题

大新闻!美国顶级大模型Claude几个小时前更新条款,自己看吧,打出来过不了审🥲

Image

原文:https://www.anthropic.com/news/updating-restrictions-of-sales-to-unsupported-regionsClaude

这么做,明显就是眼看自己的地位不保,赤裸裸地把科技商业上升到政治问题寻求政客的庇护。

其实,它们(包括OpenAI之流)早已形成科技反华联盟,只是大家都觊觎中国市场,并没把路走绝。

但今天Claude耐不住了。

海外有一个叫Design Arena的平台,通过真人测评的方式对模型和工具进行排名。

如果我们把条件设为「开源」,就会发现,TOP15 都是中国的大模型

Image

Image

换句话说,中国大模型已经走通了开源、迭代升级的路子,性能越来越强,赶超美国顶级大模型已经是时间问题。

所以如果有一天美国大模型集体禁止中国使用的话,我们能用什么呢?

是时候重新认识优秀的国产大模型了

8 月的时候我在 X 上分享过我目前的 AI编程解决方案:

但其实,上个月以来饼干哥哥业务中用 Claude的含量已经很小了,一方面是明显感觉到它已经降智了,本来还想专门写一篇内容来吐槽讲解决方案的,现在看来已经没必要了

另一方面是国产模型足够优秀了,尤其是 Kimi、GLM、DeepSeek在 AI编程上,与 Claude4 的差距在不断缩小,尤其是 Kimi K2 正好今天发布了版本更新,性能已经快到 95% 了,甚至在部分能力上已经超越 Claude

接下来就给大家介绍这些国产的优秀大模型们,它们都能直接接入 Claude Code 工具里,发挥出最强实力。

月之暗面 - Kimi

Image

月之暗面(Moonshot AI)最早是在长文本处理技术上处于世界领先水平而闻名。

现在最新的旗舰大模型是 Kimi K2

正如前面所说,Kimi今天更新的版本号是 Kimi-K2-0905

在 Agentic Coding(调用工具执行任务更少报错)、前端审美、上下文长度(从128k 提升到256k)、速度(最高达100Token/秒)上都有不错的优化。

等饼干哥哥周末有空来跑实战项目案例来测一下,但目前从一些朋友的反馈上看,Kimi-K2-0905已经稳居国产第一了,是目前替代 Claude 4 的最佳方案。

官方文档入口:

🔗 https://platform.moonshot.cn/docs/introduction

智谱 - GLM

Image

智谱AI(Zhipu AI)已成为估值超过200亿人民币的大模型独角兽企业,最强大的模型是GLM-4.5

实用下来,整体的速度、工具调用等表现都不错,很稳定

官方文档入口:

🔗 https://docs.bigmodel.cn/cn/guide/develop/claude

深度求索 - DeepSeek

深度求索(DeepSeek)可谓是国产之光,在今年春节的时候,因低成本、高效能的特性风靡全球出圈,说它凭一己之力拉低全球 AI 使用成本也不夸张。

目前最强大的旗舰模型是DeepSeek-R1,而专门用于编程的是 v3 系列,上个月更新到了v3.1版本,在审美上一直都很优秀。

据说下一代 R2 会采用国产芯片,面向 Agent 开发,能执行更复杂的操作。

官方文档入口:

🔗 https://api-docs.deepseek.com/zh-cn/guides/anthropic_api

阿里 - Qwen

阿里就不用多介绍了,可谓是 AI 领域最有实力的玩家。

它的旗舰模型 Qwen3,也频频出圈,模型分支很多,其中专注做编程的是 Qwen3-Coder

官方文档入口:

🔗 https://qwenlm.github.io/zh/blog/qwen3-coder/

各模型实战能力

饼干哥哥一直在关注和测评国内大模型的能力,想具体了解它们的排位和实战效果可以看我往期分享:

最新的是这篇 8 月 28日的

用Claude Code+sub-agents做全栈开发:国产AI 编程四大金刚测评,天花板在哪?

当时的结论是:GLM4.5 > DeepSeek v3.1 > Kimi k2 ≈ qwen3-coder

正好智谱推出包月计划,每个月 20 元就可爽用 GLM4.5,专业玩家建议上 100 元套餐,无痛平替 Claude4 网址:https://zhipuaishengchan.datasink.sensorsdata.cn/t/2w

Image

还有不同场景下的测评,也能看出不同模型在实践场景中的落地性能如何:

7000字深度对比Claude4、Kimi k2和云听AI,谁才能真正在商业洞察落地?

两句话,让Claude Code+Kimi K2 跑了3小时爬完17个竞品网站、做了一份深度市场数据分析报告

GLM-4.5 发布,50块钱包月爽玩。六大模型混战测评,谁能一键生成“真·可用”的应用?

说实话,目前国产大模型想100% 替代Claude的能力还不现实。

但饼干哥哥大胆猜测,按这个发展速度,今年就会有国产大模型超越 Claude 了,你们觉得是哪家呢?

欢迎打在评论区,一起见证AI反超美国的奇迹时刻。

微信:dszb199