最新下载
热门教程
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 9
- 10
阿里千问3.7编程能力超GPT/Gemini,全球第二仅次Claude
时间:2026-05-30 12:09:01 编辑:袖梨 来源:一聚教程网
5月26日凌晨,全球三方编程榜单Code Arena正式放榜,阿里最新旗舰模型Qwen3.7-Max以1541分的高分,一举超越GPT-5.5、Gemini-3.5-Flash等众多模型,在大模型厂商中排名全球第二,仅次于Claude系列。
这次成绩确实挺有分量

咱们仔细看看这个榜单,Claude系列依然是编程领域的“天花板”,但阿里千问3.7的编程能力已经踩在了它的脚下。GPT-5.5和Gemini-3.5-Flash这些国际顶尖模型都被甩在了后面,这个排名说明国内模型在编程细分赛道上的实力真的不容小觑。凭什么千问3.7能拿第二?靠的就是硬邦邦的分数和实打实的代码能力。
编程能力为什么这么重要?

其实这背后反映的是模型对逻辑推理和代码生成的理解深度。编程场景不像聊天,它要求模型精准识别问题、生成可运行的代码块。千问3.7-Max能拿下1541分,本身就证明了它在处理复杂编程任务时,已经具备了全球第一梯队的水准。这难道不是说明千问3.7在编程场景下已具备全球顶尖实力吗?
超越GPT和Gemini意味着什么?
GPT-5.5和Gemini-3.5-Flash都是各自公司的最强版本,千问3.7能压过它们一头,意味着阿里在模型架构优化和训练数据策略上找到了更优解。这次排名不是偶然的爆发,而是研发团队持续投入的结果。可以说,千问3.7的编程能力已经成为阿里AI的一张名片。
Claude系列为何依然坚挺?
Anthropic的Claude系列在编程领域一直以扎实著称,这次守住第一并不意外。但千问3.7能紧随其后,已经把差距拉到触手可及的范围。下次榜单更新咱们或许能看到更激烈的争夺,毕竟阿里千问3.7的编程能力已经用分数证明,它有能力向顶级的Claude发起挑战。
全球AI竞赛中,编程这条赛道已经杀红了眼
从Code Arena的排名可以看出,大模型厂商在编程能力上的军备竞赛越打越烈。阿里千问3.7拿下的全球第二,不仅是个名次,更是一个信号——中国AI模型在硬核技术指标上,确实能与世界最强掰手腕。接下来就看各家如何迭代,把分数再往上推了。
相关文章
- PHP网站设计如何实现分页显示功能_PHP分页功能实现方法【交互】 05-30
- 索拉斯塔2配置要求详解 索拉斯塔2最低配置与推荐配置全面解析 05-30
- 视频号发完评论如何删除 05-30
- HalluWorld:基于参考世界模型的大模型幻觉受控基准 05-30
- 燕云十六声飞天舞怎么做 飞天舞河西地图沙漠区域 05-30
- DECOR:基于信息操纵理论细粒度审计大语言模型欺骗 05-30