
7月22日到24日,阿里依次发布最强推理模型Qwen3-235B-A22B-Instruct-2507(超过爆火的Kimi-k2),最强代码模型QWen3-Coder和翻译模型QWen3-MT。
(1) 推理模型Qwen3-235B-A22B-Instruct-2507

Qwen3-235B-A22B-Instruct-2507通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型
详情:

同时推出 Qwen3-235B-A22B 非思考模式(Non-thinking)更新版本,命名为Qwen3-235B-A22B-Instruct-2507。
(2) 代码模型QWen3-Coder
7月23日,阿里通义发布最具代理能力的代码模型QWen3-Coder。
其中,Qwen3-Coder-480B-A35B-Instruct, 480B 参数激活 35B 参数的 MoE 模型,原生支持 256K token 的上下文并可通过 YaRN 扩展到 1M token,拥有卓越的代码和 Agent 能力。

Qwen3-Coder 后训练阶段执行 Agent RL,鼓励模型通过多轮交互利用工具解决问题。在SWE-bench Verified 上实现了开源模型 SOTA 。
这个测试集是典型的Long-Horizon RL任务,模型需要在环境中不断交互,自主规划、选择工具调用、接受反馈不断做出新决策

同时,开源代理式编程的命令行工具:Qwen Code。
Qwen Code 基于 Gemini Code 进行二次开发,但进行prompt 和工具调用协议适配,使得 Qwen Code 可以最大程度激发 Qwen3-Coder 在 Agentic Coding 任务上的表现。
体验示例
Demo1:模拟烟囱拆除
Demo2:VS Code中生成烟花效果
Demo3:3D地球
Demo4:打字机效果
Demo5:小球沿立方体轨迹旋转
Demo6:模拟太阳系行星运转
Demo7:二重奏游戏
百炼 API 平台(https://bailian.console.aliyun.com/)调用 Qwen3-Coder
(3) 翻译模型Qwen-MT
7月24日,阿里又发布
机器翻译模型Qwen-MT,基于强大的 Qwen3 模型,进一步使用超大规模多语言和翻译数据对模型进行训练,全面增强其多语言理解与翻译能力,并结合强化学习技术,显著提升翻译结果的准确性与语言流畅度。核心亮点包括:
通过Qwen API(qwen-mt-turbo)体验又快又准的翻译技能。
百炼:https://bailian.console.aliyun.com/?tab=model#/model-market/detail/qwen-mt-turbo
参考: