阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

🤖 AI总结

主题

关于阿里通义千问大模型Qwen3.6-Plus的发布及其在AI编程领域的应用评测。

摘要

阿里发布Qwen3.6-Plus大模型,其强大的Agentic Coding与原生多模态能力正重新定义编程,并以高性价比加速AI开发普及。

关键信息

  • 1 Qwen3.6-Plus具备强大的Agentic Coding能力,能独立完成从需求理解到代码交付的全流程。
  • 2 模型拥有原生多模态理解能力,支持视觉智能体编程和超长上下文处理。
  • 3 阿里通过极具竞争力的定价策略和快速的产品迭代,推动AI编程的普及和应用。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

Anthropic前段时间出了一份《2026 Agentic Coding Trends Report》,预测就在今年,开发者会从写代码的人变成指挥AI写代码的人。

最近流行一个说法,Agentic Coding:让AI不只帮你写代码,而是直接帮你把活干了。

你只要说清楚想要个什么东西,AI自己去理解、拆解、写代码、测试、改bug,直到交付一个能用的成品。

然后,就在这个全行业卷编程的节骨眼上,阿里发布了他们最新的大模型,Qwen3.6-Plus。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

我的第一反应是:3.5不是春节才出的吗,前几天还刚出了个3.5-Omni,迭代速度简直是二倍速。

而且还不只是这一个模型,过去这一周,除了3.5-Omni,阿里还发了图像模型Wan2.7-Image,再加上这次的Qwen3.6-Plus,主打一个全面开花。

据说旗舰版Qwen3.6-Max也已经在路上了。

这次我不打算罗列Benchmark数据。

尽管Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2、NL2Repo等权威评测中,全面超越了GLM-5和Kimi-K2.5。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

整体水平,逼近Claude Opus 4.5。

我更想跟你聊聊,实测过程中让我印象深刻的那几个瞬间。

01

从Vibe Coding到Agentic Coding

这次真不是噱头

先聊最让我兴奋的部分。

4月2号凌晨,Qwen3.6-Plus刚上架阿里云百炼,我第一时间搞到了API Key。

二话没说,直接上了个硬核需求:做一个具备动态交互功能的Agent组织架构展示网站,要求包含动态粒子背景、响应式布局,并且在移动端要完美适配。

说实话,放以前,这种需求我得干到凌晨三点。

自己写Three.js的初始化代码、调相机参数、折腾粒子系统的性能优化,光调试就能耗掉大把时间。

但现在不一样了。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

我把需求丢给Qwen3.6-Plus,它没有急着输出代码,而是先给出了详细的任务拆解。

从技术栈选择(React + Three.js),到文件结构规划,再到核心功能模块的实现步骤。

然后开始自动生成代码,在这个过程中还主动调用了工具进行预览和测试。

整个流程,从输入需求到拿到一个可以直接运行的完整项目,全程我几乎没有写过一行代码。

Qwen3.6-Plus不仅完成了前端页面的开发,还实现了粒子系统的动态效果和完整的交互逻辑。这让我挺震撼的。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

几年前的Vibe Coding,说白了还是辅助性质的。你描述需求,AI生成代码片段,然后你需要自己把这些片段拼接起来,调试修复bug,反复折腾好几轮才能跑起来。

但现在,Qwen3.6-Plus展现出的Agentic Coding能力,是真的在试图替代整个开发流程。

它不只是帮你写代码,而是直接帮你把活干了。

只需要说清楚你想要什么,它自己去理解、拆解、写代码、测试、改bug,直到交付一个能用的成品。

这就是Agentic Coding的核心价值。

GitHub上已经有开发者把Qwen3.6-Plus接入Copilot替代品中使用,反馈最多的是终于不用在GPT-4和Claude之间来回切换了。

侧面说明,Qwen3.6-Plus确实达到了一个可以日常最强使用的水平。

让Qwen3.6-Plus结合我的个人数据、全网信息,设计一个个人网站。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

一轮对话,耗时3分钟左右,消耗0.5万个token,约等于0.15元。

网页完成度相当不错。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

还有个细节值得一说。

Qwen3.6-Plus默认支持100万token的超长上下文窗口,最大输出可达65536 tokens。

这意味着你可以一次性把整个代码仓库丢给它,它能理解跨文件的依赖关系,完成仓库级的复杂重构任务。这种能力在过去是只有Claude等顶级模型才能做到的。

以前,做大规模代码重构,你可能需要手动分析几百个文件的依赖关系,小心翼翼地改,生怕改崩了。

现在,你可以把整个项目交给AI,它能自己读代码、分析依赖、规划改动路径、逐步实施、测试验证,最后交付一个经过测试的重构版本。

如果你现在去阿里云百炼上调用Qwen3.6-Plus,每百万token输入最低只要2元。

相比Claude Opus 4.6每百万token输入5美元、输出25美元的价格,Qwen3.6-Plus的性价比确实非常有竞争力。

我在实测中完成上述那个复杂的3D网页项目,总共花费不到1块钱。

这种成本优势,让大规模应用AI编程变得真正可行了。

02

原生多模态,给Agent装了双眼睛

如果说Agentic Coding是Qwen3.6-Plus的大脑,那原生多模态理解就是它真正的眼睛。

以前的多模态模型,大多是后期拼接视觉模块的方案。

也就是说,模型在处理文字和图片时,用的是两套不同的机制,然后再把结果拼在一起。

这种方式的问题是,模型很难真正理解图片和文字之间的关系,就像一个人用左眼看图、右眼读字,两只眼睛看到的没法真正融合在一起。

但Qwen3.6-Plus不一样。

它基于原生多模态数据训练,从底层就把视觉和语言能力融合在了一起。

我测试了视觉智能体编程的场景。

随便找了一张设计稿截图丢给模型,告诉它按照这个设计稿的风格,生成一个AI异类弗兰克个人网页展示页面。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

模型不仅准确地提取了设计稿的色彩风格、布局结构,还自主完成了代码生成、样式调整和交互实现。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

官方Demo中有一个很有意思的测试:让Qwen3.6-Plus规划从北京大兴机场到北京首都机场的最快路线。

我按照同样的方法测试了一下,模型的方案与高德地图上的最快路径完全一致。

这说明模型能够理解真实世界的空间关系和交通网络,不只是简单地从文本中查找答案。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

还有更进阶的应用。

有网友实测上传了一段200多兆的视频,视频里他一边滚动网站页面,一边用非常口语化甚至抽象的语言描述需要的功能和特效,连帅不帅这样的词都用上了。

Qwen3.6-Plus读完视频后,按照描述成功复刻出了高度相似的效果,甚至连进入专业评选这样的需求都准确实现了。

以前,最头疼的就是怎么把自己的想法翻译成纯文本告诉AI,术语太多,精确描述一件事和写论文没什么区别。

现在,当多模态能力,让Qwen3.6-Plus能看到一切、读取一切,普通的vibe coding就已经黯然失色了。

这种打通了看懂界面到生成代码再到调用工具完成修改的完整链路,我觉得才是未来AI开发真正的方向。

03

价格屠夫又回来了,这次是认真的

说实话,阿里这次在定价上挺狠的。

Qwen3.6-Plus已上架阿里云百炼,每百万token输入最低2元。

API原价是4元每百万输入tokens、12元每百万输出tokens,目前有限时5折优惠。

即使按原价算,也远低于Claude Opus 4.6的5美元每百万输入、25美元每百万输出的定价。

按当前汇率换算,价格不到Claude的十分之一。

这还不是全部。

Qwen3.6-Plus已经登陆悟空、Qoder等阿里AI应用和平台,普通用户可以直接免费体验。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

我实测完成了上面提到的那个3D网页项目,总共才消耗了不到两块钱。

有开发者做了个简单的成本测算:如果你每天用Qwen3.6-Plus完成10个中等复杂度的编程任务,日均花费可能不到5元。

相比之下,如果用Claude Opus 4.6完成同样的工作量,日均花费可能高达几百元。

这种成本差异,对于独立开发者、初创团队、学生开发者来说,意义不言而喻。

而且阿里这次的定价策略,显然不只是为了打价格战。

从商业逻辑来看,更低的使用门槛意味着更多的开发者和企业愿意尝试和接入,从而积累更多的使用数据和反馈,反过来推动模型的持续优化。

这是一个正循环。

Qwen 3.5是2026年2月发布的,不到两个月时间,Qwen已经演进到3.6,迭代速度明显加速。

而Qwen3.6-Plus还只是系列的首款模型,性能更强的旗舰版Qwen3.6-Max也将于近期发布,系列后续还将开源其他尺寸的模型。这种多尺寸覆盖的策略,让不同需求的用户都能找到合适的选择。

这种快速迭代和全面的布局,正说明千问不再是以前那个只靠单一模型打天下的选手了。

04

不只是模型,阿里正在织一张更大的网

过去这段时间,阿里在AI领域的动作密集得有点让人应接不暇。

3月30日,国产最强全模态大模型Qwen3.5-Omni发布;

4月1日,国产最佳图像生成与编辑统一模型Wan2.7-Image发布;

4月2日,Qwen3.6-Plus上线。三个模型覆盖多模态、图像生成、编程、Agent等不同领域,每个都在各自领域达到SOTA水平。

Wan2.7-Image值得单独说两句。

这个模型直击当前AI生图领域的痛点,解决了标准脸审美疲劳和色彩盲盒等问题,实现了千人千面,能捏出活人感,还支持Hex色值精准调色、3K Token超长文本印刷级渲染。

更重要的是,Wan2.7-Image已经支持Skill调用,让龙虾画画成为现实,全面解锁了生成模型的应用场景。

不过,模型能力只是故事的一部分。

真正让我觉得有意思的,是阿里正在发生的一场组织变革。

阿里成立了ATH(Alibaba Token Hub)事业群,目的是增强从大模型到AI应用的协同。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

这次模型连续发布,阿里内部重点推的AI产品如悟空、qoder等应用第一时间接入,说明协同效应正在生效。

换句话说,阿里终于不只是埋头做模型了,他们在认认真真地思考怎么让模型真正用起来。

这种从实验室到产业化的跨越,对于千问的未来生态建设来说,可能比模型本身的能力提升更加重要。

说了这么多,我想分享几个更深层的判断。

第一,Agentic Coding正在重新定义编程这件事本身。以前,写代码是程序员的核心工作;现在,写代码正在变成AI的工作,而程序员的核心价值正在转向需求理解、系统设计、架构决策和结果验收。

第二,多模态能力正在成为AI Agent的标配。纯文本模型的天花板已经越来越明显。未来的AI Agent需要能够理解这个世界,而这个世界是图文并茂、声色俱全的。

原生多模态训练带来的理解深度,是后期拼接方案难以企及的。Qwen3.6-Plus在视觉智能体编程上的尝试,就是沿着这个方向迈出的重要一步。

第三,国产AI正在从追赶者变成定义者。在SWE-bench等权威评测中,Qwen3.6-Plus已经超越了参数规模是其2至3倍的GLM-5和Kimi-K2.5,逼近Claude Opus 4.5。

阿里Qwen3.6-Plus,Agentic Coding掀了硅谷的桌子

说明国产模型在算法效率和工程实现上已经有了质的突破,不再是单纯靠堆参数来提升性能。这种以小胜大的能力,才是真正体现技术实力的地方。

期待千问能继续保持这种快速迭代的节奏,用更短的时间缩小与Claude的差距。

也期待Qwen3.6-Max发布时能带来更多惊喜,特别是在更复杂的Agent任务和多模态推理上实现突破。

更期待阿里的ATH事业群能把模型、应用、生态真正打通,让千问不只是实验室里的标杆,更是开发者手中真正好用的工具。

AI编程的浪潮已经来了,而且这次,是真的可以动手了。

© 版权声明

相关文章