阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

网易专栏2个月前发布 nxnqh

47 0 0

发布时间：2026-04-03 20:37:39

#AI | #Qwen3.6-Plus

来源：网易专栏作者：AI异类
🔗 查看原文

🤖 AI总结

主题

关于阿里通义千问大模型Qwen3.6-Plus的发布及其在AI编程领域的应用评测。

摘要

阿里发布Qwen3.6-Plus大模型，其强大的Agentic Coding与原生多模态能力正重新定义编程，并以高性价比加速AI开发普及。

关键信息

1 Qwen3.6-Plus具备强大的Agentic Coding能力，能独立完成从需求理解到代码交付的全流程。
2 模型拥有原生多模态理解能力，支持视觉智能体编程和超长上下文处理。
3 阿里通过极具竞争力的定价策略和快速的产品迭代，推动AI编程的普及和应用。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

Anthropic前段时间出了一份《2026 Agentic Coding Trends Report》，预测就在今年，开发者会从写代码的人变成指挥AI写代码的人。

最近流行一个说法，Agentic Coding：让AI不只帮你写代码，而是直接帮你把活干了。

你只要说清楚想要个什么东西，AI自己去理解、拆解、写代码、测试、改bug，直到交付一个能用的成品。

然后，就在这个全行业卷编程的节骨眼上，阿里发布了他们最新的大模型，Qwen3.6-Plus。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

我的第一反应是：3.5不是春节才出的吗，前几天还刚出了个3.5-Omni，迭代速度简直是二倍速。

而且还不只是这一个模型，过去这一周，除了3.5-Omni，阿里还发了图像模型Wan2.7-Image，再加上这次的Qwen3.6-Plus，主打一个全面开花。

据说旗舰版Qwen3.6-Max也已经在路上了。

这次我不打算罗列Benchmark数据。

尽管Qwen3.6-Plus在SWE-bench Verified、Terminal-Bench 2、NL2Repo等权威评测中，全面超越了GLM-5和Kimi-K2.5。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

整体水平，逼近Claude Opus 4.5。

我更想跟你聊聊，实测过程中让我印象深刻的那几个瞬间。

从Vibe Coding到Agentic Coding

这次真不是噱头

先聊最让我兴奋的部分。

4月2号凌晨，Qwen3.6-Plus刚上架阿里云百炼，我第一时间搞到了API Key。

二话没说，直接上了个硬核需求：做一个具备动态交互功能的Agent组织架构展示网站，要求包含动态粒子背景、响应式布局，并且在移动端要完美适配。

说实话，放以前，这种需求我得干到凌晨三点。

自己写Three.js的初始化代码、调相机参数、折腾粒子系统的性能优化，光调试就能耗掉大把时间。

但现在不一样了。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

我把需求丢给Qwen3.6-Plus，它没有急着输出代码，而是先给出了详细的任务拆解。

从技术栈选择（React + Three.js），到文件结构规划，再到核心功能模块的实现步骤。

然后开始自动生成代码，在这个过程中还主动调用了工具进行预览和测试。

整个流程，从输入需求到拿到一个可以直接运行的完整项目，全程我几乎没有写过一行代码。

Qwen3.6-Plus不仅完成了前端页面的开发，还实现了粒子系统的动态效果和完整的交互逻辑。这让我挺震撼的。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

几年前的Vibe Coding，说白了还是辅助性质的。你描述需求，AI生成代码片段，然后你需要自己把这些片段拼接起来，调试修复bug，反复折腾好几轮才能跑起来。

但现在，Qwen3.6-Plus展现出的Agentic Coding能力，是真的在试图替代整个开发流程。

它不只是帮你写代码，而是直接帮你把活干了。

只需要说清楚你想要什么，它自己去理解、拆解、写代码、测试、改bug，直到交付一个能用的成品。

这就是Agentic Coding的核心价值。

GitHub上已经有开发者把Qwen3.6-Plus接入Copilot替代品中使用，反馈最多的是终于不用在GPT-4和Claude之间来回切换了。

侧面说明，Qwen3.6-Plus确实达到了一个可以日常最强使用的水平。

让Qwen3.6-Plus结合我的个人数据、全网信息，设计一个个人网站。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

一轮对话，耗时3分钟左右，消耗0.5万个token，约等于0.15元。

网页完成度相当不错。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

还有个细节值得一说。

Qwen3.6-Plus默认支持100万token的超长上下文窗口，最大输出可达65536 tokens。

这意味着你可以一次性把整个代码仓库丢给它，它能理解跨文件的依赖关系，完成仓库级的复杂重构任务。这种能力在过去是只有Claude等顶级模型才能做到的。

以前，做大规模代码重构，你可能需要手动分析几百个文件的依赖关系，小心翼翼地改，生怕改崩了。

现在，你可以把整个项目交给AI，它能自己读代码、分析依赖、规划改动路径、逐步实施、测试验证，最后交付一个经过测试的重构版本。

如果你现在去阿里云百炼上调用Qwen3.6-Plus，每百万token输入最低只要2元。

相比Claude Opus 4.6每百万token输入5美元、输出25美元的价格，Qwen3.6-Plus的性价比确实非常有竞争力。

我在实测中完成上述那个复杂的3D网页项目，总共花费不到1块钱。

这种成本优势，让大规模应用AI编程变得真正可行了。

原生多模态，给Agent装了双眼睛

如果说Agentic Coding是Qwen3.6-Plus的大脑，那原生多模态理解就是它真正的眼睛。

以前的多模态模型，大多是后期拼接视觉模块的方案。

也就是说，模型在处理文字和图片时，用的是两套不同的机制，然后再把结果拼在一起。

这种方式的问题是，模型很难真正理解图片和文字之间的关系，就像一个人用左眼看图、右眼读字，两只眼睛看到的没法真正融合在一起。

但Qwen3.6-Plus不一样。

它基于原生多模态数据训练，从底层就把视觉和语言能力融合在了一起。

我测试了视觉智能体编程的场景。

随便找了一张设计稿截图丢给模型，告诉它按照这个设计稿的风格，生成一个AI异类弗兰克个人网页展示页面。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

模型不仅准确地提取了设计稿的色彩风格、布局结构，还自主完成了代码生成、样式调整和交互实现。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

官方Demo中有一个很有意思的测试：让Qwen3.6-Plus规划从北京大兴机场到北京首都机场的最快路线。

我按照同样的方法测试了一下，模型的方案与高德地图上的最快路径完全一致。

这说明模型能够理解真实世界的空间关系和交通网络，不只是简单地从文本中查找答案。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

还有更进阶的应用。

有网友实测上传了一段200多兆的视频，视频里他一边滚动网站页面，一边用非常口语化甚至抽象的语言描述需要的功能和特效，连帅不帅这样的词都用上了。

Qwen3.6-Plus读完视频后，按照描述成功复刻出了高度相似的效果，甚至连进入专业评选这样的需求都准确实现了。

以前，最头疼的就是怎么把自己的想法翻译成纯文本告诉AI，术语太多，精确描述一件事和写论文没什么区别。

现在，当多模态能力，让Qwen3.6-Plus能看到一切、读取一切，普通的vibe coding就已经黯然失色了。

这种打通了看懂界面到生成代码再到调用工具完成修改的完整链路，我觉得才是未来AI开发真正的方向。

价格屠夫又回来了，这次是认真的

说实话，阿里这次在定价上挺狠的。

Qwen3.6-Plus已上架阿里云百炼，每百万token输入最低2元。

API原价是4元每百万输入tokens、12元每百万输出tokens，目前有限时5折优惠。

即使按原价算，也远低于Claude Opus 4.6的5美元每百万输入、25美元每百万输出的定价。

按当前汇率换算，价格不到Claude的十分之一。

这还不是全部。

Qwen3.6-Plus已经登陆悟空、Qoder等阿里AI应用和平台，普通用户可以直接免费体验。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

我实测完成了上面提到的那个3D网页项目，总共才消耗了不到两块钱。

有开发者做了个简单的成本测算：如果你每天用Qwen3.6-Plus完成10个中等复杂度的编程任务，日均花费可能不到5元。

相比之下，如果用Claude Opus 4.6完成同样的工作量，日均花费可能高达几百元。

这种成本差异，对于独立开发者、初创团队、学生开发者来说，意义不言而喻。

而且阿里这次的定价策略，显然不只是为了打价格战。

从商业逻辑来看，更低的使用门槛意味着更多的开发者和企业愿意尝试和接入，从而积累更多的使用数据和反馈，反过来推动模型的持续优化。

这是一个正循环。

Qwen 3.5是2026年2月发布的，不到两个月时间，Qwen已经演进到3.6，迭代速度明显加速。

而Qwen3.6-Plus还只是系列的首款模型，性能更强的旗舰版Qwen3.6-Max也将于近期发布，系列后续还将开源其他尺寸的模型。这种多尺寸覆盖的策略，让不同需求的用户都能找到合适的选择。

这种快速迭代和全面的布局，正说明千问不再是以前那个只靠单一模型打天下的选手了。

不只是模型，阿里正在织一张更大的网

过去这段时间，阿里在AI领域的动作密集得有点让人应接不暇。

3月30日，国产最强全模态大模型Qwen3.5-Omni发布；

4月1日，国产最佳图像生成与编辑统一模型Wan2.7-Image发布；

4月2日，Qwen3.6-Plus上线。三个模型覆盖多模态、图像生成、编程、Agent等不同领域，每个都在各自领域达到SOTA水平。

Wan2.7-Image值得单独说两句。

这个模型直击当前AI生图领域的痛点，解决了标准脸审美疲劳和色彩盲盒等问题，实现了千人千面，能捏出活人感，还支持Hex色值精准调色、3K Token超长文本印刷级渲染。

更重要的是，Wan2.7-Image已经支持Skill调用，让龙虾画画成为现实，全面解锁了生成模型的应用场景。

不过，模型能力只是故事的一部分。

真正让我觉得有意思的，是阿里正在发生的一场组织变革。

阿里成立了ATH（Alibaba Token Hub）事业群，目的是增强从大模型到AI应用的协同。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

这次模型连续发布，阿里内部重点推的AI产品如悟空、qoder等应用第一时间接入，说明协同效应正在生效。

换句话说，阿里终于不只是埋头做模型了，他们在认认真真地思考怎么让模型真正用起来。

这种从实验室到产业化的跨越，对于千问的未来生态建设来说，可能比模型本身的能力提升更加重要。

说了这么多，我想分享几个更深层的判断。

第一，Agentic Coding正在重新定义编程这件事本身。以前，写代码是程序员的核心工作；现在，写代码正在变成AI的工作，而程序员的核心价值正在转向需求理解、系统设计、架构决策和结果验收。

第二，多模态能力正在成为AI Agent的标配。纯文本模型的天花板已经越来越明显。未来的AI Agent需要能够理解这个世界，而这个世界是图文并茂、声色俱全的。

原生多模态训练带来的理解深度，是后期拼接方案难以企及的。Qwen3.6-Plus在视觉智能体编程上的尝试，就是沿着这个方向迈出的重要一步。

第三，国产AI正在从追赶者变成定义者。在SWE-bench等权威评测中，Qwen3.6-Plus已经超越了参数规模是其2至3倍的GLM-5和Kimi-K2.5，逼近Claude Opus 4.5。

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

说明国产模型在算法效率和工程实现上已经有了质的突破，不再是单纯靠堆参数来提升性能。这种以小胜大的能力，才是真正体现技术实力的地方。

期待千问能继续保持这种快速迭代的节奏，用更短的时间缩小与Claude的差距。

也期待Qwen3.6-Max发布时能带来更多惊喜，特别是在更复杂的Agent任务和多模态推理上实现突破。

更期待阿里的ATH事业群能把模型、应用、生态真正打通，让千问不只是实验室里的标杆，更是开发者手中真正好用的工具。

AI编程的浪潮已经来了，而且这次，是真的可以动手了。

网易专栏 # AI # Qwen3.6-Plus

文章版权归作者所有，未经允许请勿转载。

为企业”近人类级智能体”部署做好准备的三大最佳实践

网易专栏 # AI # Databricks

3周前

达卯科技与云南电力技术，助力云南“绿电+智算”融合发展

网易专栏 # AI # 达卯科技

3个月前

戴尔科技峰会2026：AI的未来在本地部署

网易专栏 # IT # 戴尔Pro Max GB300

3天前

欧洲《数字网络法案》为人工智能驱动的经济奠定基础

网易专栏 # AI # 数字网络法案

2个月前

阿里Qwen3.6-Plus，Agentic Coding掀了硅谷的桌子

🤖 AI总结

主题

摘要

关键信息

对话特赞范凌：我亲手「杀死」了过去的自己，AI 时代所有的留恋都是负担

Sora向左，阿里向右：全能演技派模型登场千问APP

相关文章

为企业”近人类级智能体”部署做好准备的三大最佳实践

达卯科技与云南电力技术，助力云南“绿电+智算”融合发展

戴尔科技峰会2026：AI的未来在本地部署

欧洲《数字网络法案》为人工智能驱动的经济奠定基础