ChatGPT图像2.0上线：具备联网搜索与多图生成能力

网易专栏2个月前发布 nxnqh

38 0 0

发布时间：2026-04-22 23:13:03

#AI | #ChatGPT图像2.0

来源：网易专栏作者：至顶头条
🔗 查看原文

🤖 AI总结

主题

OpenAI发布ChatGPT图像2.0，新增“思考”功能以提升图像生成质量。

摘要

OpenAI推出ChatGPT图像2.0，通过新增的“思考”功能实现更精准复杂的图像生成，支持多图一致性和多语言文字，面向订阅用户开放。

关键信息

1 新增“思考”功能，可联网搜索并推理图像结构。
2 支持一次性生成最多8张风格一致的图像。
3 图像分辨率提升至2K，并增强多语言文字生成能力。

ChatGPT图像2.0上线：具备联网搜索与多图生成能力

OpenAI正在推出其AI图像生成器的最新版本，新增”思考能力”功能，允许其通过搜索网络内容，依据单一提示词生成多张图像。OpenAI于本周二宣布，ChatGPT图像2.0现已能够生成更为”精细复杂”的图像，在指令跟随、细节保留以及文字生成方面均有显著提升。

该功能由OpenAI全新的GPT Image 2模型驱动，新增的思考能力目前面向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放。在选择思考模型后，图像生成器可联网抓取信息、根据用户上传的文件创建可视化说明，并”在生成图像之前对图像结构进行推理分析”。

在开启思考功能的状态下，ChatGPT图像2.0还支持一次性生成最多八张图像，且每张图像中的角色、物体与风格保持一致。OpenAI表示，这将大大简化漫画页面、系列社交媒体图文、以及住宅各房间设计方案等内容的生成流程。

所有ChatGPT用户均可享受本次更新带来的功能提升，包括更精准捕捉照片特征、支持像素艺术、漫画、电影截帧等多种图像风格。生成分辨率最高可达2K，支持从3:1横幅到1:3竖版在内的多种画面比例。此外，图像中的文字生成能力也得到全面升级，除英文及其他拉丁字母语言外，OpenAI表示图像2.0在日语、韩语、中文、印地语及孟加拉语的图文生成方面取得了”重大进展”。

OpenAI最初于去年推出ChatGPT图像功能，并于去年12月发布了上一个重大更新，主要改进了图像生成速度与照片编辑能力。自此之后，市场竞争持续加剧，谷歌的Nano Banana Pro与微软的MAI-Image-2等工具相继入场。

ChatGPT图像2.0即日起面向所有ChatGPT及Codex用户开放使用。

Q&A

Q1：ChatGPT图像2.0的思考功能是什么？有什么用？

A：ChatGPT图像2.0的思考功能是一项基于GPT Image 2模型的新能力，开启后图像生成器可以联网搜索相关信息、分析用户上传的文件并生成可视化说明，同时在正式生成图像之前对图像的整体结构进行推理规划，从而生成更精准、更复杂的图像内容。该功能目前仅向ChatGPT Plus、Pro、Business及Enterprise订阅用户开放。

Q2：ChatGPT图像2.0一次最多能生成多少张图像？

A：在开启思考功能的情况下，ChatGPT图像2.0支持一次性生成最多八张图像，并且每张图像中的人物角色、物体和视觉风格可保持高度一致。这一特性特别适合用于制作漫画页面、系列社交媒体配图或建筑室内设计方案等需要风格统一的多图场景。

Q3：ChatGPT图像2.0在文字生成方面有哪些改进？

A：ChatGPT图像2.0在图像内文字生成方面进行了全面升级，除了英语等拉丁字母语言外，还在日语、韩语、中文、印地语及孟加拉语的文字生成上取得了显著进步。此外，图像分辨率最高支持2K，画面比例涵盖从3:1横幅到1:3竖版等多种格式，整体实用性大幅提升。

网易专栏 # AI # ChatGPT图像2.0

文章版权归作者所有，未经允许请勿转载。

ChatGPT图像2.0上线：具备联网搜索与多图生成能力

🤖 AI总结

主题

摘要

关键信息

Lyria 3全面解析：谷歌AI音乐生成器的功能与未来

量子中心超算落地伊利诺伊州，IBM携手UIUC共探量子新纪元

相关文章

Qwen最新3.7 Max预览版空降！两代超大杯并行迭代

微软计划将Copilot升级为智能体AI助手

2026-05-27：非负元素轮替。用go语言，给定整数数组 nums 和整数 k。操作规则如下： 1.数组中所有非负数参与处理；它们需要像循环轮替一

英特尔与SambaNova押注分布式推理，应对智能体AI对GPU的压力