OpenAI 正在推出新版 ChatGPT Images,承诺更好地遵循指令、更精确的编辑,以及高达 4 倍的图像生成速度提升。
这款新模型被命名为 GPT-Image-1.5,从周二起向所有 ChatGPT 用户以及通过 API 提供。这是与 Google Gemini 竞争的最新升级,此前 OpenAI 首席执行官 Sam Altman 上月在一份泄露的内部备忘录中宣布“红色警报”。该备忘录详细说明了 OpenAI 在 Google 发布其最新旗舰模型 Gemini 3 以及最新版本的热门图像生成器 Nano Banana Pro 后,计划重新夺回 AI 领导地位的计划——这两款产品在多个基准测试中均登顶 LMArena 排行榜。
即便在 OpenAI 上周推出 GPT-5.2 以回应 Google 的成功,并将其宣传为迄今为止最先进的开发者及日常专业用途模型后,Google 依然保持领先。据报道,OpenAI 原计划于一月初发布新图像生成器,并在本周加快了发布进度。其上一代图像模型 GPT-Image-1 于四月发布。
GPT-Image-1.5 的推出正值图像和视频生成器从原型阶段迈向更具生产力的能力。与 Nano Banana Pro 类似,ChatGPT Images 提供后期制作功能,带来更细致的编辑控制,以在编辑过程中保持视觉一致性,如面部相似度、光照、构图和色调。
上图为同一张图片经过不同编辑,以展示 GPT-Image-1.5 在指令遵循方面的提升。 图片来源:OpenAI 大多数 GenAI 图像工具在迭代方面表现不佳,因此这将是一次重大进步。当被要求进行特定更改,如“调整面部表情”或“让光线更冷”,模型通常会重新解释整张图片,导致缺乏一致性。
此次更新不仅仅是新功能。ChatGPT Images 现在还可以通过 ChatGPT 侧边栏的专属入口访问,OpenAI 应用首席执行官 Fidji Simo 在周二的博客文章中写道,这一入口“更像是一个创意工作室”。
“全新的图像浏览和编辑界面让你更容易创作出符合你想法的图片,或从热门提示词和预设滤镜中获得灵感,”Simo 写道。
加入 Disrupt 2026 等候名单
将自己加入 Disrupt 2026 等候名单,抢先获得早鸟票。往届 Disrupt 活动曾邀请 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 等 250 多位行业领袖,举办 200 多场助力成长、提升竞争力的会议。此外,还能结识数百家在各领域创新的初创公司。
加入 Disrupt 2026 等候名单
将自己加入 Disrupt 2026 等候名单,抢先获得早鸟票。往届 Disrupt 活动曾邀请 Google Cloud、Netflix、Microsoft、Box、Phia、a16z、ElevenLabs、Wayve、Hugging Face、Elad Gil 和 Vinod Khosla 等 250 多位行业领袖,举办 200 多场助力成长、提升竞争力的会议。此外,还能结识数百家在各领域创新的初创公司。
除了新的图像生成器,OpenAI 还引入了更多视觉元素来提升 ChatGPT 的体验。计划让搜索查询显示更多带有明确来源的视觉内容,这对于单位换算或查询体育比分等任务将非常有帮助,Simo 表示。
“当你在创作时,应该能够看到并塑造你正在制作的内容。当视觉比文字更能讲述故事时,ChatGPT 应该将其纳入其中,”Simo 写道。“当你需要快速答案,或下一步需要在其他工具中完成时,它应该就在你眼前。通过这些改进,我们可以不断缩短你脑海中的想法与将其变为现实之间的距离。”
