OpenAI继续其“红色警戒”行动，推出全新图像生成模型

TechCrunch2025/12/16 18:29

展示原文

作者:TechCrunch

OpenAI 正在推出新版 ChatGPT Images，承诺更好地遵循指令、更精确的编辑，以及高达 4 倍的图像生成速度提升。

这款新模型被命名为 GPT-Image-1.5，从周二起向所有 ChatGPT 用户以及通过 API 提供。这是与 Google Gemini 竞争的最新升级，此前 OpenAI 首席执行官 Sam Altman 上月在一份泄露的内部备忘录中宣布“红色警报”。该备忘录详细说明了 OpenAI 在 Google 发布其最新旗舰模型 Gemini 3 以及最新版本的热门图像生成器 Nano Banana Pro 后，计划重新夺回 AI 领导地位的计划——这两款产品在多个基准测试中均登顶 LMArena 排行榜。

即便在 OpenAI 上周推出 GPT-5.2 以回应 Google 的成功，并将其宣传为迄今为止最先进的开发者及日常专业用途模型后，Google 依然保持领先。据报道，OpenAI 原计划于一月初发布新图像生成器，并在本周加快了发布进度。其上一代图像模型 GPT-Image-1 于四月发布。

GPT-Image-1.5 的推出正值图像和视频生成器从原型阶段迈向更具生产力的能力。与 Nano Banana Pro 类似，ChatGPT Images 提供后期制作功能，带来更细致的编辑控制，以在编辑过程中保持视觉一致性，如面部相似度、光照、构图和色调。

上图为同一张图片经过不同编辑，以展示 GPT-Image-1.5 在指令遵循方面的提升。 图片来源：OpenAI

大多数 GenAI 图像工具在迭代方面表现不佳，因此这将是一次重大进步。当被要求进行特定更改，如“调整面部表情”或“让光线更冷”，模型通常会重新解释整张图片，导致缺乏一致性。

此次更新不仅仅是新功能。ChatGPT Images 现在还可以通过 ChatGPT 侧边栏的专属入口访问，OpenAI 应用首席执行官 Fidji Simo 在周二的博客文章中写道，这一入口“更像是一个创意工作室”。

“全新的图像浏览和编辑界面让你更容易创作出符合你想法的图片，或从热门提示词和预设滤镜中获得灵感，”Simo 写道。

Techcrunch event

San Francisco | 2026年10月13-15日

立即加入等候名单

除了新的图像生成器，OpenAI 还引入了更多视觉元素来提升 ChatGPT 的体验。计划让搜索查询显示更多带有明确来源的视觉内容，这对于单位换算或查询体育比分等任务将非常有帮助，Simo 表示。

“当你在创作时，应该能够看到并塑造你正在制作的内容。当视觉比文字更能讲述故事时，ChatGPT 应该将其纳入其中，”Simo 写道。“当你需要快速答案，或下一步需要在其他工具中完成时，它应该就在你眼前。通过这些改进，我们可以不断缩短你脑海中的想法与将其变为现实之间的距离。”

免责声明：文章中的所有内容仅代表作者的观点，与本平台无关。用户不应以本文作为投资决策的参考。

PoolX：锁仓获得新代币空投

不要错过热门新币，且APR 高达 10%+

立即参与！

你也可能喜欢

贝莱德增持6亿美元比特币和以太坊，ETF资金流动趋于波动——这究竟预示着什么？

币界网•2025/12/17 22:21

狗狗币或跌至 0.05 美元？分析师发出令人震惊的 60% 暴跌警告

币界网•2025/12/17 22:21

Alphabet (GOOGL) 和 Meta 联手削弱英伟达 (NVDA) 的软件主导地位

币界网•2025/12/17 22:12

Digital Wealth Partners 为合格退休账户推出 XRP 算法交易

币界网•2025/12/17 21:51

OpenAI继续其“红色警戒”行动，推出全新图像生成模型

加入 Disrupt 2026 等候名单

加入 Disrupt 2026 等候名单

你也可能喜欢

热门新闻

加密货币价格