OpenAI再出王牌：画图模型直逼摄影级，谷歌Midjourney慌了吗？

qimuai 发布于 2025-12-10 18:02 阅读：82 AI新闻

最新AI落地实操，点击了解：https://qimuai.cn/

OpenAI偷偷测了新王牌：画人像进摄影棚，写代码像敲键盘

朋友们，今天科技圈有个暗流涌动的消息。

OpenAI，那个总能搞出大新闻的团队，最近又在“秘密测试”新东西了。不过这次，主角不是聊天机器人，而是它的“绘画”能力。

他们有两款全新的图像生成模型，正在一个叫 Design Arena 的“擂台”上，接受全球真实用户的匿名盲测。模型代号很接地气，一个叫 “Chestnut”（栗子），一个叫 “Hazelnut”（榛子）。

没有发布会，没有官宣博文。但所有嗅觉灵敏的从业者都盯紧了这里——因为过去，这个盲测排行榜，往往是重大版本更新前，最准的风向标。

那么，这次OpenAI端出来的“栗子”和“榛子”，味道到底如何？一句话概括：如果现在的GPT画图是“能看”，那新一代就是朝着“能用”，甚至“惊艳”猛冲了一把。

匿名擂台上的“隐形冠军”，凭什么是它？

先说说这个“擂台”是什么。

Design Arena 和它的兄弟 LM Arena，你可以理解为AI圈的“匿名比武大会”。用户看不到模型名字，只拿到两张图，凭感觉投票“哪个更好”。最终，靠成千上万的真实人类偏好，给模型排出高下。

这种“人类盲测”的打分方式，现在就是业界公认的硬核评估标准。而OpenAI把新模型放上去，意思很明确：是骡子是马，拉出来溜溜，让用户用脚投票。

目前，根据测试者流传出的信息和评分，这两款新模型（普遍被认为是未来的轻量版和旗舰版）展现出了几个让老用户想立刻升级的关键能力：

1. 知识更渊博，画啥更像啥。
以前让AI画个特定历史场景或复杂概念，它可能懵圈。现在，新模型在理解现实世界知识和复杂文本描述上，表现已经和谷歌目前最强的图像模型 Nano Banana Pro “基本持平”。这意味着，它“脑中的世界”更接近真实了。

2. 人像直接“杀”进摄影棚。
这是最直观的震撼。新模型生成的名人风格自拍，已经无限接近“摄影级真实感”。面部光影、皮肤质感、五官比例，那种过去AI难以摆脱的“塑料感”或“拼贴感”被大幅削弱。简单说，就是画谁像谁，细节拉满。

3. 史上最大痛点，被攻克了：图像里的文字和代码。
这可能是最让设计师、产品经理和开发者狂喜的进步。过去，AI生图最怕图里有字——代码歪七扭八，单词字母乱序，根本没法用。
而新一代模型，被测试者反复称赞的一点就是：它能生成清晰、准确、可直接使用的代码片段、流程图标签和数学公式。 这意味着，用它来做UI设计稿、技术架构图、带注释的示意图，终于从幻想接近现实。

综合来看，这被外界视为OpenAI自DALL·E 3之后，在文生图领域最大的一次跃迁信号。

能撼动谷歌和Midjourney的王座吗？

当然，有夸的就有冷静的。

在盲测反馈中，也有早期用户指出，新模型在某些风格下“塑料感仍然偏重”，整体质量“暂时还不如谷歌的Nano Banana Pro”。（但所有人都同意，比现在的GPT画图“好多了”。）

目前的共识是：“栗子”和“榛子”已经稳稳站在了图像生成的第一梯队，与顶尖选手同台竞技。 但它是否能在所有维度上“全面碾压”谷歌、Midjourney或Flux等强者？这场仗，还得等正式发布后，让更多人来检验。

所有人都最关心一个问题：什么时候能用到？

根据多家科技媒体的分析和过往经验，这种规模的盲测，通常出现在官方大型版本发布前的1到3周。更有分析将它与传闻中的 GPT-5.2 联系起来，猜测它们很可能会同步亮相，时间窗口可能就是“本周或下周”。

（不过切记，截至目前，OpenAI官方没有发布任何声明。所有关于命名、细节和时间的推测，都源于测试数据和行业分析。）

写在最后

每次看到这样的“盲测”消息，都让人格外兴奋。

它不像一场精心排练的发布会，而更像在热闹市集的一角，瞥见了工匠正在打磨他即将问世的新作品。用户的每一次投票，都在悄悄塑造它的最终形态。

从“能画”到“画对”，再到“画得专业、可用”，AI图像生成正在穿过一个奇妙的临界点。它的对手不再是同行，而是人类创作者过去固有的工作流程。

当AI能瞬间把一篇技术文档变成清晰的示意图，能把产品需求直接变成高保真UI稿，把一段代码描述变成结构图——改变的，远不止是“画画”这件事。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发，了解加微信：qimugood(读者也可此微信一起交流）。

AI每日进展

文章目录

📚 推荐阅读

扫描二维码，在手机上阅读