«

OpenAI再出王牌:画图模型直逼摄影级,谷歌Midjourney慌了吗?

qimuai 发布于 阅读:40 AI新闻


OpenAI再出王牌:画图模型直逼摄影级,谷歌Midjourney慌了吗?

最新AI落地实操,点击了解:https://qimuai.cn/

OpenAI偷偷测了新王牌:画人像进摄影棚,写代码像敲键盘

朋友们,今天科技圈有个暗流涌动的消息。

OpenAI,那个总能搞出大新闻的团队,最近又在“秘密测试”新东西了。不过这次,主角不是聊天机器人,而是它的“绘画”能力。

他们有两款全新的图像生成模型,正在一个叫 Design Arena 的“擂台”上,接受全球真实用户的匿名盲测。模型代号很接地气,一个叫 “Chestnut”(栗子),一个叫 “Hazelnut”(榛子)。

没有发布会,没有官宣博文。但所有嗅觉灵敏的从业者都盯紧了这里——因为过去,这个盲测排行榜,往往是重大版本更新前,最准的风向标。

那么,这次OpenAI端出来的“栗子”和“榛子”,味道到底如何?一句话概括:如果现在的GPT画图是“能看”,那新一代就是朝着“能用”,甚至“惊艳”猛冲了一把。


匿名擂台上的“隐形冠军”,凭什么是它?

先说说这个“擂台”是什么。

Design Arena 和它的兄弟 LM Arena,你可以理解为AI圈的“匿名比武大会”。用户看不到模型名字,只拿到两张图,凭感觉投票“哪个更好”。最终,靠成千上万的真实人类偏好,给模型排出高下。

这种“人类盲测”的打分方式,现在就是业界公认的硬核评估标准。而OpenAI把新模型放上去,意思很明确:是骡子是马,拉出来溜溜,让用户用脚投票。

目前,根据测试者流传出的信息和评分,这两款新模型(普遍被认为是未来的轻量版和旗舰版)展现出了几个让老用户想立刻升级的关键能力:

1. 知识更渊博,画啥更像啥。
以前让AI画个特定历史场景或复杂概念,它可能懵圈。现在,新模型在理解现实世界知识和复杂文本描述上,表现已经和谷歌目前最强的图像模型 Nano Banana Pro “基本持平”。这意味着,它“脑中的世界”更接近真实了。

2. 人像直接“杀”进摄影棚。
这是最直观的震撼。新模型生成的名人风格自拍,已经无限接近“摄影级真实感”。面部光影、皮肤质感、五官比例,那种过去AI难以摆脱的“塑料感”或“拼贴感”被大幅削弱。简单说,就是画谁像谁,细节拉满。

3. 史上最大痛点,被攻克了:图像里的文字和代码。
这可能是最让设计师、产品经理和开发者狂喜的进步。过去,AI生图最怕图里有字——代码歪七扭八,单词字母乱序,根本没法用。
而新一代模型,被测试者反复称赞的一点就是:它能生成清晰、准确、可直接使用的代码片段、流程图标签和数学公式。 这意味着,用它来做UI设计稿、技术架构图、带注释的示意图,终于从幻想接近现实。

综合来看,这被外界视为OpenAI自DALL·E 3之后,在文生图领域最大的一次跃迁信号。


能撼动谷歌和Midjourney的王座吗?

当然,有夸的就有冷静的。

在盲测反馈中,也有早期用户指出,新模型在某些风格下“塑料感仍然偏重”,整体质量“暂时还不如谷歌的Nano Banana Pro”。(但所有人都同意,比现在的GPT画图“好多了”。)

目前的共识是:“栗子”和“榛子”已经稳稳站在了图像生成的第一梯队,与顶尖选手同台竞技。 但它是否能在所有维度上“全面碾压”谷歌、Midjourney或Flux等强者?这场仗,还得等正式发布后,让更多人来检验。

所有人都最关心一个问题:什么时候能用到?

根据多家科技媒体的分析和过往经验,这种规模的盲测,通常出现在官方大型版本发布前的1到3周。更有分析将它与传闻中的 GPT-5.2 联系起来,猜测它们很可能会同步亮相,时间窗口可能就是“本周或下周”。

(不过切记,截至目前,OpenAI官方没有发布任何声明。所有关于命名、细节和时间的推测,都源于测试数据和行业分析。)


写在最后

每次看到这样的“盲测”消息,都让人格外兴奋。

它不像一场精心排练的发布会,而更像在热闹市集的一角,瞥见了工匠正在打磨他即将问世的新作品。用户的每一次投票,都在悄悄塑造它的最终形态。

从“能画”到“画对”,再到“画得专业、可用”,AI图像生成正在穿过一个奇妙的临界点。它的对手不再是同行,而是人类创作者过去固有的工作流程。

当AI能瞬间把一篇技术文档变成清晰的示意图,能把产品需求直接变成高保真UI稿,把一段代码描述变成结构图——改变的,远不止是“画画”这件事。

所有领域都值得用AI重做一遍。本文作者承接各种AI智能体和AI全域营销自动化软件、工作流开发,了解加微信:qimugood(读者也可此微信一起交流)。

AI每日进展

文章目录


    扫描二维码,在手机上阅读