超越Banana2!生图新王GPT-Image2玩法大全…

来看这张美钞图,猜猜哪张是实拍,哪张是AI做的?

答案是上面这个是AI做的。

再来看这两张直播间图。

乍一看是截图对吧?其实都是AI做的。

还有这页“ming”字的字典页,也是AI做的。

这个蝙蝠侠、超人的电影系列人物关系图,逻辑完全正确,也是AI做的。

刚这些图,都是还没正式发布的GPT-Image2生成的。测完Image2,我只有一个感受,AI和现实的差距,真的消失了。Image2综合能力已经超过了生图王者Banana2。

一起来看看Image2到底牛在哪?能干点啥?所有玩法和提示词,全部整理到文档里了哦,链接见文末。

怎么用上GPT-Image2

目前Image2在ChatGPT里还处于灰度测试阶段,有的用户已经能用上了,有的可能还得再等等。想尝鲜的朋友,还有另一个方式可以用上,那就是大模型盲测榜LMArena平台。

在这个对话框中,点生成图像,上传图片和提示词,点发送,如果抽到的模型名字是这几个:"duct-tape-1"、"duct-tape-2"、"duct-tape-3"、"maskingtape-alpha" 、"gaffertape-alpha" 、"packingtape-alpha",你就用上Image2了,完全免费的哈。

文字渲染能力

首先最让我震惊的,是Image2超强的文字渲染能力,在生图模型里完全是独一档的存在。

来看这张Image2生成的美钞。

Image2生成

实拍

对比下钞票实拍,Image2生成的,几乎做到了1:1精准还原。面值、序列号、签名、徽章,纸币上的所有文字,几乎都一模一样。

还有这个硅谷大佬连麦直播的画面。如果我不说是Image2做的,你大概率会以为是截图出来的。这个账号信息、在线人数、弹幕的文字,和直播间截图没有任何区别,满屏的文字精准无误。

AI能把字写对已经很难得,更绝的是,Image2还能灵活渲染各种字体。

比如让它模仿黑神话悟空的风格,做个黑神话八戒的海报。

参考图

Image2生成

看效果,标题大毛笔字,苍劲张力,顶部是秀气的宋体,左侧的题词是手写楷体,底部发售信息,又是规整的细黑体,整体的文字风格和排版,拿捏得恰到好处。

还有它生成的这张“ming”的字典页,高度还原了真实的版式。主词条使用了醒目的大字号宋体,栏目标题则是黑体。右边的字源链接,居然生成了“明字”从甲骨文、到金文、小篆和楷体的演变过程,每种字体的神韵都把握得很准。

大家日常需要做的各种数据可视化、PPT美化、版面设计,只要是需要图文混排的内容,都可以用Image2来帮你美化。

世界知识理解

Image2的思考能力,也是独一档的存在。

比如让它给我梳理一下,蝙蝠侠、超人这些超级英雄的人物关系图,Image2不仅按照阵营,把每个人物都归纳清楚,人物之间的关系也一目了然,逻辑正确,旁边还生成了完整的图例。

我也用Banana2跑了这个关系图谱,但是Banana2逻辑上还是会出错。比如和卢瑟有敌对关系的是超人而不是闪电侠,整体排版什么的也不如Image2看着舒服。

所以说,Image2的逻辑思考能力,真的非常强。

还有效果更加炸裂的。

比如让它做个短片的剧情创作版,它连每个分镜怎么设计、场景怎么搭,包括镜头用什么焦段,全都写得明明白白,拿到手直接就能照着开拍了。

还有更绝的玩法。

比如要做个口红广告片,先让Image2直接做一张包含时间轨、画面、台词、转场的分镜图片,再把这个图给Seedance2.0这样的视频模型,一句话,就能做出这样的视频,生产力提升了不止一个档次。

还有这个,比如你想学如何用PS抠图,懒得找教程,直接让Image2做个PS抠图的图文教程给你。一步步怎么操作,逻辑清晰,完成度非常高。

所以,我们可以用Image2做一些复杂的图。

比如做太阳系的科普图、人体解剖图、产品说明书、寓言典故配图等等。

创意美学能力

Image2的美学水准,是这次Image2最大的亮点之一,明显强于其他模型。

来看logo设计,要求是以字母“X”为标志设计一套logo视觉提案。上下两个分别是Image2和Banana2生成出来的效果。

Image2

Banana2

先看主logo,Banana2就一个板正的黑色X,而Image2的有粗细和明暗的变化,明显更有高级感对吧?Image2整个图文排版,看起来也比Banana2更舒服更高级。

再来看这个文艺悬疑主题的电影海报。

Image2

Banana2

整体上看,Image2生成的海报整个画面对氛围光影拿捏得十分到位。身穿深色长裙的女主完全融入了整个环境。细节上,门外的冷光、老木椅、旧窗帘、灰尘,这些搭配得也很完美,海报把幽暗、悬疑的感觉拉满了。

反观Banana2生成的,画面氛围营造就差了很多,女主太明亮了,悬疑感比较弱。另外,Banana2的文字像是美工实习生随便选了个字体就放了上去,有种堆砌的感觉。而Image2的文字设计,还有和画面的融合效果,会更自然高级一些。

再来看这张美食海报。

Image2

Banana2

Banana2生成的牛排,主体小一点,塑料感强一点。而Image2的,牛排主体更突出。同时,光影设计也非常能凸显牛排的色泽,看起来明显比Banana2的更有食欲。

所以,日常工作中的平面设计,都可以试试Image2。比如高级简约的品牌设计、电商主图等等。

真实感

接下来是真实感,Image2和Banana2旗鼓相当,甚至略有微超出。

这是Banana2生成的老人,已经很真实了,但仔细看眼睑部位,其实还是有点奇怪,额头上的老年斑也过于夸张了。

这是Image2生成的,眼睛自然,老年斑、皮肤质感都很真实。

再看这个雪原上奔跑的雪豹。

这是Banana2的,毛发方面纤毫毕现。

这是Image2的,同样纤毫毕现,细节真实感拉满。

两者伯仲之间。

这是其他模型的,明显的AI味很浓,比起Image2和Banana2有明显差距。

其他模型1

其他模型2

其他模型3

还有这个《赛博朋克2077》游戏画面,即使你玩过这款游戏,你看第一眼,很可能也会以为这是游戏截图。但这个图,是Image2直接出的,是不是真假难辨呢?

一致性控制

一致性控制,之前是Banana2最擅长的,实测下来,Image2也是非常厉害。

比如我和梵高的合影。大家可以猜一下,哪个是Image2,哪个是Banana2做的。

答案揭晓,下面的是Image2生成的。你猜对了吗?

先来看Image2的,一致性非常好,合照后和我本人很像。再看Banana2的,因为加了笑的表情,感觉不如Image2那么像我。

再来看看多个主体的一致性,这是AI非常容易翻车的场景。比如让这个女生穿上皮衣,戴上墨镜,拎这个包,靠在车旁,场景参考这个街道。

来看Image2的,人物、衣服、眼镜、包、车、背景,一致性保持得非常好。

再看Banana2的,其他细节都OK,就是街道背景没处理好,没有保持参考图那样延伸的马路作为背景。

所以,总体上Image2的一致性略强于Banana2。

写在最后

总的来说,OpenAI这次更新的GPT-Image2,又把AI生图,推向了一个全新的高度,几乎在各种场景下的各种图,都是真假难辨了。

还有更多的玩法和提示词,我都都整理在文档里了哦,链接https://ycnezwebj31p.feishu.cn/docx/R3VwdvKgeoQ6jXxMeJhcCVcDnHg?from=from_copylink。

原文:
https://mp.weixin.qq.com/s/E7Xb41s7Q1dJw6u3BcLB1g

- Posted in: Blog

- Tags:

0 条评论 ,38 次阅读

发表回复

  1. 既然来了,说些什么?

Top