GPT Image 2全量上线!爆肝两天,全网最全实用玩法都在这里了

大家好,这里是xuan酱。

前天凌晨3点多,GPT-Image 2终于正式全量上线了。

图片

前几天还在灰度测试的时候,我们就已经把视频和图文内容都肝出来了,测试下来也觉得效果确实非常惊艳。前天全量上线之后,我们又抓紧跑了一批更偏实用向的case,又肝了整整两天。

所以今天这篇,我想把我们这两天测下来觉得最值得分享的东西,一次性给大家讲清楚。

哪里能用

先说大家最关心的,现在到底在哪能用上。

主要还是ChatGPT网页端,不同订阅档位都能体验,免费、Plus、Pro都支持。

但差别还是挺大的。

免费账户基本就是体验版,每天大概两到三张,速度慢,分辨率也低。想感受一下这代到底强在哪,够了,但想认真玩就不太够。Plus会舒服很多,每三小时大概50张,一天差不多能跑150到200张,做内容创作或者深度体验基本够用。Pro就更自由了,重度用户直接上就行。

CodeX现在也已经内置了Image 2,一个订阅,多端适配,这点我觉得还挺爽的。

还有一个邪修的办法。上期不是介绍了大模型竞技场,现在Image 2已经在竞技场里面全量上线了,选择Direct模式就可以直接使用Image 2,就是生成数量会有一些限制。

图片

上一期我们已经聊过Image 2的基础能力了,这一期不再重复介绍,直接上干货,带大家看看这玩意到底能怎么用。

视频创作工作流

这个板块是我个人觉得最炸的。因为Image 2不只是在生成好看的图,它正在重新定义视频前期制作的流程。

角色设计卡 / IP设定

Image 2在thinking模式下可以一次性生成最多8张图片。这个能力拿来做角色设计和IP设定简直太合适了。

我们试了一套古装剧的完整设定,男主、女主、反派、群像、主场景、副场景、高光场景、世界观,8张一次出完,风格高度统一。拿到手直接就能当影视项目的前期参考用。

图片

图片

图片

图片

图片

图片

图片

图片

完整故事版 / 分镜图

这个能力是Image 2跟其他生图模型拉开差距最大的地方之一。

Image 2在对话过程中的推理能力是直接继承到图片里的,每个分镜之间有逻辑关系,一致性也保持得很好。

这是沿用上面这个案例继续生成的单张分镜图,可以看出人物和场景一致性极佳。

图片

图片

图片

之前Banana 2也能做九宫格分镜,但只有画面,没有时长和运镜信息。Image 2相当于把分镜设计和分镜生成一步到位了,一句话就能出一套完整的故事版。

Image 2 + Seedance 2.0 串联工作流

更🐮的玩法来了。

先让Image 2出分镜图和每个镜头的详细描述,然后把图片导入Seedance 2.0作为参考,描述粘贴进去,直接生成视频片段。

根据分镜表生成一个古装风格的视频。

图片

图片

生成一条苹果风格的老干妈广告。

图片

图片

图片

图片

图片

图片

图片

这套工作流跑通之后,一个人就能完成从创意到分镜到视频的全流程。做短剧的、做漫剧的、做广告片的朋友,可以认真看一下这个路子。

结合Suno生成MV

把Image 2和Suno串起来。让Image 2读取歌词,按每15秒一个片段生成对应的音乐视频故事板,然后用Seedance 2.0整合成视频。

图片

一首歌的MV,从画面设计到视频生成,全链路AI化。独立音乐人看到这个应该会比较兴奋。

游戏演示动画

先让Image 2生成游戏实机截图,比如一款三国背景的3A级ARPG,第一人称视角,带剧情对话框和互动UI。然后把首帧和尾帧扔给视频模型,补中间的过渡动画。

图片

图片

图片

出来的效果有那么点游戏CG的意思了。离真正的游戏画面还有距离,但作为概念演示或早期Demo,已经相当够用。

图片拓展玩法

视频工作流聊完了,回到图片这块。这部分覆盖的场景非常多,海报、PPT、科普、电商、创意设计,基本你日常能想到的图片需求,Image 2都能hold住。

海报设计

海报是我们测得最多的,也是大家日常最高频的需求。

招聘海报

我们拿之前团队的一张招聘海报做了测试,直接跟Image 2说帮我做一套更专业、更有高级感的。出来的效果,坦率的讲,比花钱找人做的都好看。

图片

图片

图片

图片

图片

文旅宣传海报

跑了一张武汉的城市海报,粉色水墨风,要求包含黄鹤楼、省博物馆、长江大桥这些标志元素,主文案「九省通衢,江城武汉」。出来的留白很舒服,水墨质感在线,最关键的是中文大标题书法字体干净漂亮,几乎可以直接用。

图片

小说海报

让Image 2根据「三体」和「红楼梦」各生成了一张双重曝光风格的海报,人物侧脸剪影作为外轮廓,内部填充相应世界观的标志性场景,这效果真的吊打很多电视剧或者小说海报了吧。

三体

三体

红楼梦

红楼梦

活动海报

这个case比较实战。假设我们要办一个AI交流大会,我上传了二维码和照片让它嵌进去。它真的把素材融合进了海报里,最关键的是二维码竟然真的能扫。当时图片生成出来了之后,我颤颤巍巍地拿手机扫了一下,叮的一声,扫出来了!当时我真的激动得要跳起来了。要知道之前用AI做海报基本上只能用它来生成一些素材,然后自己再贴二维码什么的,现在真的一句话就直出了。不知道做运营的朋友,你们看到是什么心情。

图片

菜单设计

让Image 2生成一张武汉传统早餐馆的菜单,文字、排版什么的都挺地道,就是这个热干面编的是不是有点太整齐了😂

图片

PPT

PPT是老生常谈的话题了吧,之前我们也已经做了好几期PPT的内容了,这次也测试了一下用Image 2做来PPT。

先用Image 2生成了一套电商团队随手拍的照片做测试,原图背景杂乱,拍的也很随意。

原图1

原图1

原图2

原图2

我就给了Image 2一个主题,说我要做一个2025年的年终总结,先让Image 2参考这张合照和我们之前那期做的PPT的样式,做了一张年终总结的PPT封面,效果大家自己点评吧。。。

图片

然后继续在同一个会话里,让Image 2生成了一页团队每个成员的介绍和一页双十一期间冲刺销量的页面。

图片

图片

我感觉PPT设计师要失业了。

不过这里注意一下,建议像我这样一页一页的生成。虽然它可以一次生成多页,但是批量生成出来的内容不一定满足要求,改起来也相对麻烦。

创意设计

小红书风格卡片图

主题为「大语言模型的训练过程」,要求手绘风、莫兰迪配色、信息图排版。出来的效果很小红书,荧光笔划线、手绘贴纸、便签纸质感都有,以后做知识类小红书图文,用Image 2准没错。

图片

旅游攻略

做一张武汉三天两夜的旅游攻略,要求包含景点美食、地理位置合理不走回头路、带小地图。这里就能看出Image 2的搜索能力了,记得在网页端打开thinking模式,它会主动去网上搜索相关的地标和美食信息,确保内容准确。出来的攻略图信息量大但不乱,排版也非常美观。

图片

图片

物料设计

以上海为主题,一句话让它设计一整套宣传物料,明信片、书签、日历、icon图标、表情包、篆刻印章,六种物料全出来了,风格也非常统一。

图片

图片

图片

图片

图片

图片

左滑查看更多图片

科普类图片

事件总结长图

Image 2这次支持1:3超长图,横屏竖屏都可以,这个比例拿来做时间线梳理简直完美。我们让它为OPENAI发布模型和AI发展历史做了一套完整时间线长图,信息密度高,时间轴清晰,关键事件标注准确。这种长图以前全靠设计师手工排,现在一句话就能直出。

图片

长图

下滑查看全图

动植物科普百科图

让它根据「中华田园犬」生成一张图鉴式科普百科图,模块化信息分区,包含基础档案、外观特征、习性、养护建议、评分卡,出来的效果非常像高端博物图鉴。

图片

教学展示

为李白做一张生平图,什么阶段去过哪些地方、产出过哪些经典作品,水墨风。出来的画面意境和信息结构融合得很好,给老师做教学PPT、学生做课题展示,拿来即用。

图片

对了,其实我发提示词的时候,不小心记错了,把诗仙打成了诗圣,Image 2发现了这个错误,并且给我纠正了,我只能说,这有点太强了。

知识全景图

这块也是一个非常实用的功能,可以帮你快速入门一个新领域。

让Image 2帮我做一张「中国茶叶」的知识全景图。茶叶分类、产区、制作工艺、品鉴方法全铺在一张图里,逻辑清楚,视觉好看。还做了一张山海经的全集图鉴,这信息密度,敢想象这是AI生成出来的。

图片

图片

书法文字

这个case直接展示了Image 2超绝的文字渲染能力。让它分别用篆书、隶书、楷书、行书、草书渲染「静夜思」,五种字体的神韵居然都把握得都非常准,篆书的古朴、隶书的端庄、草书的飘逸都有那个味儿。

图片

图片

图片

图片

图片

不是说能跟真正的书法家比,但Image 2能做到这个程度,有点超出预期了。

电商图片

电商是我觉得Image 2可以最快落地的场景之一。

我就随手拍了一张旁边的花露水和一包纸巾,Image 2一次性就生成了电商主图(3:4)和详情页(1:3)。主图质感好,背景干净,产品突出。详情页更让人惊讶,它自己规划了信息层级,卖点提炼、使用场景、成分说明,你说这是从哪个电商平台直接扒下来的我都信。

原图

原图

主图

主图

详情页

详情页

原图

原图

主图

主图

详情页

详情页

这个能力对中小商家来说太实用了。以前一套电商详情页少说找设计师搞一两天,现在十分钟出一版初稿。

结合编程

最后这个板块可能很多人没想到,但Image 2结合Vibe Coding确实可以碰撞出很大的火花。

这里要用到CodeX,前面提到CodeX里面也可以调用Image 2。这样就可以直接生成网页设计稿和APP UI设计稿,而且部分细节是真的可以交互的。你只需要描述清楚界面逻辑和风格,剩下的只需要坐在那里等,一发入魂。

我们用CodeX做了一个探秘三星堆、揭秘古蜀文化的网页。

还做了一个植物科普与识别的知识平台。

可以看到完成度都非常的高,还有很多可以交互的细节。

另外还可以做可以交互的游戏。说真的,如果不告诉你这是AI做的,你大概率会以为是哪个游戏工作室的早期概念设计。

还有一个玩法非常实用,就是全景图的展示。现在很多手机都可以拍出全景图,但是直接预览查看很不方便,有很大的畸变。我们用CodeX Vibe Coding了一个全景的播放器,还让它用Image 2生成了一套室内的照片,用这个播放器来全景看房简直不要太爽。拿来做VR场景预览或者虚拟空间的概念设计也很合适。

对开发者来说,这个功能最大的价值不在于替代设计师,而在于你可以先快速出一版视觉原型跟团队对齐方向,省掉从0到1那个最耗时的阶段,团队协作效率大大提高。

写在最后

肝完了这两天的case之后,我最大的感受是AI又在一个新的领域带来了平权。

Image 2正在把很多原来只有专业设计人士才能做的视觉工作,变成普通人也能上手的事情。你不需要会PS,不需要懂设计理论,不需要写复杂的提示词,你只要说清楚你想要什么,它就能给你一个至少七八十分的起点。

当然它也不是万能的,文字偶尔还是会翻车,复杂排版有时候会乱,放大了看还是能看出AI痕迹。但这些问题都在一个可以微调的范围内,跟半年前那种「只能看不能用」的状态,完全是两个概念了。

说真的,这次跑完之后我有一个很强烈的念头,就是想让更多人知道这个东西。不是因为它有多酷多炫,而是因为它真的能帮到人。

做小红书的小博主,可能不再需要为了一张封面图纠结半天。开小店的老板,可能终于能自己搞定一张像样的电商主图。在工位上的苦逼打工人,可能也不需要再上淘宝找人花钱做述职PPT了。

这些场景听起来都很小,但每一个背后都是一个具体的人,一个具体的需求。

我一直觉得,好的工具不是让强者更强,而是让更多人有机会表达自己。

Image 2在往这个方向走。

原文:
https://mp.weixin.qq.com/s/K98zQWj-22Yiuu5Pi_gnxw

- Posted in: AI

- Tags: ,

0 条评论 ,17 次阅读

发表回复

  1. 既然来了,说些什么?

Top