Google Veo 3保姆级使用教程,这才是最强AI视频工具

Google Veo 3保姆级使用教程,这才是最强AI视频工具

Google Veo 3保姆级使用教程,这才是最强AI视频工具

近几年,AI技术突飞猛进,正在深刻改变我们的创作方式。Google推出的Flow工具,更是将AI视频创作推向了新的高度。它整合了强大的AI模型,如文生图模型Imagen 4、多模态AI模型Gemini和最新视频生成模型Veo 3

本篇文章将通过介绍Flow每个模块的用途,和完整的案例演示,为你揭秘Flow的各项强大功能,手把手教你如何使用Veo 3生成视频,让普通用户也能轻松实现专业的视频创作。


一、Flow简介
Flow是Google推出的一款专为 Google DeepMind 最先进的模型Veo、Imagen 和 Gemini量身打造的 AI 影片制作工具。您可以直接用平常说话的方式给出提示词,借助Flow制作影片级视频片段,无缝生成具有角色和场景一致性的完整故事。
Flow 仅面向 Google AI Pro 和 Ultra 订阅者提供。Ultra 订阅者还能抢先体验最新的模型和功能,例如“素材转视频”。


二、Flow各大模块介绍
在本节中,我们将详细了解 Flow 界面的各个核心模块,以及它们各自的用途和操作方式。
页面登录
方法一: 打开Flow官网:https://labs.google/fx/tools/flow,登录Google账号进入Flow主界面。

方法二: 打开Gemini官网https://gemini.google.com,登录Google账号点击“视频”选项。


项目视图
进入Flow主界面后,你会看到简洁而强大的操作界面。会展示所有的项目视图,可以滚动并查看正在处理的所有内容。你也可以进行网格/列表切换,方便你以不同方式浏览内容。切换到网格模式后,还可以对项目重命名。

点击一个项目或开始一个新项目时,该项目的所有生成内容都会在这里显示。


设置
点击“新建项目”,输入框的右上角是“设置”按钮,可以设置:

  • 每个提示的输出个数:点击后可以调整每个提示词输出的视频个数,可设置为1-4个,默认2个。
  • 模型:可以选择视频生成的模型,默认使用的是老版本Veo 2-Fast模型,需要手动切换成其他模型(Veo 2-Quality、Veo 3-Fast、Veo 3-Quality)。Fast适用于适用于需要快速、经济地将文本转换为视频的场景。Quality适用于生成质量更高、功能更全面的场景。选择模型后,下行会显示每次生成所需的AI点数。


提示词
访问Gemini官网:
https://gemini.google.com,使用Gemini帮你即兴发挥创意,编写提示词。
然后复制Gemini生成的提示词,粘贴在Flow的输入框,生成图片/视频。


文本转视频(Text to Video)
根据提示词生成视频片段。点击输入框左上角的“文本转视频”按钮,可以切换3种不同的视频生成模式:文本转视频(Text to Video)、帧转视频(Frames to Video)、素材转视频(Ingredients to Video)。默认为文本转视频。
目前Flow仅支持英文提示词输入,及英文语音输出。期待谷歌后续支持更多语言。

在输入框输入提示词,点击输入框右上角的“设置”按钮,根据需要设置每个提示词的输出个数和模型,点击发送按钮,等待几分钟后,视频就生成了。可逐个点击播放观看视频生成效果。


帧转视频(Frames to Video)
点击输入框左上角的“文本转视频”按钮,切换到帧转视频(Frames to Video)模式。它是基于图片作为首/尾帧生成视频。
点击输入框右上角的“设置”按钮,根据需要设置每个提示词的输出个数及模型。
输入框下方出现2个+号,前面+号表示首帧,后面+号表示尾帧。点击+号,可选择重复使用以前的帧/上传本地图片/调用Imagen 4生成图片作为首帧、尾帧或首尾帧使用,支持分别用首帧、尾帧、首尾帧生成视频。
但目前Veo 3-Quality仅支持首帧生成视频,且只带音效,不支持语音。

点击+号右边的“相机图标”,可预览并选择不同的运镜效果,而无需在提示词中描述它。
注意:如果使用这个运镜功能,则无法使用Veo 3模型,Flow会自动切换到Veo 2模型。但可以在提示词里设置运镜效果。

在输入框输入提示词,点击生成按钮,等待视频生成。可逐个点击播放观看视频生成效果。


素材转视频(Ingredients to Video)
点击输入框左上角的“Text to Video(文本转视频)”按钮,切换到素材转视频(Ingredients to Video)模式。它类似于视频的帧,但不是使用图像作为首帧或尾帧,而是选择一些素材组合在一个场景中,并添加提示词,说明它们如何交互。

输入框下方出现3个+号,点击+号,可以上传3张图片,作为主体或风格参考。可选择重复使用以前的图片/上传本地图片/调用Imagen 4生成图片。输入提示词后,点击“发送”按钮,Flow会把3张图片里的元素融合在一个视频中,可逐个点击播放观看视频生成效果。你会发现在镜头中实现角色、位置和物体的一致性很容易。
目前Veo 3不支持素材转视频。只能用Veo 2-Quality模型,生成的视频不带音效和语音。
仅面向Google AI Ultra订阅者提供。


编辑剪辑
本功能模块包括添加到场景、视频裁剪、保存帧、排列、下载等功能。对生成的视频片段进行裁剪、合并等操作。
1. 添加到场景
如果生成了满意的视频片段,可点击单个视频左上角的“添加到场景(Add to scene)”按钮,会自动加入到Scenebuilder(场景构建器)轨道中进行简单编辑。你可以无缝编辑和扩展现有的镜头,Gemini 将在后台智能辅助,确保内容或风格的一致性。通过连续的运动和一致的角色揭示更多动作或过渡到接下来发生的事情。

2. 视频裁剪
选择一个素材,对于不太满意的片段,可以通过拖拽素材左右的手柄,来进行简单裁剪。

3. 保存帧
在场景编辑器中,如果对某一帧比较满意,可以点击播放头上方+号按钮,就可以将这一帧画面保存为素材资源,供以后使用。以便生成以该帧开始或结束的更多剪辑。

4. 排列
当生成所有剪辑素材后,还可以点击最右边的“排列”按钮,拖拽来改变不同片段的顺序,构建故事线。可以实现非常简单的视频编辑效果。

5. 下载
点击单个视频右上角的“下载”按钮,可自由选择480p、720p、1080p等不同分辨率下载单个视频片段。

一旦获得了需要的所有视频片段,可以在场景构建器中,单击此处可下载你的完整视频文件。


跳转到(Jump to)
在场景构建器中,可以将多个剪辑放在一起来创建一个场景,也可以继续迭代创建下一个镜头。点击视频旁边的+号,弹出2个选项:跳转到、延长。它利用 Gemini 的功能来了解你之前的剪辑是如何结束的,以便按照你的提示词无缝生成下一个剪辑。 如果你想把一个视频片段切换到其他场景中去,就可以用“跳转到”功能,创建多结局体验。

点击“跳转到”,输入提示词,输入框右上角设置视频个数和模型。点击“发送”,生成下一个剪辑。


延长(Extend)
点击场景编辑器轨道中的+号,选择“延长(extend)”并添加提示词,可以延长正在处理的剪辑以制作更长的场景,续写视频画面。
目前延长功能无法使用最新的Veo 3模型。只能用Veo 2模型,生成的视频不带音效和语音。


观看Flow TV
在主页右上角点击“观看Flow TV”按钮,就进入了官方的案例展示页面,展示了使用 Google 的 Veo 模型生成的精彩片段,可以观看和学习其他用户分享的AI生成作品,获取灵感。
但目前所有生成内容均使用 Veo 2 创建,期待官方更新。

使用屏幕底部的遥控器可浏览频道,并查看生成片段所使用的提示词。如:

  • 上下箭头可以切换频道。
  • 点击CHANNEL里的“View All”,可以查看所有的内容。
  • 打开中间开关按钮,可以看到当前视频的提示词。
  • 随便点击一个主题,点击“表格”图标,就可以看到跟这个主题相关的其他视频素材。

回到“View All”后,在最上方切换到选项卡“SHORT FILMS”,可以看到官方找专业人士制作的电影短片。可以学习各路大神的作品来获取灵感,开阔思路。

三、完整案例演示
接下来,我们将通过一个完整的案例,手把手教你如何使用Flow创作一段短片。
案例主题:当恐龙遇到外星人,迪斯科燃爆沙漠!
故事梗概
在白天广阔的沙漠中,一位酷炫的墨镜霸王龙驾驶摩托车飞驰,享受着疾风的快感。随着夜幕降临,沙漠幻化成一片未来感十足的霓虹景象。突然,一艘UFO悄然降临,从中走出造型独特的外星人。
短暂的戒备后,霸王龙与外星人因一场迪斯科对话而迅速化解隔阂,随着音乐响起,他们在沙漠中跳起了狂热的迪斯科!
剧情发展逻辑
1.文本转视频:白天霸王龙骑摩托穿越沙漠,并说沙漠真带劲。
2.文本转视频:霸王龙骑摩托穿越夜晚霓虹沙漠
3.文本转视频:夜晚UFO降临沙漠
4.文本转视频:外星人出现,向霸王龙问好
5.文本转视频:霸王龙回应外星人
6.文本转视频:迪斯科开场,外星人和霸王龙对话
7.文本转视频:迪斯科高潮,外星人和霸王龙跳迪斯科舞蹈
最终效果预览

当恐龙遇到外星人,迪斯科燃爆沙漠!


详细创作教程步骤
现在,让我们一步步使用 Flow 来实现这个精彩的故事。
1.文本转视频: 白天霸王龙骑摩托穿越沙漠,并说沙漠真带劲。

  • 进入Flow,点击“新建项目”,切换到网格模式后,将项目命名为“Dinosaur Disco”。
  • 点击项目后,输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频,输入提示词,点击“生成”按钮,Veo 3 将尝试生成匹配的视觉内容、音效和语音,等待视频生成。

Prompt:
A cool Tyrannosaurus Rex wearing black aviator sunglasses and a leather biker jacket, riding a custom chrome motorcycle at high speed through a vast, endless desert, kicking up dust, cinematic, dynamic camera following, hot sun, golden hour, action shot.
the T-Rex lets out a deep, rumbling growl that echoes with reverb across the empty http://landscape.In a deep voice with heavy reverb, the dinosaur says: “Rrrgh… This desert rocks!”
中文翻译:
一只酷炫的霸王龙戴着黑色飞行员墨镜,身穿皮夹克机车服,正疾驰驾驶一辆定制镀铬摩托车,在广袤无垠的沙漠中飞驰而过,身后尘土飞扬。电影级动态跟拍镜头,烈日当空,黄金时刻光线,动作感十足。
霸王龙低沉地咆哮一声,声音带着混响,在空旷的沙漠中回荡。它用低沉、带混响的声音说道:“吼……这沙漠,真带劲!”

2.文本转视频: 霸王龙骑摩托穿越夜晚霓虹沙漠

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。

Prompt:
A cool Tyrannosaurus Rex wearing black aviator sunglasses and a leather biker jacket, riding a custom chrome motorcycle at high speed through a vibrant, glowing neon desert at night, with luminescent flora. Add bright neon trails following the motorcycle. The dinosaur and motorcycle maintain their distinctive cool appearance. Psychedelic, futuristic, high contrast, dynamic camera movement, nighttime setting.
中文翻译:
一只戴着黑色飞行员墨镜、身穿皮夹克机车服的酷炫霸王龙,正驾驶着定制镀铬摩托车在霓虹闪烁的沙漠夜色中飞驰,沿途荧光植物莹莹生辉。摩托车后方拖曳着耀眼的霓虹光轨,霸王龙与机车依旧保持着标志性的炫酷造型。迷幻未来主义风格,高对比度画面,动态镜头追踪,夜幕背景。

3.文生视频:夜晚UFO降临沙漠

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。

Prompt:
A sleek, silver flying saucer (UFO) slowly descends from a dark night sky dotted with distant stars onto a desolate neon desert landscape. The UFO emits soft glowing lights from its underside, illuminating the luminescent flora on the sand dunes below. Dust gently swirls beneath it. Mysterious, cinematic, wide shot, sci-fi atmosphere.
Accompanying the visuals, a low, resonant UFO flying sound plays, layered with soft whooshing sound effects as the saucer moves through the air.
中文翻译:
一架流线型银色飞碟(UFO)从繁星点点的暗夜天幕缓缓降下,落在一片荒凉的霓虹荒漠之上。飞碟底部散发出柔和的光芒,照亮了下方的沙丘上那些莹莹发光的植物群落。沙尘在飞碟下方轻轻盘旋。神秘莫测,电影级广角镜头,科幻氛围拉满。
伴随画面的,是低沉共鸣的UFO飞行音效,夹杂着飞碟掠过空气时柔和的呼啸声。

4.文生视频:外星人出现,向霸王龙问好

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。

Prompt:
Three humanoid aliens with large black eyes and slender, silver limbs, wearing sleek, dark gunmetal gray metallic shimmering suits, slowly emerge from the glowing ramp of a landed silver UFO in a vibrant, neon-lit desert night. Luminescent flora glows softly on the sand dunes. The aliens appear cautious and curious, observing the alien landscape. Cinematic, medium shot.
A humanoid alien slowly approaches the camera in a dusty desert landscape. The alien pauses, tilts its head slightly, and gazes directly at the viewer with a curious and cautious expression. Behind the alien stand two more aliens and a landed UFO resting in the desert. The alien speaks in a faint electronic voice,slightly curious: “Beep… Whirr… Earth creature, hello…”
中文翻译:
三名长着硕大黑眼、银色细长四肢的人形外星生物,身着光滑的深枪灰色金属光泽制服,从一架降落在霓虹荒漠中的银色飞碟发光坡道上缓缓现身。沙丘上的荧光植物泛着幽幽微光。外星人们显得既警惕又好奇,正观察着这片异星地貌。电影级中景镜头。
一个类人生物的外星人在尘土飞扬的沙漠中缓缓走近镜头。它停下脚步,微微歪头,用好奇而警惕的表情直视着观众。它身后站着另外两位外星人,以及停泊在沙漠中的UF0。这个外星人略带好奇,用电子音说道:“哔……嗡……地球生物,你好……”

5.文生视频: 霸王龙回应外星人

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。

Prompt:
A cool Tyrannosaurus Rex wearing black aviator sunglasses, a leather biker jacket, and a studded collar, stands in a vibrant, glowing neon desert at night, with luminescent flora, consistent with the previous scene. Its eyes widen slightly, and its head slowly turns as if reacting to an unseen presence just off-camera. A visibly surprised expression spreads across the dinosaur’s face, conveying awe and curiosity. Cinematic, high detail, focus on the dinosaur’s reaction and expression.
The dinosaur speaks in a deep, surprised voice with slight reverb: “Whoa! Where did you guys come from?”
中文翻译:
一只戴着黑色飞行员墨镜、身着皮夹克机车服并搭配铆钉项圈的酷炫霸王龙,正立于霓虹流光的荒漠夜色中——四周荧光植物幽幽闪烁(场景延续前作)。它的瞳孔微微扩张,头部缓缓转动,仿佛正对镜头外的未知存在作出反应。恐龙脸上逐渐浮现出显而易见的惊诧神情,眼中交织着敬畏与好奇。电影级特写镜头,聚焦恐龙的面部反应与情绪变化,细节精良。
这只恐龙用低沉、惊讶并带有混响的声音说道:“哇哦!你们是从哪冒出来的?”

6.文生视频:迪斯科开场,外星人和霸王龙对话

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。

Prompt:
Three humanoid aliens with large black eyes, slender, silver limbs, and sleek, dark gunmetal gray metallic shimmering suits, stand cautiously in a vibrant, glowing neon desert at night, with luminescent flora. Behind them, a sleek, silver flying saucer rests on the glowing sand, its ramp still extended and emitting a soft, cool light. They gaze intently just off-camera, with expressions of cautious curiosity. Cinematic, medium shot.
A cool Tyrannosaurus Rex wearing black aviator sunglasses, a leather biker jacket, and a studded collar, stands cautiously in a vibrant, glowing neon desert at night, with luminescent flora. Its head is slightly tilted, gazing intently just off-camera, with an expression of cautious curiosity. Cinematic, close-up.
One humanoid alien speaks in a mysterious, slightly challenging electronic voice: “We come from… a distant place. Do… you dance?”
The T-Rex responds in a deep, excited voice with a confident grin: “Dance? I’m the king of disco!”
中文翻译:
三名长着硕大黑眼、银色细长四肢的人形外星生物,身着光滑的深枪灰色金属光泽制服,正警惕地立于霓虹闪烁的荒漠夜色中,四周荧光植物幽幽生辉。他们身后,一架流线型银色飞碟停驻在发光的沙地上,舱门坡道仍延伸在外,散发着冷色调的柔和光晕。外星人们凝视着镜头外的某处,神情戒备而好奇。电影级中景镜头。
一只戴着黑色飞行员墨镜、身着皮夹克机车服并搭配铆钉项圈的酷炫霸王龙,正警惕地立于霓虹流烁的沙漠夜色中,四周荧光植物幽幽闪烁。它微微偏头凝视镜头外,神情透露出戒备与好奇。电影级特写镜头。
一位外星人用神秘、略带挑衅的电子音说道:“我们来自……遥远的地方。你……会跳舞吗?”
霸王龙兴奋地咧嘴笑,用低沉自信的声音回应:“跳舞?我可是迪斯科之王!”

7.文生视频:迪斯科高潮,外星人和霸王龙跳迪斯科舞蹈

  • 输入框左上角设置为文本转视频,输入框右上角设置为Veo 3-Fast模型、每个提示词输出4个视频。
  • 输入提示词,点击“生成”按钮,等待视频生成。
  • 在所有视频片段都生成后,选择比较满意的视频片段,添加到场景构建器中,排序后下载完整视频文件,导入剪映中添加字幕。

Prompt:
Three humanoid aliens with large black eyes, slender, silver limbs, and sleek, dark gunmetal gray metallic shimmering suits. A cool Tyrannosaurus Rex wearing black aviator sunglasses, a leather biker jacket, and a studded collar. A cool Tyrannosaurus Rex and just three humanoid aliens joyfully dance disco under a wide starry sky,in a vibrant, glowing neon desert at night, with luminescent flora.
Behind them, a sleek, silver flying saucer rests on the glowing sand, its ramp still extended and emitting a soft, cool light. Neon lights flash from a spinning portable disco ball, casting vibrant colors across the sand. They perform energetic retro 70s disco moves—arm waves, spins, and synchronized steps—kicking up dust with every move. The scene glows with cinematic lighting and a fun, high-energy dance party atmosphere in a wide shot.
Upbeat retro 70s disco music plays in the background, featuring a strong beat and funky bassline, perfectly synced with their moves.
中文翻译:
三名长着硕大黑眼、银色细长四肢的人形外星生物,身着光滑的深枪灰色金属光泽制服。一只戴着黑色飞行员墨镜、身着皮夹克机车服并搭配铆钉项圈的酷炫霸王龙。在繁星满天的夜幕下,这支跨物种组合正于霓虹闪烁的荒漠中激情共舞,四周荧光植物随节奏律动。背景中流线型银色飞碟停驻于发光沙地,延伸的舱门坡道散发冷调光晕。旋转的便携迪斯科球投射绚丽彩光,在沙地上跃动斑驳光影。
他们踩着复古70年代迪斯科舞步——挥手、旋转、同步踩点,每个动作都扬起阵阵沙尘。电影级广角镜头下,整个场景笼罩在欢乐高能的派对氛围中。
upbeat复古70年代迪斯科乐曲强劲奏响,鲜明的节拍搭配放克贝斯线,与舞姿完美同步。


四、Flow功能开放总结与注意事项
Flow 提供了一系列功能,这些功能由各种 Veo 模型在后台提供支持,并整合了 Imagen 4 和 Gemini 两大模型,目前具体功能如下:

已开放功能总结:
Veo 3 是 Google DeepMind 最新推出的视频生成模型,在画质表现、提示遵循度和音频协同生成方面均有显著提升。Veo 3 支持:

  • 文本转视频,并添加语音和环境音。
  • 首帧转视频,并添加环境音。
  • 支持音效和语音,保持角色和场景一致性,是目前最强AI视频工具。
  • Veo3-Quality 提供文本转视频和首帧转视频的功能。
  • Veo 3-Fast可将文本快速转换为视频,仅需20积分(是Veo 3-Quality的1/5)。

尚未开放或注意事项:
Google Flow是一个不断发展和迭代的工具,其功能开放情况会动态调整。请注意:

  • 目前Flow仅支持英文提示词输入,及英文语音输出。期待谷歌后续更新。
  • 目前Veo 3 尚不兼容首尾帧、摄像头控制、延长和素材转视频功能。当你想要使用这些功能时,Flow会默认切换回 Veo 2 模型。
  • 音频目前仅在Veo 3上可用,但生成的视频并不总是带有声音。
  • 虽然Flow提供了基础的剪辑和排列,但对于更复杂的编辑,仍需要将生成内容导出后,再导入其他专业软件进行处理。
  • AI生成内容的准确性与可控性:AI生成内容在某些情况下可能仍存在不确定性,例如:生成的人物形象可能不够稳定,或无法精确控制细节。多尝试不同的提示词和参数设置是提高生成质量的关键。

本文案例总结:
虽然AI有上下文理解能力,但跨越不同生成任务(即使是连续的)保持像素级别的角色和环境一致性,尤其是在文本转视频模式下,不使用“参考图片/视频”作为强约束的情况下,依然比较困难。纯文本描述很难像图片或视频那样提供一个“固定模板”,让AI精确复制角色,AI可能会在细节上产生变异,导致角色变了个样,甚至场景细节出现偏差。比如:

  • 角色一致性问题:出现了外星人与霸王龙的穿着长相与上一场景不符;
  • 动作和对焦问题:霸王龙没有面对UFO和外星人说话,可能眼神和身体朝向不对。
  • 角色数量问题:在生成指定的外星人数量时出现偏差,要求3个却生成4-5个。

结语
Flow工具集,特别是强大的Veo 3,为我们打开了AI视频创作的无限可能。通过本篇保姆级教程和案例演示,相信你已经对Flow的功能和操作有了比较全面的了解。技术不是壁垒,创意跟内容才是王道。现在,就去尝试创作属于你自己的AI视频吧!


以上就是本期分享的全部内容,感谢观看。如果你觉得有收获,别忘了点赞、转发、推荐哦!欢迎在评论区交流!
后续我会持续更新分享前沿科技,挖掘AI干货。
欢迎关注,让我们一起探索AI如何改变世界。

原文:
https://zhuanlan.zhihu.com/p/1923037078830184038

- Posted in: AI

- Tags:

0 条评论 ,36 次阅读

发表评论

  1. 既然来了,说些什么?

Top