4. 制作视频


image-20260516233750630

Gemini 借助 Veo 3 视频生成模型,可以根据文字描述创建视频内容。点击输入框下方的「工具」按钮,选择「制作视频」即可使用。

目前,Gemini 网页端「制作视频」使用的是 **Veo 3.1 Pro 和 Veo 3.1 Lite **模型。

Veo 3 模型家族:

模型API 名称定位
Veo 3veo-3.0-generate-preview初代,原生音频,5 月发布
Veo 3.1veo-3.1-generate-preview旗舰版,更强提示词遵循 + 更丰富音频 + 多图参考
Veo 3.1 Fastveo-3.1-fast-generate-preview速度优化版,平衡质量和成本
Veo 3.1 Liteveo-3.1-lite-generate-preview最具性价比版,价格不到 Fast 的一半,速度相同

Veo 3 的特点:

  1. 原生同步音频 —— 对白、音效、环境声、背景音乐在一次生成中完成,唇形同步精度约 120ms,足以以假乱真
  2. 真实物理模拟 —— 水流、布料、烟雾、碎裂等物理行为基于真实世界规律
  3. 专业电影语言 —— 模型理解几十种电影术语:dolly shot、crane shot、shallow depth of field、Rembrandt lighting 等
  4. 多图参考(Ingredients to Video) —— 上传最多 3 张参考图(人物、物体、场景),保持跨片段一致性
  5. 首尾帧控制(First/Last Frame) —— 给定开始和结束画面,模型生成中间过渡
  6. 场景延伸(Scene Extension) —— 把多段 8 秒片段连成 1 分钟以上的连续叙事
  7. 多分辨率多比例 —— 720p/1080p(Pro 可达 4K),16:9 横版或 9:16 竖版

核心规格:

  • 单次生成 4 秒 / 6 秒 / 8 秒
  • 24fps,48kHz 立体声音频
  • 所有输出带 SynthID 隐形数字水印

提示词编写

官方五要素公式

Google Cloud 官方在《Ultimate Prompting Guide for Veo 3.1》中给出的标准公式:

[镜头语言] + [主体] + [动作] + [环境] + [风格氛围]
要素说明例子
Cinematography 镜头语言摄影机运动、构图、镜头中景、推镜头、低角度、浅景深
Subject 主体谁/什么是焦点一位疲惫的上班族、一只橘猫
Action 动作在做什么揉太阳穴、打开伞、转身
Context 环境在哪里、什么时间1980 年代凌乱办公室、深夜
Style & Ambiance 风格氛围美学风格、光线、情绪复古胶片质感、绿色显示器光、压抑

示例一:1980 年代深夜办公室

中景镜头:一位疲惫的上班族在凌乱的办公室深夜揉着太阳穴,
面前是一台笨重的 1980 年代电脑
场景由刺眼的荧光顶灯和单色显示器的绿光照亮
复古美学,宛如 1980 年代彩色胶片拍摄,略带颗粒感。

***此处插入视频:Gemini-260507-101.mp4

示例二:晨雾日式庭院的橘猫

低角度跟拍长镜头:一只橘白相间的猫咪在初秋清晨缓缓穿过
铺满落叶的石板小径,尾巴轻摆,偶尔停下用爪子拨弄一片
飘落的枫叶。背景是被晨雾笼罩的日式庭院,远处石灯笼若隐
若现。柔和的金色逆光从枝叶间洒下,色调温暖偏低饱和,
吉卜力动画质感的真实摄影风格,宁静治愈。

***此处插入视频:Gemini-260512-114.mp4

示例三:赛博朋克东京雨夜

推镜头从远景缓缓推进至中景:一位身穿黑色长风衣的年轻
女性站在 2099 年东京十字路口中央,微微抬头凝视空中
漂浮的全息广告牌,雨水沿着她的发梢滴落。环境是赛博
朋克风霓虹街区,紫色与青色霓虹灯反射在湿润的柏油
路面上,人群在她身后快速虚化穿行。低饱和高对比的
电影感调色,浅景深,Blade Runner 2049 美学,氛围
孤独而迷离。

***此处插入视频:Gemini-260512-115.mp4

镜头语言

Veo 3 对电影术语理解非常深入,用专业词汇比用形容词更精准。

摄影机运动(Camera Movement)

英文术语中文说明
Dolly shot推/拉镜头摄影机平滑前进或后退
Tracking shot跟拍摄影机跟随主体移动
Crane shot升降镜头摄影机高度变化,常用于全景揭示
Aerial view航拍从空中俯瞰
Slow pan慢摇摄影机水平转动
POV shot主观视角第一人称视角
Whip pan急速摇镜高速横扫,常用于转场
Handheld手持模拟手持摄影机的轻微抖动,增加真实感
Parallel trucking平行跟拍摄影机和主体平行移动,常见于追逐戏

构图(Composition)

英文术语中文说明
Wide shot远景展现完整环境
Medium shot中景腰部以上
Close-up特写面部或局部细节
Extreme close-up大特写极致放大的局部
Low angle低角度仰拍,营造威严或压迫感
High angle高角度俯拍,营造渺小或脆弱感
Two-shot双人镜头两人同框
Over-the-shoulder越肩镜头从一人肩后看另一人

镜头与焦点(Lens & Focus)

英文术语中文说明
Shallow depth of field浅景深f/1.8 类似效果,主体清晰背景虚化
Wide-angle lens广角镜头视野宽阔,适合环境和风景
Macro lens微距镜头极近距离拍摄细节
Soft focus柔焦柔和朦胧效果
Deep focus深焦前后景都清晰

光线词典

Veo 3 对专业布光术语具备准确的理解力,能够还原对应的光质、方向和色温。

英文术语中文说明
Golden hour黄金时刻光日出日落前后的温暖斜光
Rembrandt lighting伦勃朗光经典人像布光,脸侧呈现三角光斑
Chiaroscuro明暗对比深黑配高光,戏剧化效果
Low-key lighting低调光极少光源,营造神秘和紧张
High-key lighting高调光泛光铺满,明快轻松
Noir黑色电影光硬光 + 强对比 + 长投影
Practical lighting实用光源画面里能看到的光源(路灯、台灯、车灯)
Motivated lighting动机光暗示画外光源(窗外阳光、街灯透窗)
Cool tones冷色调5600K 类似日光,适合专业、清醒内容
Warm tones暖色调3200K 类似钨丝灯,适合亲密、怀旧场景

示例一:悬疑氛围

跟拍中景:一位穿米色风衣的女性独自走在深夜空旷的
地下停车场,摄影机在她身后约 3 米跟随,镜头带轻微的
手持晃动。她突然回头张望了一眼,脚步加快。

光线:以低调光为主,仅用车库顶部稀疏的实用光源
(几盏荧光灯管)照亮局部,长投影拖曳在水泥地面。
整体偏冷色调(5600K),营造冰冷不安的氛围。

风格:黑色电影质感,高对比,胶片颗粒。
时长:8 秒,比例 16:9,无字幕。

***此处插入视频:Gemini-260507-102.mp4

示例二:温暖治愈

浅景深特写:一位年轻女性侧脸靠在木窗框上,
睫毛低垂正在读一本旧书。摄影机保持静止,焦点
锁在她的睫毛和书页之间,背景虚化成柔和光斑。

光线:黄金时刻光从窗户斜射进来,在她脸侧形成
经典的伦勃朗光三角光斑。光线属于动机光——
观众能感受到温暖来自窗外。整体暖色调(3200K),
肤色温润。

风格:电影感生活方式拍摄,柔和胶片质感,
类似 Wong Kar-wai 的午后镜头。
时长:6 秒,比例 16:9。

***此处插入视频:Gemini-260507-103.mp4

示例三:史诗壮阔

升降镜头:从一位徒步者的低角度仰拍开始,
摄影机缓慢升高并向后拉远,逐渐变成航拍远景,
揭示出他正站在一片广阔山脊的边缘,脚下是
被晨雾填满的巨大峡谷。

光线:清晨的黄金时刻光从画面右侧低角度照入,
为山脊勾出明亮金边,山谷中的雾气形成柔和光柱,
属于明暗对比效果——前景山脊明亮锐利,远景峡谷
深沉幽暗。整体高调光基调,但保留戏剧化阴影。

风格:史诗奇幻电影感,类似《指环王》开场镜头,
广角畸变,画面恢弘。
时长:8 秒,比例 16:9。

***此处插入视频:Gemini-260507-104.mp4

多场景模板

"[ ]" 内的内容均为占位符,可根据实际需求自行替换。

示例一:化妆品微距广告

微距镜头:一瓶 [玫瑰金色精华液] 瓶子缓慢旋转,瓶身反射
环境的柔和光晕。一滴 [金色液体] 从滴管缓慢滴落到瓶口,
激起一圈细腻波纹。镜头随后拉远到中景,瓶子悬浮在
[淡粉色丝绸] 背景前,散落几片真实的 [玫瑰花瓣] 缓慢飘下。

光线:戏剧化侧光从右上方扫过瓶身,背景柔和粉色渐变,
暖色调(3200K)。
风格:高端美容品牌大片,奢华质感,浅景深,4K 锐利。

音频:
- 音效:液滴落下的清脆声、丝绸轻微摆动的细响
- 环境声:极安静的工作室底噪
- 配乐:低饱和度的弦乐铺底

时长:6 秒,比例 9:16,无文字叠加。

***此处插入视频:Gemini-260512-116.mp4

示例二:黄金时刻人物特写

浅景深特写:一位 [28 岁亚洲女性] 站在 [城市天台],
夕阳金光从右侧打在她的侧脸,[长发] 被风轻轻吹起。
她缓缓闭上眼睛,嘴角微微上扬,露出 [释然的微笑]。

摄影机:极轻微的推镜头。
光线:黄金时刻光从右侧低角度照入,伦勃朗光在脸侧形成
三角光斑,暖色调(3200K)。
风格:电影感胶片质感,类似 [Wong Kar-wai] 的午后镜头。

音频:
- 环境声:[微风声、远处隐约的城市交通声]
- 配乐:[缓慢起音的钢琴] 铺底

时长:6 秒,比例 16:9,无字幕。

***此处插入视频:Gemini-260513-128.mp4

示例三:运动鞋广告

平行跟拍:[一位运动员] 在 [城市夜晚的湿润街道] 上奔跑,
摄影机在他左侧约 1 米平行移动,捕捉鞋底蹬踏地面的瞬间。
水花从鞋边溅起形成动感弧线。城市霓虹光带形成模糊光轨。
镜头最后切到 [鞋的微距特写]:浅景深,霓虹光在鞋面
反光网格上跳动。

光线:低调光为主,霓虹实用光源(紫粉色、青蓝色)
点缀,冷色调(5600K)。
风格:[耐克级别运动品牌广告],动感强烈,电影级慢动作。

音频:
- 音效:强劲的鞋底着地声、风穿过耳朵的呼啸声
- 环境声:远处城市夜晚嘈杂、雨后湿润街道感
- 配乐:心跳节奏感的电子鼓点

时长:8 秒,比例 16:9。

***此处插入视频:Gemini-260517-153.mp4

示例四:史诗自然风景

升降镜头:从 [一位孤独登山者] 的低角度仰拍开始,
摄影机缓慢升高并向后拉远,逐渐变成航拍远景,
揭示出他正站在 [一片广阔山脊的边缘],
脚下是 [被晨雾填满的巨大峡谷]。

光线:清晨黄金时刻光从画面右侧低角度照入,
为山脊勾出明亮金边,山谷雾气形成柔和光柱,
明暗对比强烈。
风格:史诗奇幻电影感,类似 [《指环王》开场镜头],
广角畸变,画面恢弘。

音频:
- 环境声:山风穿过岩石的呼啸、远处鹰鸣
- 配乐:渐起的管弦交响乐

时长:8 秒,比例 16:9。

***此处插入视频:Gemini-260514-140.mp4

示例五:3D 卡通动画短片

中景镜头:一只 [圆滚滚的橘色小猫] 坐在 [窗台上],
看着窗外飘落的雪花,眼睛瞪得圆圆的。它伸出一只小爪子
轻轻贴在玻璃上,留下一个小肉垫印。然后转过头对着
镜头歪了一下脑袋,眨了眨眼睛。

光线:柔和体积光从窗外洒入,温暖色调(3200K),
毛发细节丰富。
风格:[皮克斯 / Illumination] 3D 动画美学。

音频:
- 音效:小爪子贴玻璃的轻响、壁炉柴火的微弱噼啪声
- 环境声:室内安静、远处偶尔的风声
- 配乐:温暖的木吉他铺底

时长:6 秒,比例 16:9。

***此处插入视频:Gemini-260514-141.mp4

示例六:赛博朋克城市街头

低角度跟拍:一个 [穿黑色长风衣的人物] 从镜头前走过,
背后是一条 [充满霓虹招牌的潮湿狭窄街道]。雨水从空调
外机滴下,街道上倒映着 [粉红、青蓝、金黄] 的霓虹光。
全息广告投影在湿润空气中闪烁。

光线:低调光基调,霓虹实用光源构成主要光源,
强烈氛围光,冷色调(5600K),雾气弥漫。
风格:赛博朋克,类似 [《银翼杀手 2049》],胶片质感。

音频:
- 音效:雨滴密集落地、远处车流穿过水面
- 环境声:模糊的 [日语广播声]、城市电子嗡鸣
- 配乐:低频合成器电子音乐铺底

时长:8 秒,比例 16:9。

***此处插入视频:Gemini-260514-142.mp4

示例七:美食 ASMR

一杯 [刚冲好的抹茶拿铁],
[牛奶] 缓缓倒入抹茶中形成漩涡,最后用拉花针画出
[一片简单的叶子图案]。

摄影机:从正上方略斜俯拍,静止。
光线:柔和咖啡馆窗光从画面右侧照入,丝绒色彩饱和度,
暖色调(3200K)。
风格:[ASMR 美食视频],极致质感细节。

音频:
- 音效:牛奶倒入的细腻液体声、勺子轻碰陶瓷杯的声音
- 环境声:远处咖啡馆人声虚化
- 配乐:轻柔的木吉他

时长:8 秒,比例 16:9,无人声。

***此处插入视频:Gemini-260514-143.mp4

示例八:企业宣传航拍

航拍跟随镜头:从高空俯瞰 [一座现代玻璃幕墙办公楼],
镜头缓慢下降并向前推进,最后透过窗户进入到
[一个开放式办公室],[年轻员工们在协作讨论]。

光线:清晨自然光从大窗洒入,高调光基调,
干净蓝白色调(5600K)。
风格:高端企业宣传,专业航拍 + 室内自然光,
类似 [Apple 广告] 美学。

音频:
- 环境声:远处城市背景音、办公室轻微讨论声
- 音效:键盘敲击、纸张翻动
- 配乐:起势的企业级管弦乐

时长:8 秒,比例 16:9,无对白。

***此处插入视频:Gemini-260514-144.mp4

评论

0
还没有评论,来写第一条吧