扫码加好友

VEO 3.1 正面硬刚 Sora 2!我扒了5个极限场景,Sora竟然输麻了?
备受瞩目的VEO 3.1终于上线了!

更离谱的是,Lovart在谷歌上线前就已经支持VEO 3.1了。
为了测试AI视频、生图模型,我入了Lovart的basic年包,接下来一个月都可以0积分畅用VEO 3.1和Sora 2-pro。按Lovart的调性,会在新的SOTA模型上线后第一时间接入,实在太划算了!感兴趣的朋友可以去试试:点击这里
这次VEO 3.1的发布带来了两个实用的“新”功能,但其实都是国产模型玩剩下的:多参考图、首尾帧。
现在就来试一下。等不及的可以直接跳到下半部分看:VEO 3.1和Sora 2 Pro的深度对比。
一、多参考图
这是Sora 2 Pro还没有的玩法。在Lovart打开画布,可以提前上传三张图,或者直接用里面的生图模型来画。左边工具栏打开视频生成器,切换到VEO 3.1就能看到多图参考。
此时可以直接从画布上选择需要参考的图:

注意最多可以选择三张图,参考提示词:
💡 三个角色来到咖啡店,一边喝咖啡一边聊天的场景。人物的一致性表现得不错,画面清晰度很高。
二、首尾帧拍广告片
Lovart作为设计工作室,能直接在同一张画布上排列分镜,多通道生成,从分镜到完整视频一气呵成。刚好适合我们来试试用VEO 3.1的首尾帧拍广告片。
这是成品,质感还不错吧?整个视频的起点其实只有两张图:
1、人物与产品交互
先生成让人物戴上耳机的图:
💡 图#1女人站在图#2的展台前戴上图#2的耳机,保持图#2的场景。在Lovart直接让它生成5张来抽卡。
接着在合适的图片中点一下对话框,直接给下一步的需求。

2、生成分镜图片
视频实际上是由多个分镜拼接起来的,而每个分镜是有两张图作为首尾帧生成。此时可以把创意想法告诉ChatGPT,让它帮忙生成分镜脚本和生图提示词。
例如:
💡 年轻女孩戴着白色耳机,单手轻轻扶在耳机上,另一只手抬起,仿佛准备跟随音乐舞动。背景是现代极简的白色展厅,女孩的姿态自然。

最终把符合预期的图片都提取出来,按顺序排好,就形成了整个视频的「关键帧」。
3、分镜图转视频(示例)
给上面排列的图,两两生成首尾帧的提示词,作为各自分镜的视频。例如开头第一幕:
💡 耳机悬浮在纯白展厅的台座前,女孩从画面左侧缓缓进入,动作优雅自然,伸手拿起耳机戴在头上。
第四幕:

💡 女孩在跳动间她右手轻触耳罩切换模式,动作由动转静;镜头侧向滑移并收至侧脸近景,突显耳罩触控与金属质感,表情专注、听感更沉浸。
4、剪辑拼接
最后放到剪映剪辑拼接加上音效即可。

VEO 3.1 与 Sora 2 Pro 终极对决
VEO 3.1在网上风评炸了锅,舆论好评纷纷导向Sora 2。但我经常用起来感觉VEO一直都不错。
为了搞清楚它俩的真实水平,我设计了5个堪称“地狱难度”的极限测试,涵盖了运镜、物理、声景等核心能力。不测不知道,一测吓一跳——Sora 2居然在好几个场景中输得惨不忍睹!
1、复杂运镜
VEO 3.1的表现非常精准,能完美还原技术性强的指令。例如:
💡 一个男人喃喃自语:“一定就是这个。这是密码。”女人看着他,兴奋地低语:“你发现了什么?”
VEO 3.1的声音太“干净”了,对白和背景的火炬噼啪声就像是后期制作中被清晰分离并“贴”上去的,缺乏真实的空间反射,更像是在录音室里录制的。
相比之下,Sora 2 Pro的音频:角色的对白中带有些微的混响和空间感,模拟了人物在石室或洞穴中说话的真实声学效果,创造了极强的“临场感”和真实氛围。
2、群像运动
VEO 3.1表现得非常不错,肢体动作流畅连贯,手持追踪镜头稳定,并且精准同步了环境音效(击球声、欢呼声),完美符合提示词要求。而Sora 2 Pro的排球和人物运动规律完全是错的。
3、对话与声景控制
VEO 3.1的声音太“干净”了,对白和背景的火炬噼啪声就像是后期制作中被清晰分离并“贴”上去的,缺乏真实的空间反射,更像是在录音室里录制的。Sora 2 Pro的音频则更自然,角色的对白中带有些微的混响和空间感。
4、群像运动
VEO 3.1表现得非常不错,肢体动作流畅连贯,手持追踪镜头稳定,并且精准同步了环境音效(击球声、欢呼声),完美符合提示词要求。而Sora 2 Pro的排球和人物运动规律完全是错的。
5、复杂运镜
VEO 3.1的表现非常精准,能完美还原技术性强的指令。例如:
💡 一个男人喃喃自语:“一定就是这个。这是密码。”女人看着他,兴奋地低语:“你发现了什么?”
VEO 3.1的声音太“干净”了,对白和背景的火炬噼啪声就像是后期制作中被清晰分离并“贴”上去的,缺乏真实的空间反射,更像是在录音室里录制的。
相比之下,Sora 2 Pro的音频:角色的对白中带有些微的混响和空间感,模拟了人物在石室或洞穴中说话的真实声学效果,创造了极强的“临场感”和真实氛围。
VEO 3.1与Sora 2 Pro的核心优势泾渭分明
VEO 3.1是精准的“执行者”。它在复杂运镜、物理交互和群像运动上表现卓越,能精确还原技术性强的指令。因此,它极度适合制作广告片、产品演示、动作场面等需要高度控制和清晰画质的场景。
Sora 2 Pro更像是一位“艺术家”。它擅长营造电影级的真实感和沉浸式声景,能创造出极具感染力的情绪和氛围。这使其更适用于电影预告、艺术短片或任何侧重情绪表达与故事感的叙事场景。
实测下来,VEO 3.1也没网上说的那么差啊?只是Sora 2 Pro珠玉在前,而VEO只有0.1版本的升级,导致大家失望了而已。大家觉得呢?哪个更好用?
如果还没渠道用的,可以看看Lovart,目前在福利期,还是很划算的:点击这里
微信:dszb199 关注我们,获取更多AI工具和教程!
