Google发布了最强视频生成模型Veo2,支持4K高清!
导语
近年来,AI 技术在图像和文本生成领域取得了巨大突破,而视频生成领域也迎来了快速发展。谷歌 DeepMind 近期推出了新一代视频生成模型 Veo2,引起了广泛关注。本文将深入解析 Veo2 的技术特点,并将其与 OpenAI 的 Sora 、RuanWay等其他视频生成模型进行对比,带你了解视频生成领域的最新进展。
1.
Veo 2:视频生成的全新突破
Veo 2 是谷歌 DeepMind 推出的新一代 AI 视频生成模型,旨在提供更高质量、更逼真的视频生成效果。它在以下几个方面取得了显著的进步:
(1)更高的分辨率和更长的视频时长: Veo 2 理论上可以生成高达 4K 分辨率的视频,并且视频时长可以超过 2 分钟,这大大扩展了视频生成的应用场景。目前在 VideoFX 平台上体验最高支持 720p 分辨率和 8 秒的生成视频,但可以延长至 2 分钟或更长时间。
看这人物头发、着装和显微镜的细节,背景虚化,与专业实拍效果无异。
(2)更强的物理世界理解能力: Veo 2 能够更好地理解物理世界的规律,例如水流的波动、光影的变化、物体运动的轨迹等,从而生成更逼真的视频效果。
小狗潜水的镜头,一气呵成,从水泡变化到池底的阴影,无可挑剔。
(3)更细腻的人物表情和动作: Veo 2 在生成人物表情和动作时更加自然流畅,避免了其他模型中常见的失真和“AI 扭曲”现象。
泳池的波纹随着小狗脚踩的动作同步泛开,充气船也有明显的下陷痕迹,很难想象这只是根据用户的提示生成的,简直就是梦境照进现实。
(4)更精准的镜头控制: Veo 2 能够理解用户输入的镜头控制指令,例如“镜头缓慢推进她的面庞”、“摄像机在追逐车辆的过程中趋于稳定”等,从而实现更灵活的视频创作。
这种怼脸拍的镜头语言,没几年的摄影功底都拍不出来。
(5)减少“幻觉”: 视频模型经常会出现“幻觉”,例如生成多余的手指或额外的物体,而 Veo 2 产生这些细节的频率较低,使输出更逼真。
淋蜂蜜、倒咖啡细节的刻画宛如真实物体就在眼前。
(6)SynthID 水印技术: Veo 2 采用了不可见的 SynthID 水印技术,用于识别 AI 生成的内容,这有助于提高内容的可信度和安全性。
2.
Veo 2 与其他视频生成模型的对比
3.
Veo 2 的优势与不足
优势:
- 生成视频的质量和逼真度更高,尤其是在物理世界理解和人物表情方面。
- 支持更长的视频时长,扩展了应用场景。
- 更精准的镜头控制,提供了更灵活的创作方式。
- SynthID 水印技术提高了内容的可信度和安全性。
不足:
- 目前仍处于测试阶段,功能和性能可能还不够完善。
- 生成复杂场景时保持完全一致性仍然存在挑战。
4.
如何申请试用 Veo 2?
目前,Veo 2 的体验主要通过谷歌 DeepMind 的 VideoFX 平台进行。你需要访问 VideoFX 平台并注册/登录才能体验 Veo 2 的功能。
关注我,发送veo2获得试用申请链接。
结语
Veo 2 作为一款新一代视频生成模型,在视频质量、物理世界理解、人物表情和镜头控制等方面都取得了显著的进步。虽然它仍处于发展阶段,但其强大的功能和潜力已经引起了业界的广泛关注。随着技术的不断成熟,Veo 2 有望成为视频生成领域的新标杆,并为视频创作带来革命性的变革。人工智能正在以前所未有的速度改变着我们的生活,视频生成技术的发展也为我们带来了无限的想象空间,在不久的将来,人人导演梦不再是梦!让我们共同期待 Veo 2 以及其他 AI 视频生成模型在未来带来更多惊喜!别忘了点赞、分享,让更多人了解AI和开源的魅力!
出处:微信公众号 @GitHub开源盛世