Google发布了最强视频生成模型Veo2,支持4K高清!

  导语  

近年来,AI 技术在图像和文本生成领域取得了巨大突破,而视频生成领域也迎来了快速发展。谷歌 DeepMind 近期推出了新一代视频生成模型 Veo2,引起了广泛关注。本文将深入解析 Veo2 的技术特点,并将其与 OpenAI 的 Sora 、RuanWay等其他视频生成模型进行对比,带你了解视频生成领域的最新进展。

网友分享在 www.ai987.cn 的图片

1.

Veo 2:视频生成的全新突破

Veo 2 是谷歌 DeepMind 推出的新一代 AI 视频生成模型,旨在提供更高质量、更逼真的视频生成效果。它在以下几个方面取得了显著的进步:

(1)更高的分辨率和更长的视频时长: Veo 2 理论上可以生成高达 4K 分辨率的视频,并且视频时长可以超过 2 分钟,这大大扩展了视频生成的应用场景。目前在 VideoFX 平台上体验最高支持 720p 分辨率和 8 秒的生成视频,但可以延长至 2 分钟或更长时间。

网友分享在 www.ai987.cn 的图片

看这人物头发、着装和显微镜的细节,背景虚化,与专业实拍效果无异。

(2)更强的物理世界理解能力: Veo 2 能够更好地理解物理世界的规律,例如水流的波动、光影的变化、物体运动的轨迹等,从而生成更逼真的视频效果。

网友分享在 www.ai987.cn 的图片

小狗潜水的镜头,一气呵成,从水泡变化到池底的阴影,无可挑剔。

(3)更细腻的人物表情和动作: Veo 2 在生成人物表情和动作时更加自然流畅,避免了其他模型中常见的失真和“AI 扭曲”现象。

泳池的波纹随着小狗脚踩的动作同步泛开,充气船也有明显的下陷痕迹,很难想象这只是根据用户的提示生成的,简直就是梦境照进现实。

(4)更精准的镜头控制: Veo 2 能够理解用户输入的镜头控制指令,例如“镜头缓慢推进她的面庞”、“摄像机在追逐车辆的过程中趋于稳定”等,从而实现更灵活的视频创作。

这种怼脸拍的镜头语言,没几年的摄影功底都拍不出来。

(5)减少“幻觉”: 视频模型经常会出现“幻觉”,例如生成多余的手指或额外的物体,而 Veo 2 产生这些细节的频率较低,使输出更逼真。

淋蜂蜜、倒咖啡细节的刻画宛如真实物体就在眼前。

(6)SynthID 水印技术: Veo 2 采用了不可见的 SynthID 水印技术,用于识别 AI 生成的内容,这有助于提高内容的可信度和安全性。

2.

Veo 2 与其他视频生成模型的对比

网友分享在 www.ai987.cn 的图片

3.

Veo 2 的优势与不足

优势:

  • 生成视频的质量和逼真度更高,尤其是在物理世界理解和人物表情方面。
  • 支持更长的视频时长,扩展了应用场景。
  • 更精准的镜头控制,提供了更灵活的创作方式。
  • SynthID 水印技术提高了内容的可信度和安全性。

不足:

  • 目前仍处于测试阶段,功能和性能可能还不够完善。
  • 生成复杂场景时保持完全一致性仍然存在挑战。

4.

如何申请试用 Veo 2?

目前,Veo 2 的体验主要通过谷歌 DeepMind 的 VideoFX 平台进行。你需要访问 VideoFX 平台并注册/登录才能体验 Veo 2 的功能。

关注我,发送veo2获得试用申请链接。

  结语  

Veo 2 作为一款新一代视频生成模型,在视频质量、物理世界理解、人物表情和镜头控制等方面都取得了显著的进步。虽然它仍处于发展阶段,但其强大的功能和潜力已经引起了业界的广泛关注。随着技术的不断成熟,Veo 2 有望成为视频生成领域的新标杆,并为视频创作带来革命性的变革。人工智能正在以前所未有的速度改变着我们的生活,视频生成技术的发展也为我们带来了无限的想象空间,在不久的将来,人人导演梦不再是梦!让我们共同期待 Veo 2 以及其他 AI 视频生成模型在未来带来更多惊喜!别忘了点赞、分享,让更多人了解AI和开源的魅力!

出处:微信公众号 @GitHub开源盛世

吉ICP备2020006555号

ai987.cn

⌜ 免 责 声 明 ⌝
本站仅为个人学习AI(人工智能)知识的相关日志,网页内容(如有图片或视频亦包括在内)短期缓存均无商业目的。
遇有侵害您合法权益之处欲申诉删改,可联络处理(删/改)!