5月15日 消息:在今日举行的谷歌2024I/O开发者大会上,谷歌正式推出了备受瞩目的全新视频生成模型——Veo。这款产品被视为对OpenAI三个月前推出的文本转视频工具Sora的直接挑战,旨在为用户提供更加高质量、多风格的视频生成体验。
据谷歌官方新闻稿介绍,Veo不仅支持生成时长超过1分钟、分辨率最高达1080P的高质量视频,而且具备对自然语言的先进理解能力,能够精准捕捉“延时摄影”、“航拍风景”等电影术语,并将其转化为生动的视觉表达。
用户可以通过文本、图像或视频提示来指导Veo生成所需的视频内容。谷歌表示,Veo生成的视频将具有更高的连贯性和一致性,人物、动物和物体的动作也将更加逼真。为了更直观地展示Veo的强大功能,谷歌还附上了演示视频供用户参考。
在周一的媒体预览会上,谷歌DeepMind首席执行官德米斯-哈萨比斯(Demis Hassabis)进一步透露,Veo的视频结果可以通过额外的提示进行完善,以满足用户更加精细化的需求。此外,谷歌还在积极探索更多功能,使Veo能够制作故事板和更长的场景,进一步拓展其应用场景和创作空间。
凭借其高质量、多风格的视频生成能力和对自然语言的先进理解能力,Veo将成为视频创作者、广告商、影视制作人员等各行各业人士的重要工具。同时,这也标志着谷歌在人工智能领域的持续创新和突破,为未来的视频创作和应用提供了更加广阔的想象空间。