当前位置:首页 > 软件 > >

谷歌推出VideoPoet 支持根据文本提示生成10秒的视频剪辑

谷歌推出VideoPoet 支持根据文本提示生成10秒的视频剪辑
2023-12-21 18:00:30 来源:聚焦媒体网

在 Microsoft 的 Copilot AI 能够从文本提示生成音频剪辑后,谷歌推出了 VideoPoet,这是一种大型语言模型 (LLM),它通过 10 秒的剪辑突破了视频生成的界限,产生的伪影更少。该模型支持一系列视频生成任务,包括文本到视频的转换、图像到视频的转换、视频风格化、修复和视频到音频功能。

它从文本提示生成 10 秒的视频剪辑,并且还能够为静止图像制作动画

 

 

与前代不同,VideoPoet 在生成连贯的大动作视频方面表现出色,从而脱颖而出。该模型通过制作10 秒长的视频来展示其实力,将包括 Gen-2 在内的竞争对手甩在身后。值得注意的是,VideoPoet 不依赖特定数据来生成视频,这与其他需要详细输入以获得最佳结果的模型区分开来。

这种多方面的能力是通过利用多模态大型模型实现的,使其走上有可能成为视频生成主流的轨道。

谷歌的VideoPOET与视频生成模型的流行趋势背道而驰,视频生成模型主要依赖于基于扩散的方法。相反,VideoPoet 利用了大型语言模型 (LLM) 的强大功能。该模型将各种视频生成任务无缝集成到单个 LLM 中,无需为每个功能单独训练组件。

生成的视频根据输入的文本内容表现出可变的长度和不同的动作和风格。此外,VideoPoet 可以根据提供的提示将输入图像转换为动画,展示其对不同输入的适应性。

VideoPOET的发布为人工智能驱动的视频生成增加了一个新的维度,暗示了2024年的可能性。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

投诉邮箱:Email:133 46734 45@qq.com

相关新闻