快手新动作！联合推出开源文生视频ai模型，效果如何？-凯发app平台

时间：2024-10-12 11:25 作者：唐云泽

近日，快手科技、北京大学和北京邮电大学携手，共同推出了pyramid flow文生视频模型。这款模型能够根据用户输入的文本，生成最长可达10秒、分辨率为1280x768、帧率为24fps的高质量视频。这一创新成果为开发者、艺术家和创作者们带来了更高效、更灵活的视频生成凯发app平台的解决方案，并已在hugging face平台上线，实现完全开源。

pyramid flow的核心优势在于其高效生成的能力。该模型采用新技术，通过统一的ai模型分阶段生成视频，其中大多数阶段为低分辨率，仅在最后阶段达到全分辨率。这种“金字塔流匹配”方法在保持视频高视觉质量的同时，大幅降低了计算成本，其tokens数量仅为传统diffusion模型的四分之一。

在推理速度方面，pyramid flow同样表现出色。它能够在56秒内生成一个5秒、384p的视频，速度上媲美甚至超过了许多全序列diffusion模型。

pyramid flow在mit许可证下发布，允许包括商业应用、修改和再分发在内的广泛使用。这一开源和商业友好的政策，吸引了众多希望将模型集成到专有系统中的开发者和公司。

更多>同类内容

10-17

点击查看更多