
团队表示,与 LLM 不同,视频模型要处理长序列和复杂的执行流程。并且模型的每个组件都具有独特的特征,对内存和计算提出了不同的挑战。VideoSys 是一个简单高效的视频生成系统,旨在让视频生成对于每个人而言都简便、迅速且成本低廉。此外,它还是一个开源项目,为视频生成提供了一个用户友好的高性能基础设施。这个全面的工具包将支持从训练、推理到服务和压缩的整个 pipeline。它标志着视频生成的新篇章。从 OpenDiT 到 VideoSys,尤洋团队的相关工作已经收获了 1.4k 的 star 量。
项目链接:https://github.com/NUS-HPC-AI-Lab/VideoSys
安装方法
安装准备代码:
Python >= 3.10
PyTorch >= 1.13(建议使用 2.0 以上版本)
CUDA >= 11.6
强烈建议使用 Anaconda 创建一个新环境(Python>=3.10)来运行示例:
conda create -n videosys python=3.10 -y
conda activate videosys
git clone https://github.com/NUS-HPC-AI-Lab/VideoSyscd VideoSys
pip install -e
使用方法
加速技术PAB - Pyramid Attention Broadcast
博客:https://arxiv.org/abs/2403.10266
文档:https://github.com/NUS-HPC-AI-Lab/VideoSys/blob/master/docs/pab.md
