Open-Sora-Plan v1.0.0：国产AI芯片支持的高质视频生成

版权申诉

67 浏览量更新于2024-11-18 收藏 540KB ZIP 举报

资源摘要信息: "本项目旨在重现 Sora（Open AI T2V 模型）并鼓励开源社区做出贡献" Sora 是一个开源项目，其核心目标是复刻 Open AI 推出的 T2V (Text-to-Video) 模型，该项目的版本标识为 Open-Sora-Plan v1.0.0。该版本对视频生成质量进行了显著提升，并且加强了文本到视频转换过程中的控制功能。为了更好地理解项目成果，参考报告和演示材料已经被提供。根据描述，该项目团队在视频生成方面取得了以下突破： 1. 高分辨率视频生成：团队已经能够生成超过 1024 像素分辨率的视频。 2. 长时视频生成：目前支持的视频生成时长已经超过 10 秒。 3. 视频质量演示：为了向公众展示这些改进，项目团队在 GitHub 上发布了压缩的.gif 格式视频。虽然这种格式会损失一定的质量，但仍能展示技术进步。 4. 国产 AI 芯片支持：目前，该模型已经可以在国产的 AI 芯片华为昇腾910上进行推理操作。团队期待未来能支持更多的国产算力芯片进行训练和推理。 5. 代码库与训练支持：项目提供了一个可扩展的代码库，并且鼓励社区成员基于此进行训练和开发。团队已经在景观数据集上训练了无条件模型，并计划在此基础上继续实验和优化。此外，项目中提到了几个与技术相关的关键词和概念： - text2video：指的是将文本转化为视频的技术，这涉及到深度学习模型理解和生成视频内容的能力。 - video2text：是指将视频内容转化为文本描述，这对于视频内容理解和检索具有重要意义。 - 1080p 模型：表明模型支持生成或处理高分辨率的视频内容。 - 条件模型：指在生成过程中可以指定特定条件，以达到更精准控制视频内容的效果。该项目的标签为“人工智能”和“软件/插件”，说明它是一个与人工智能技术紧密相关的软件项目，可能会以插件形式在其他软件系统中使用。文件名称列表中的 "Open-Sora-Plan-main" 指向了项目的主要代码仓库，可能包含了项目的源代码、文档和训练数据等资源。整体而言，这个项目是 AI 领域内一项前沿技术的开源尝试，其目的是让更多的研究人员和开发者能够参与到 Sora 模型的开发和优化中来，共同推动 AI 视频生成技术的发展。对于那些对人工智能、深度学习模型、视频生成技术感兴趣，并且希望参与实际项目的研究者和开发者来说，这将是一个非常有价值的开源项目。同时，社区的参与将有助于提高模型的性能、扩展其功能，以及加速技术的创新和应用。

收起资源包目录

本项目旨在重现 Sora（Open AI T2V 模型）们希望开源社区为本项目做出贡献（228个子文件）

LICENSE 1KB

rec_imvi_vae.py 5KB

train_causalvae.py 5KB

feature_datasets.py 9KB

attention.py 8KB

path.py 7KB

hostfile 68B

train_t2v_t5_feature.py 38KB

losses.py 18KB

timestep_sampler.py 6KB

correlation.py 14KB

t2v_datasets.py 5KB

caption_refiner.py 5KB

perceptual_loss.py 16KB

vqgan.py 17KB

README.md 23KB

run_docker.png 86KB

README.md 973B

quantize.py 18KB

train_t2v_feature.py 36KB

modeling_causalvqvae.py 30KB

rgt_arch.py 28KB

fvd.py 5KB

pretrained_networks.py 7KB

Contribution_Guidelines.md 3KB

paired_image_dataset.py 5KB

curope.cpp 2KB

pwcnet.py 15KB

sample_t2v.py 8KB

README.md 1KB

feat_enc.py 11KB

eval_common_metric.py 9KB

discriminator.py 5KB

zero3_offload.json 955B

AMT-G.py 8KB

rgt_model.py 6KB

logger.py 7KB

modeling_vqvae.py 27KB

gaussian_diffusion_t2v.py 36KB

clip.py 8KB

updownsample.py 7KB

misc.py 5KB

LICENSE 1KB

Report-v1.0.0-cn.md 11KB

transport.py 14KB

zero3.json 798B

transforms.py 6KB

pos.py 6KB

modeling_causalvae.py 22KB

gradio_web_server.py 5KB

placeholder 0B

utils.py 16KB

arch_util.py 11KB

captions.json 173B

zero2.json 553B

gradio_utils.py 7KB

.gitignore 157B

build_docker.png 63KB

readme.md 1KB

modules.py 73KB

transform.py 15KB

img_util.py 6KB

dockerfile.base 891B

VQVAE.md 2KB

modeling_latte.py 61KB

interpolation.py 6KB

vgg_arch.py 6KB

sky_datasets.py 5KB

Data.md 1KB

matlab_functions.py 14KB

sample.py 5KB

gaussian_diffusion.py 34KB

sr_model.py 9KB

release.json 1KB

t5.py 8KB

model.py 30KB

data_util.py 10KB

zero2_offload.json 648B

EVAL.md 4KB

train.py 35KB

rec_video_vae.py 9KB

pytorch_i3d.py 13KB

flolpips.py 13KB

utils.py 8KB

train_t2v.py 37KB

README.md 2KB

lpips.py 5KB

raft.py 8KB

transport_sample.py 8KB

respace.py 8KB

file_client.py 6KB

kernels.cu 4KB

pipeline_videogen.py 35KB

run.py 5KB

eval_clip_score.py 8KB

Train_And_Eval_CausalVideoVAE.md 7KB

pos_embed.py 5KB

Report-v1.0.0.md 13KB

base_model.py 15KB

options.py 7KB

共 228 条

传奇开心果编程

粉丝: 1w+
资源: 454

Open-Sora-Plan v1.0.0：国产AI芯片支持的高质视频生成

开源社区共建Python重现Sora Open AI T2V模型

重现Sora AI项目：开源社区的共同挑战与机遇

开源项目实现：Sora-ai生成高质量视频流程

Python_这个项目旨在重现Sora Open AI T2V模型，我们希望开源社区为这个项目做出贡献.zip

这个项目旨在重现Sora（Open AI T2V模型），但我们只有有限的资源 我们衷心希望所有开源社区都能为这个项目做出贡献

Sora OpenAI的革命性视频生成模型.txt

OpenAI发布文生视频模型Sora 视频4

OpenAI发布文生视频模型Sora 视频16

OpenAI发布文生视频模型Sora 视频13

OpenAI发布文生视频模型Sora 视频21

最新资源

这个项目旨在重现Sora（Open AI T2V模型），但我们只有有限的资源我们衷心希望所有开源社区都能为这个项目做出贡献