model: arch: alpro_qa model_type: msvd load_finetuned: False num_classes: 2423 timesformer: use_grad_ckpt: True ckpt_layer: 12 datasets: msvd_qa: # name of the dataset builder vis_processor: train: name: "alpro_video_train" n_frms: 16 image_size: 224 eval: name: "alpro_video_eval" n_frms: 16 image_size: 224 text_processor: train: name: "blip_caption" eval: name: "blip_caption" run: task: multimodal_classification # optimization-specific lr_sched: "linear_warmup_cosine_lr" init_lr: 5e-5 min_lr: 1e-6 weight_decay: 1e-4 max_epoch: 100 batch_size_train: 24 batch_size_eval: 64 num_workers: 1 seed: 42 output_dir: "output/ALPRO/msvd_qa" amp: False resume_ckpt_path: null evaluate: False train_splits: ["train"] valid_splits: ["val", "test"] test_splits: ["test"] # distribution-specific device: "cuda" world_size: 1 dist_url: "env://" distributed: True
时间: 2024-04-09 13:32:02 浏览: 433
对于上面给出的配置文件,这是一个用于多模态分类任务的模型训练的配置。以下是配置文件的一些关键点:
- 模型架构:使用了名为"alpro_qa"的模型架构,类型为"msvd"。
- 数据集:使用了名为"msvd_qa"的数据集构建器,其中包括了视频和文本处理器的配置。
- 训练参数:包括了学习率调度、初始学习率、权重衰减、最大训练轮数等训练优化相关的参数。
- 输出目录:指定了模型训练过程中输出的结果保存位置。
- 分布式训练:设置了分布式训练相关的参数,如设备、分布式URL等。
这些配置将用于训练一个用于多模态分类任务的模型,并将结果保存在指定的输出目录中。
阅读全文