CMCS-Temporal-Action-Localization：弱监督下的时间行为本地化研究

需积分: 22 7 浏览量更新于2024-12-03 收藏 35.79MB ZIP 举报

资源摘要信息:"CMCS-Temporal-Action-Localization:弱监督的时间行为本地化的完整性建模和上下文分离（CVPR2019）" CMCS-Temporal-Action-Localization 是一个针对弱监督条件下时间动作本地化问题的模型，该模型在计算机视觉和模式识别领域顶级会议之一的 CVPR（IEEE Conference on Computer Vision and Pattern Recognition，计算机视觉与模式识别会议）2019上发表。时间动作本地化作为计算机视觉中的一个重要研究方向，主要目的是在视频序列中定位出具体的时间段来识别和分类特定的行为或动作。在弱监督学习的背景下，模型需要在只有少量标签信息（如视频级别的动作标签，而非视频帧级别的详细标注）的情况下进行训练，这大大增加了学习的难度。CMCS-Temporal-Action-Localization 提出了一种新颖的完整性建模方法和上下文分离策略，用以提高时间动作本地化的准确度。在具体实现上，研究者们提出了以下几点关键创新点和技术要点： 1. 完整性建模：该模型通过引入完整性建模来增强模型在动作识别中的准确性和鲁棒性。完整性建模可以理解为一种能够学习动作在时间上连续性的能力，这使得模型能够更好地捕捉动作的前后关联，提高动作预测的完整性。 2. 上下文分离：上下文分离策略允许模型独立处理动作的上下文信息，即识别和利用动作与周围环境的关系，同时避免过度依赖或混淆动作本身与上下文的特征，以达到提高动作定位精度的目的。 3. 技术实现：本项目主要使用Python 3.5和PyTorch 0.4深度学习框架进行实现。在运行代码前，需要安装一系列的依赖项，例如使用pip3 install -r requirements.txt命令来安装必要的Python包。此外，代码运行还需要matlab.engine的支持。 4. 数据集准备：为了训练和测试模型，需要准备THUMOS14和ActivityNet两个数据集，并从中提取相应的特征。研究者们建议可以采用UntrimmedNet或I3D网络提取特征。如果不想自行提取特征，也可以使用作者预先提取的特征，但要注意这些特征的下载可能存在难度。 5. 特征提取和存储库：在模型中，特征的提取对性能有直接影响。UntrimmedNet和I3D是两种不同的深度学习架构，它们能够在视频数据中提取时空特征。除了使用推荐的存储库进行特征提取，也可以使用其他方法，但需保证提取的特征质量和格式符合模型要求。 6. 静态剪贴蒙版：生成静态剪贴蒙版是一种数据增强技术，可以在一定程度上提升模型对动作识别的鲁棒性。总结而言，CMCS-Temporal-Action-Localization 项目代表了在弱监督条件下提升时间动作本地化性能的最新研究进展。它的实现和应用涉及了深度学习、计算机视觉、数据预处理、特征提取等关键技术领域。该模型和相关的代码、数据集处理流程，为研究人员和开发人员提供了一个强大的工具集，以进一步探索和改进时间动作本地化的技术。建议在尝试运行和使用CMCS-Temporal-Action-Localization项目代码之前，确保已经对项目所需的Python环境、深度学习框架、数据集处理流程有充分的了解和准备。此外，由于项目依赖于特定的数据集和预训练模型，因此准备相应的数据和模型也将是实现过程中的重要步骤。

收起资源包目录

CMCS-Temporal-Action-Localization:弱监督的时间行为本地化的完整性建模和上下文分离（CVPR2019）（105个子文件）

CricketShot_test.txt 5KB

LICENSE 1KB

ThrowDiscus_test.txt 3KB

model-rgb-30000 1.01MB

model-flow-30000 1.01MB

TH14evalRecog_clspr.m 700B

JavelinThrow_val.txt 7KB

new_cls_names_anet12.npy 2KB

Shotput_val.txt 2KB

BasketballDunk_val.txt 11KB

thumos-UNT.json 4KB

SoccerPenalty_val.txt 2KB

old_cls_indices_anet13.npy 5KB

anet_missing_videos.npy 65KB

CricketBowling_test.txt 4KB

JavelinThrow_test.txt 5KB

VolleyballSpiking_val.txt 5KB

Diving_test.txt 12KB

old_cls_names_anet13.npy 5KB

thumos14-val-meta.mat 82KB

PoleVault_val.txt 4KB

trained-anet12-local-UNT.json 7KB

TH14evalDet.m 6KB

trained-thumos-I3D.json 4KB

CliffDiving_val.txt 5KB

model-rgb-15000 164KB

Ambiguous_test.txt 3KB

LongJump_val.txt 6KB

Diving_val.txt 18KB

VolleyballSpiking_test.txt 4KB

anet13-local-I3D.json 7KB

model-both-7500 292KB

model-flow-15000 164KB

intervaloverlapvalseconds.m 878B

CliffDiving_test.txt 6KB

new_cls_indices_anet12.npy 2KB

model-rgb-20000 2.83MB

logger.py 2KB

GolfSwing_val.txt 1KB

new_cls_names_anet13.npy 5KB

.gitignore 92B

SoccerPenalty_test.txt 1KB

anet13-server-I3D.json 7KB

BasketballDunk_test.txt 15KB

thumos-I3D.json 4KB

Ambiguous_val.txt 3KB

model-flow-7500 164KB

utils.py 30KB

trained-thumos-UNT.json 4KB

model-both-30000 1.51MB

train.py 14KB

test.py 7KB

dataset.py 3KB

HighJump_test.txt 4KB

trained-anet12-local-I3D.json 7KB

model-both-15000 292KB

detect.py 11KB

Billiards_test.txt 3KB

old_cls_names_anet12.npy 2KB

activity_net.v1-3.min-missing-removed.json 4.36MB

activity_net.v1-2.min.json 4.48MB

HammerThrow_test.txt 7KB

anet12-local-UNT.json 7KB

model-rgb-30000 3.03MB

model-flow-30000 3.03MB

model.py 4KB

HighJump_val.txt 10KB

trained-anet13-local-I3D.json 7KB

model-both-20000 3.83MB

get_flow_intensity_anet.py 3KB

activity_net.v1-3.min.json 4.71MB

trained-anet13-server-I3D.json 7KB

Billiards_val.txt 3KB

activity_net.v1-2.min-missing-removed.json 1.91MB

FrisbeeCatch_test.txt 1KB

CleanAndJerk_test.txt 3KB

thumos14-test-meta.mat 170KB

BaseballPitch_test.txt 1KB

HammerThrow_val.txt 7KB

ThrowDiscus_val.txt 4KB

model-rgb-30000 3.03MB

FrisbeeCatch_val.txt 4KB

old_cls_indices_anet12.npy 2KB

new_cls_indices_anet13.npy 5KB

LongJump_test.txt 4KB

TennisSwing_val.txt 2KB

TennisSwing_test.txt 4KB

Shotput_test.txt 4KB

TH14evalRecog.m 2KB

README.md 4KB

CricketBowling_val.txt 6KB

CricketShot_val.txt 6KB

model-both-30000 4.03MB

model-flow-30000 3.03MB

CleanAndJerk_val.txt 2KB

model-both-30000 4.03MB

PoleVault_test.txt 12KB

anet12-local-I3D.json 7KB

model-rgb-7500 164KB

model-flow-20000 2.83MB

共 105 条

ZackRen

粉丝: 28
资源: 4624

CMCS-Temporal-Action-Localization：弱监督下的时间行为本地化研究

中文翻译 Action Tubelet Detector for Spatio-Temporal Action Localization 中文版本

输电线路模拟电荷法 matlab

SPD-Conv-main.zip

Docker从零走向实战视频（上）.zip

《狼》教学设计.docx

房屋租赁平台：提升租赁交易透明度的数字化路径

四轮独立驱动横摆角速度控制，LQR 基于LQR算法的 基于二自由度动力学方程，通过主动转向afs和直接横摆力矩dyc实现的横摆角速度跟踪 ，模型包括期望横摆角速度，质心侧偏角，稳定性因素，lqr模块等

ESP8266、ESP32网页配网 支持中文SSID

Python圣诞节倒计时与节日活动管理系统

双目立体匹配三维重建点云C++ 本工程基于网上开源代码进行修改，内容如下： 1.修改为 VS2015 Debug win32 版本，支持利用特征点和 OpenCV 立体匹配算法进行进行三维重建及显示

最新资源

四轮独立驱动横摆角速度控制，LQR 基于LQR算法的基于二自由度动力学方程，通过主动转向afs和直接横摆力矩dyc实现的横摆角速度跟踪，模型包括期望横摆角速度，质心侧偏角，稳定性因素，lqr模块等

ESP8266、ESP32网页配网支持中文SSID