人体运动数据采集规范与标签处理

需积分: 0 0 下载量 97 浏览量 更新于2024-08-04 收藏 1.31MB DOCX 举报
本文档主要介绍了“走跑数据及标签说明”的详细内容,由作者张琛提供。文档的核心关注点在于数据采集过程中的标准化和管理,包括设备放置位置、文件命名规则、数据采集人员的对应关系以及数据的有效性和处理方法。 1. **设备位置**:采集时,手机被放置在采集人员的特定位置,如右手、右上衣侧口袋或右裤口袋。对于部分人员没有口袋的情况,设备会被放在左胸口袋,这部分数据未特别标注。动作ID通过文件名标识设备位置,如“ZC_a5_1.xml”代表张琛右手手持设备,第二次走路采集。 2. **文件命名**:数据文件采用“人名[动作类型]_动作ID_采集次数.xml”格式,人名后缀表明是跑步或走路数据,动作ID与设备位置对应,采集次数表示同一位置的重复采集次数。例如,“ZC_a5_1.xml”说明是张琛在右手位置采集走路数据。 3. **数据采集人员**:文档包含了数据采集人员的列表,用于跟踪和识别每个采集者的贡献。文件名中的缩写如“ZC”代表张琛。 4. **数据有效性**:采集数据要求持续1分30秒,但部分数据因操作失误或设备震动导致提前结束,虽然被视为有效,但可能存在数据质量不一致的问题。 5. **数据标签与问题处理**:采集过程中出现了传感器读数异常,表现为线性变化,推测是运动中设备剧烈震动或发热导致。处理策略是忽略错误区间,如果问题出现在中间,保持整个时间段的动作标记,如果是开始或结束,会抛弃这段数据。已标记的文件列表列出了受影响的数据文件,并说明了针对某些文件的处理方法,如重新划分或舍弃。 6. **三星S4设备问题**:由于数据采集使用的Samsung S4是从隔壁借用的,无法对出现问题的数据进行重采,这可能影响了部分数据的准确性和一致性。 本文档着重于确保数据的一致性和准确性,通过定义文件命名规则、规范数据采集流程以及对数据质量问题的处理,为后续的数据分析和研究提供了基础。