JHU数据科学课程项目:获取与数据清洗
需积分: 5 23 浏览量
更新于2024-11-18
收藏 88KB ZIP 举报
资源摘要信息:"该项目是Johns Hopkins大学在Coursera平台上提供的“获取和清理数据”专业课程的一部分。这个课程项目主要是为了让学生通过实际操作,展示其收集、处理和清洗数据集的能力,并准备可用于进一步分析的整洁数据集。
该项目的完成要求学生提交以下成果:
1. 整洁的数据集:这是项目的主要目标,学生需要确保最终提交的数据集是清洗和整理过的,便于后续分析。
2. GitHub存储库链接:该链接指向包含执行分析的脚本的GitHub仓库。
3. CodeBook.md文件:该文件详细描述了变量、数据以及为清洗数据所执行的任何转换或工作的详细信息。
4. README.md文件:该文件解释了所有脚本的工作原理以及它们是如何连接在一起的。
项目的背景是关于可穿戴计算领域,该领域目前是数据科学中非常热门的研究方向。Fitbit、Nike、Jawbone Up等公司都在开发最前沿的算法,以吸引新用户。项目的练习数据来自于三星Galaxy S智能手机的传感器,通过这些数据,学生可以学习如何处理真实世界的复杂数据集。
标签中只有一个单词“R”,这表明整个项目将主要使用R语言进行数据的获取、处理和清洗。R是一种专门用于统计分析和图形表示的编程语言和软件环境,它非常适合数据科学工作。
压缩包子文件的文件名称列表中只有一个文件:“GettingCleaningData-CourseProject-master”。这个文件名表明了项目的主目录或主分支可能位于GitHub上,且该文件可能是包含所有项目文件的压缩包。
总结来说,这个项目是数据科学教育中的一部分,主要目的是让学生掌握数据获取、处理和清洗的技能。它强调了整洁数据的重要性,并提供了学生展示其技能的平台,同时也突出了可穿戴设备领域在数据科学中的重要性。整个项目中R语言的使用,进一步强化了在数据分析中使用统计软件和编程语言的实践。"
2021-06-23 上传
2021-06-17 上传
2021-06-10 上传
2021-06-10 上传
2021-03-18 上传
2021-03-30 上传
2021-06-10 上传
2021-04-11 上传
2021-04-30 上传