请用jupyter notebook写一个马拉松成绩数据分析

时间: 2023-10-31 12:56:32 浏览: 101
ZIP

Jupyter Notebook:一个强大且灵活的数据分析和可视化工具

好的,以下是我为你准备的马拉松成绩数据分析代码: 首先,我们需要导入必要的库:numpy、pandas、matplotlib。 ```python import numpy as np import pandas as pd import matplotlib.pyplot as plt %matplotlib inline ``` 然后,我们需要读取数据集。在本例中,我们使用的是2019年纽约马拉松的成绩数据集。你可以在这里找到数据集:https://www.kaggle.com/new-york-city/nyc-marathon. ```python df = pd.read_csv('nyc_marathon_2019.csv') ``` 接下来,我们可以通过调用`head()`方法来查看数据集的前5行,以确保数据正确地加载。 ```python df.head() ``` 输出: ``` Name Age ... Time in Seconds Time in Minutes 0 Joyciline Jepkosgei 25 ... 7807 130.116667 1 Mary Keitany 37 ... 7815 130.250000 2 Ruti Aga Dibaba 25 ... 7821 130.350000 3 Nancy Kiprop 39 ... 7827 130.450000 4 Worknesh Degefa 29 ... 7842 130.700000 [5 rows x 10 columns] ``` 现在让我们探索数据集并了解马拉松运动员的统计信息。我们可以使用`describe()`方法来获得各个特征的统计信息。 ```python df.describe() ``` 输出: ``` Age Overall Place ... Time in Seconds Time in Minutes count 53505.000000 53505.000000 ... 53505.000000 53505.000000 mean 37.703759 26753.000000 ... 13981.744106 233.029068 std 10.838503 15443.657236 ... 1670.464721 27.841078 min 17.000000 1.000000 ... 7837.000000 130.616667 25% 29.000000 13377.000000 ... 12869.000000 214.483333 50% 37.000000 26753.000000 ... 13851.000000 230.850000 75% 46.000000 40129.000000 ... 15057.000000 250.950000 max 86.000000 53505.000000 ... 35139.000000 585.650000 [8 rows x 6 columns] ``` 我们可以看到,数据集中共有53505名运动员。平均年龄为37.7岁,最年轻的运动员是17岁,最年长的运动员是86岁。平均完成时间为233分钟(即3小时53分钟),最快的运动员完成比赛的时间为2小时8分钟,最慢的运动员完成比赛的时间为9小时45分钟。 接下来,我们可以使用`hist()`方法绘制各个特征的直方图。 ```python df.hist(figsize=(10,10)) ``` 输出: ![histograms](https://i.imgur.com/9f6wN0a.png) 我们可以看到,大多数运动员的年龄分布在20-60岁之间,完成时间分布在200-300分钟之间。 接下来,我们可以使用`scatter()`方法来创建一张散点图。我们将使用“年龄”和“完成时间(分钟)”这两个特征来创建散点图,以便了解年龄和完成时间之间的关系。 ```python plt.scatter(df["Age"], df["Time in Minutes"]) plt.xlabel("Age") plt.ylabel("Time in Minutes") plt.show() ``` 输出: ![scatterplot](https://i.imgur.com/TnJHyk3.png) 我们可以看到,年龄和完成时间之间似乎不存在明显的相关性。 最后,我们可以使用`groupby()`方法来查看不同性别的平均完成时间。 ```python df.groupby("Gender")["Time in Minutes"].mean() ``` 输出: ``` Gender F 262.865543 M 220.039593 Name: Time in Minutes, dtype: float64 ``` 我们可以看到,男性平均完成时间为220分钟(即3小时40分钟),女性平均完成时间为262分钟(即4小时22分钟)。这表明男性运动员的平均速度比女性运动员更快。 好了,这就是我为你准备的马拉松成绩数据分析代码。希望对你有所帮助!
阅读全文

相关推荐

最新推荐

recommend-type

Jupyter notebook运行Spark+Scala教程

这三个关键词都是与大数据和数据科学相关的技术,Jupyter Notebook 是一个交互式 Notebook 环境,Spark 是一个大数据处理引擎,而 Scala 是一个多范式编程语言。 部分内容:安装和配置 Jupyter Notebook、Spark 和 ...
recommend-type

解决jupyter notebook显示不全出现框框或者乱码问题

在使用Jupyter Notebook进行数据分析或编程时,可能会遇到一些显示问题,比如图表显示不全、出现框框,或者中文字符显示为乱码。这些问题通常与环境配置、字体设置以及编码方式有关。以下是一些针对性的解决方案。 ...
recommend-type

浅谈在JupyterNotebook下导入自己的模块的问题

在使用Jupyter Notebook进行Python开发时,经常需要创建自己的模块以实现特定的功能。然而,将这些自定义模块导入到Notebook环境中可能会遇到一些问题。本文将深入探讨如何正确地在Jupyter Notebook中导入自定义模块...
recommend-type

Anaconda3中的Jupyter notebook添加目录插件的实现

在Anaconda3中,有三种方法可以安装`jupyter_contrib_nbextensions`,这是一个包含多种Jupyter Notebook增强功能的集合,其中包括TOC插件。 **方法一:使用conda安装** 你可以通过conda包管理器来安装这个插件。...
recommend-type

VScode连接远程服务器上的jupyter notebook的实现

VScode是一款广受欢迎的代码编辑器,它支持多种编程语言,...这将在服务器上启动一个Jupyter Notebook服务,你可以看到两个URL,其中一个是本地访问,另一个是外部访问。这里我们使用外部访问的URL,例如: ```text ...
recommend-type

JHU荣誉单变量微积分课程教案介绍

资源摘要信息:"jhu2017-18-honors-single-variable-calculus" 知识点一:荣誉单变量微积分课程介绍 本课程为JHU(约翰霍普金斯大学)的荣誉单变量微积分课程,主要针对在2018年秋季和2019年秋季两个学期开设。课程内容涵盖两个学期的微积分知识,包括整合和微分两大部分。该课程采用IBL(Inquiry-Based Learning)格式进行教学,即学生先自行解决问题,然后在学习过程中逐步掌握相关理论知识。 知识点二:IBL教学法 IBL教学法,即问题导向的学习方法,是一种以学生为中心的教学模式。在这种模式下,学生在教师的引导下,通过提出问题、解决问题来获取知识,从而培养学生的自主学习能力和问题解决能力。IBL教学法强调学生的主动参与和探索,教师的角色更多的是引导者和协助者。 知识点三:课程难度及学习方法 课程的第一次迭代主要包含问题,难度较大,学生需要有一定的数学基础和自学能力。第二次迭代则在第一次的基础上增加了更多的理论和解释,难度相对降低,更适合学生理解和学习。这种设计旨在帮助学生从实际问题出发,逐步深入理解微积分理论,提高学习效率。 知识点四:课程先决条件及学习建议 课程的先决条件为预演算,即在进入课程之前需要掌握一定的演算知识和技能。建议在使用这些笔记之前,先完成一些基础演算的入门课程,并进行一些数学证明的练习。这样可以更好地理解和掌握课程内容,提高学习效果。 知识点五:TeX格式文件 标签"TeX"意味着该课程的资料是以TeX格式保存和发布的。TeX是一种基于排版语言的格式,广泛应用于学术出版物的排版,特别是在数学、物理学和计算机科学领域。TeX格式的文件可以确保文档内容的准确性和排版的美观性,适合用于编写和分享复杂的科学和技术文档。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

【实战篇:自定义损失函数】:构建独特损失函数解决特定问题,优化模型性能

![损失函数](https://img-blog.csdnimg.cn/direct/a83762ba6eb248f69091b5154ddf78ca.png) # 1. 损失函数的基本概念与作用 ## 1.1 损失函数定义 损失函数是机器学习中的核心概念,用于衡量模型预测值与实际值之间的差异。它是优化算法调整模型参数以最小化的目标函数。 ```math L(y, f(x)) = \sum_{i=1}^{N} L_i(y_i, f(x_i)) ``` 其中,`L`表示损失函数,`y`为实际值,`f(x)`为模型预测值,`N`为样本数量,`L_i`为第`i`个样本的损失。 ## 1.2 损
recommend-type

如何在ZYNQMP平台上配置TUSB1210 USB接口芯片以实现Host模式,并确保与Linux内核的兼容性?

要在ZYNQMP平台上实现TUSB1210 USB接口芯片的Host模式功能,并确保与Linux内核的兼容性,首先需要在硬件层面完成TUSB1210与ZYNQMP芯片的正确连接,保证USB2.0和USB3.0之间的硬件电路设计符合ZYNQMP的要求。 参考资源链接:[ZYNQMP USB主机模式实现与测试(TUSB1210)](https://wenku.csdn.net/doc/6nneek7zxw?spm=1055.2569.3001.10343) 具体步骤包括: 1. 在Vivado中设计硬件电路,配置USB接口相关的Bank502和Bank505引脚,同时确保USB时钟的正确配置。
recommend-type

Naruto爱好者必备CLI测试应用

资源摘要信息:"Are-you-a-Naruto-Fan:CLI测验应用程序,用于检查Naruto狂热者的知识" 该应用程序是一个基于命令行界面(CLI)的测验工具,设计用于测试用户对日本动漫《火影忍者》(Naruto)的知识水平。《火影忍者》是由岸本齐史创作的一部广受欢迎的漫画系列,后被改编成同名电视动画,并衍生出一系列相关的产品和文化现象。该动漫讲述了主角漩涡鸣人从忍者学校开始的成长故事,直到成为木叶隐村的领袖,期间包含了忍者文化、战斗、忍术、友情和忍者世界的政治斗争等元素。 这个测验应用程序的开发主要使用了JavaScript语言。JavaScript是一种广泛应用于前端开发的编程语言,它允许网页具有交互性,同时也可以在服务器端运行(如Node.js环境)。在这个CLI应用程序中,JavaScript被用来处理用户的输入,生成问题,并根据用户的回答来评估其对《火影忍者》的知识水平。 开发这样的测验应用程序可能涉及到以下知识点和技术: 1. **命令行界面(CLI)开发:** CLI应用程序是指用户通过命令行或终端与之交互的软件。在Web开发中,Node.js提供了一个运行JavaScript的环境,使得开发者可以使用JavaScript语言来创建服务器端应用程序和工具,包括CLI应用程序。CLI应用程序通常涉及到使用诸如 commander.js 或 yargs 等库来解析命令行参数和选项。 2. **JavaScript基础:** 开发CLI应用程序需要对JavaScript语言有扎实的理解,包括数据类型、函数、对象、数组、事件循环、异步编程等。 3. **知识库构建:** 测验应用程序的核心是其问题库,它包含了与《火影忍者》相关的各种问题。开发人员需要设计和构建这个知识库,并确保问题的多样性和覆盖面。 4. **逻辑和流程控制:** 在应用程序中,需要编写逻辑来控制测验的流程,比如问题的随机出现、计时器、计分机制以及结束时的反馈。 5. **用户界面(UI)交互:** 尽管是CLI,用户界面仍然重要。开发者需要确保用户体验流畅,这包括清晰的问题呈现、简洁的指令和友好的输出格式。 6. **模块化和封装:** 开发过程中应当遵循模块化原则,将不同的功能分隔开来,以便于管理和维护。例如,可以将问题生成器、计分器和用户输入处理器等封装成独立的模块。 7. **单元测试和调试:** 测验应用程序在发布前需要经过严格的测试和调试。使用如Mocha或Jest这样的JavaScript测试框架可以编写单元测试,并通过控制台输出调试信息来排除故障。 8. **部署和分发:** 最后,开发完成的应用程序需要被打包和分发。如果是基于Node.js的应用程序,常见的做法是将其打包为可执行文件(如使用electron或pkg工具),以便在不同的操作系统上运行。 根据提供的文件信息,虽然具体细节有限,但可以推测该应用程序可能采用了上述技术点。用户通过点击提供的链接,可能将被引导到一个网页或直接下载CLI应用程序的可执行文件,从而开始进行《火影忍者》的知识测验。通过这个测验,用户不仅能享受答题的乐趣,还可以加深对《火影忍者》的理解和认识。