(1)用pandas库读取bike_daycsv文件,查看前5行、后2行。 2)选择instant、dteday、weekday、casual、registered共5列数据,将缺失值全部丢处理,并将处理后结果导出到文本文件bike_weekday_user.txt,要求数据之间用空格分隔,每行末尾包含换行符。 (3)读取文本文件bikeweekday_usertxt,计算列casual与列registered和(即casual+ registered),并作为一个新的列cnt添加到原始数据,导出到新的Excel文件 bike_weekday user cnt.xlsx中。 4)读取Excel 文件bike_weekday_usercntxlsx,按照列weekday分组,计算列cnt的均值,并将分类计算结果导出到新的文本文件bike_weekday_user_cnt_mean.txt 中,要求数据之间用逗号分隔,每行末尾包含换行符。 5)读取文本文件bike_weekday_user_cnt_mean.txt,可视化显示上一步分组计算得出的cnt 均值。要求以列 weekday 为x轴,轴刻度分别为Monday、Tuesday、Wednesday 、Thursday、Friday、Saturday、Sunday,包括图例、图标题,填充颜色为蓝色,并保存为 bike_day_user_cnt.png,要求分辨率不低于 300 dpi。编写Python程序
时间: 2024-02-11 18:08:38 浏览: 91
pandas读取xlsx文件.md
很抱歉,我是一个语言模型AI,无法直接在本地运行Python程序。但我可以提供如下代码参考:
```python
import pandas as pd
# 读取数据
bike_data = pd.read_csv('bike_day.csv')
# 查看前5行
print(bike_data.head(5))
# 查看后2行
print(bike_data.tail(2))
# 选择指定列数据并丢弃缺失值
selected_data = bike_data[['instant', 'dteday', 'weekday', 'casual', 'registered']].dropna()
# 导出数据到文本文件
selected_data.to_csv('bike_weekday_user.txt', sep=' ', index=False)
# 读取导出的文本文件
selected_data = pd.read_csv('bike_weekday_user.txt', sep=' ')
# 计算新列并添加到原始数据
selected_data['cnt'] = selected_data['casual'] + selected_data['registered']
# 导出数据到Excel文件
selected_data.to_excel('bike_weekday_user_cnt.xlsx', index=False)
# 读取导出的Excel文件
selected_data = pd.read_excel('bike_weekday_user_cnt.xlsx')
# 按照weekday分组并计算均值
mean_data = selected_data.groupby('weekday')['cnt'].mean().reset_index()
# 导出数据到文本文件
mean_data.to_csv('bike_weekday_user_cnt_mean.txt', sep=',', index=False)
# 可视化显示数据
import matplotlib.pyplot as plt
plt.plot(mean_data['weekday'], mean_data['cnt'], color='blue')
plt.xlabel('weekday')
plt.ylabel('cnt')
plt.title('Bike Day User Cnt')
plt.savefig('bike_day_user_cnt.png', dpi=300)
```
需要注意的是,代码中的文件路径需要根据实际情况进行修改。
阅读全文