对csv文件的第一列数据进行数据大小分类0-2为一类,2-4为一类,4-5为一类,将所有数据分为3个csv文件,并统计每个文件有多少个数据,并以三个文件的数据多少制作柱状图
时间: 2024-02-13 08:07:14 浏览: 22
好的,我可以用Python的pandas库和matplotlib库来完成这个任务。以下是代码示例:
```python
import pandas as pd
import matplotlib.pyplot as plt
# 读取原始数据文件
df = pd.read_csv('原始数据.csv')
# 根据第一列的值将数据分成三类
df_0_2 = df[(df.iloc[:, 0] >= 0) & (df.iloc[:, 0] < 2)]
df_2_4 = df[(df.iloc[:, 0] >= 2) & (df.iloc[:, 0] < 4)]
df_4_5 = df[(df.iloc[:, 0] >= 4) & (df.iloc[:, 0] <= 5)]
# 将三类数据分别保存到三个csv文件
df_0_2.to_csv('0-2.csv', index=False)
df_2_4.to_csv('2-4.csv', index=False)
df_4_5.to_csv('4-5.csv', index=False)
# 统计每个文件有多少个数据
count_0_2 = len(df_0_2)
count_2_4 = len(df_2_4)
count_4_5 = len(df_4_5)
# 以三个文件的数据多少制作柱状图
counts = [count_0_2, count_2_4, count_4_5]
labels = ['0-2', '2-4', '4-5']
plt.bar(labels, counts)
plt.xlabel('数据大小分类')
plt.ylabel('数据数量')
plt.title('数据分类统计')
plt.show()
```
这段代码假设原始数据文件的文件名为“原始数据.csv”,第一列数据为数值型数据。代码执行后,将会生成三个csv文件分别为“0-2.csv”、“2-4.csv”和“4-5.csv”,并将对应的数据保存到相应的文件中。同时还会统计每个文件有多少个数据,并以三个文件的数据多少制作柱状图,展示在运行代码的窗口中。