1. (简答题) 编写一个Python程序,使用Numpy库读取一个CSV文件,该文件包含多列浮点数数据。你需要计算每列数据的平均值、中位数、最大值和最小值,并将结果保存到一个新的CSV文件中。(CSV文件需要自己编写代码生成,确保每个人生成的文件都是不一样的)
时间: 2024-10-16 13:21:11 浏览: 68
首先,我们需要安装numpy和pandas库,如果还没有安装,可以使用pip进行安装:
```bash
pip install numpy pandas
```
然后,我们可以通过以下步骤编写Python程序来完成这个任务:
1. 导入所需的库:
```python
import numpy as np
import pandas as pd
from sklearn.datasets import make_classification
```
注意:这里我们使用`make_classification`函数来创建一个临时的测试数据集,因为实际的CSV文件未提供。如果你已经有CSV文件,只需要替换这一部分。
2. 创建随机数据并保存到CSV文件:
```python
# 创建随机数据
X, _ = make_classification(n_samples=100, n_features=4, random_state=42)
data = pd.DataFrame(X, columns=['Column1', 'Column2', 'Column3', 'Column4'])
# 保存到CSV文件
data.to_csv('temp_data.csv', index=False)
```
3. 读取CSV文件并计算统计信息:
```python
# 读取CSV文件
data = pd.read_csv('temp_data.csv', usecols=[0, 1, 2, 3], converters={c: float for c in data.columns})
# 计算平均值、中位数、最大值和最小值
mean_values = data.mean()
median_values = data.median()
max_values = data.max()
min_values = data.min()
# 结果合并成DataFrame
stats_df = pd.DataFrame({'Average': mean_values, 'Median': median_values, 'Max': max_values, 'Min': min_values})
```
4. 将结果保存到新CSV文件:
```python
stats_df.to_csv('statistics.csv', index=False)
```
现在你已经创建了一个Python程序,它会生成一个包含随机数据的CSV文件,并从该文件中计算每列的平均值、中位数、最大值和最小值,最后将结果保存到另一个新的CSV文件中。由于每次运行都会生成新的随机数据,所以每个用户的CSV文件内容会有所不同。
阅读全文