读取iris数据集(已保存为csv格式)中的花萼长度数据(第1列),并对其进行排序、去重,并求出和、累积和、均值、标准差、方差、最小值、最大值。(注:读取文件请使用np.loadtxt函数)
时间: 2024-09-11 19:07:29 浏览: 198
首先,你需要使用numpy库的loadtxt函数来加载csv格式的Iris数据集。假设数据文件名为"iris_data.csv",并且每一行的第一个元素对应花萼长度。以下是完成你所描述任务的步骤:
```python
import numpy as np
# 1. 读取数据
data = np.loadtxt('iris_data.csv', delimiter=',', skiprows=0, usecols=[0]) # 使用逗号分隔,跳过表头行,只读取第一列
# 2. 数据排序
sorted_data = data.sort()
# 3. 去重(实际上,由于数组默认不包含重复元素,这一步可能不需要做)
unique_data = sorted_data # 如果你想去除重复,可以使用 np.unique(data)
# 4. 计算统计量
mean = np.mean(sorted_data)
std_dev = np.std(sorted_data) # 标准差
variance = np.var(sorted_data) # 方差
min_val = np.min(sorted_data)
max_val = np.max(sorted_data)
# 累积和
cumulative_sum = np.cumsum(sorted_data)
# 输出结果
print("Sorted and Unique Data:", unique_data)
print("Sum:", sum(unique_data))
print("Cumulative Sum:", cumulative_sum)
print("Mean:", mean)
print("Standard Deviation:", std_dev)
print("Variance:", variance)
print("Minimum Value:", min_val)
print("Maximum Value:", max_val)
```
阅读全文