基于iris数据集的统计分析 3 实验目的: 1 掌握函数的定义和调用、及Python文件操作基础。 2 熟悉掌握Numpy数值计算;熟悉Numpy的数据处理方法。 3 掌握Numpy中的数据统计与分析排序、数据去重,常用统计分析方法。 4实验环境: Anaconda3 5实验内容与要求: 本实训读取iris数据集中鸢尾花的萼片、花瓣长度数据,并对其进行排序,去重,并求出和、累计和、均值、标准差、方差、最小值、最大值。 1、导入模块,获取数据,显示前5行 2、数据清理,转换为数组 3、获取Petal.Length列,转换为浮点数,并输出前5个数 4、对Petal.Length列进行排序、去重 5、求出Petal.length列的和、均值、标准差、方差、最小值、最大值 6、开放式题目:任选两列进行任意统计分析(如四则运算、数组变换、统计分析等)
时间: 2023-10-20 12:34:11 浏览: 107
NJUSE 大数据分析 课程作业,基于python实现使用多种方法分类鸢尾花数据集,推荐算法,MovieLens数据集
以下是基于iris数据集的统计分析3的代码实现:
```python
import numpy as np
# 1. 导入数据,显示前5行
with open("iris.data", "r") as f:
data = f.readlines()
for i in range(5):
print(data[i])
# 2. 数据清理,转换为数组
data_array = np.genfromtxt("iris.data", delimiter=",", usecols=(0, 1, 2, 3))
data_array = np.delete(data_array, np.s_[150:], 0)
# 3. 获取Petal.Length列,转换为浮点数,并输出前5个数
petal_length = data_array[:, 2].astype(np.float)
print("Petal.Length前5个数:", petal_length[:5])
# 4. 对Petal.Length列进行排序、去重
sorted_petal_length = np.sort(petal_length)
unique_petal_length = np.unique(petal_length)
# 5. 求出Petal.length列的和、均值、标准差、方差、最小值、最大值
petal_length_sum = np.sum(petal_length)
petal_length_mean = np.mean(petal_length)
petal_length_std = np.std(petal_length)
petal_length_var = np.var(petal_length)
petal_length_min = np.min(petal_length)
petal_length_max = np.max(petal_length)
print("Petal.Length列的和:", petal_length_sum)
print("Petal.Length列的均值:", petal_length_mean)
print("Petal.Length列的标准差:", petal_length_std)
print("Petal.Length列的方差:", petal_length_var)
print("Petal.Length列的最小值:", petal_length_min)
print("Petal.Length列的最大值:", petal_length_max)
# 6. 任选两列进行任意统计分析
# 选取Petal.Length和Sepal.Length列进行四则运算
sepal_length = data_array[:, 0].astype(np.float)
result = petal_length + sepal_length
print("Petal.Length和Sepal.Length列进行四则运算结果:", result)
```
阅读全文