基于iris数据集的统计分析 3 实验目的： 1 掌握函数的定义和调用、及Python文件操作基础。 2 熟悉掌握Numpy数值计算；熟悉Numpy的数据处理方法。 3 掌握Numpy中的数据统计与分析排序、数据去重，常用统计分析方法。 4实验环境： Anaconda3 5实验内容与要求：本实训读取iris数据集中鸢尾花的萼片、花瓣长度数据，并对其进行排序，去重，并求出和、累计和、均值、标准差、方差、最小值、最大值。 1、导入模块，获取数据,显示前5行 2、数据清理，转换为数组 3、获取Petal.Length列，转换为浮点数，并输出前5个数 4、对Petal.Length列进行排序、去重 5、求出Petal.length列的和、均值、标准差、方差、最小值、最大值 6、开放式题目：任选两列进行任意统计分析（如四则运算、数组变换、统计分析等）

时间: 2023-10-20 12:34:11 浏览: 107

NJUSE 大数据分析课程作业，基于python实现使用多种方法分类鸢尾花数据集，推荐算法，MovieLens数据集

以下是基于iris数据集的统计分析3的代码实现： ```python import numpy as np # 1. 导入数据，显示前5行 with open("iris.data", "r") as f: data = f.readlines() for i in range(5): print(data[i]) # 2. 数据清理，转换为数组 data_array = np.genfromtxt("iris.data", delimiter=",", usecols=(0, 1, 2, 3)) data_array = np.delete(data_array, np.s_[150:], 0) # 3. 获取Petal.Length列，转换为浮点数，并输出前5个数 petal_length = data_array[:, 2].astype(np.float) print("Petal.Length前5个数：", petal_length[:5]) # 4. 对Petal.Length列进行排序、去重 sorted_petal_length = np.sort(petal_length) unique_petal_length = np.unique(petal_length) # 5. 求出Petal.length列的和、均值、标准差、方差、最小值、最大值 petal_length_sum = np.sum(petal_length) petal_length_mean = np.mean(petal_length) petal_length_std = np.std(petal_length) petal_length_var = np.var(petal_length) petal_length_min = np.min(petal_length) petal_length_max = np.max(petal_length) print("Petal.Length列的和：", petal_length_sum) print("Petal.Length列的均值：", petal_length_mean) print("Petal.Length列的标准差：", petal_length_std) print("Petal.Length列的方差：", petal_length_var) print("Petal.Length列的最小值：", petal_length_min) print("Petal.Length列的最大值：", petal_length_max) # 6. 任选两列进行任意统计分析 # 选取Petal.Length和Sepal.Length列进行四则运算 sepal_length = data_array[:, 0].astype(np.float) result = petal_length + sepal_length print("Petal.Length和Sepal.Length列进行四则运算结果：", result) ```

阅读全文

相关推荐

实验2-鸢尾花数据集分析.ipynb

基于numpy的鸢尾花数据集分析.ipynb

Prediction-Using-UNSupervised-ML-Python:基于IRIS数据集的KMeans聚类

贝叶斯分类_iris_python贝叶斯分类iris数据集_

全连接神经网络(MLP)实现花卉图像分类 Iris数据集 Python代码

KNN-on-Iris-数据集：将KNN分类器应用于Iris数据集的简短示例

【Bisecting K-means算法】{1} —— 使用Python实现Bisecting K-means算法并处理Iris数据集

Iris_svm分类iris_iris_python_SVM_数据分析_

KMeans-Clustering-Iris-Dataset:使用Iris数据集的KMeans聚类

Python多维索引：Numpy数组索引高级技巧

Python数据分析：bin函数在数据处理中的实战应用

【Python数据处理】：轻松掌握标准化和归一化技巧

Python数据分析：机器学习基础入门

用python里的kmeans对iris数据集进行聚类，不调用sklearn库

用python实现以下代码：1.使用最小二乘子空间分割法求得样本空间的自表示系数矩阵2.使用N-cuts进行聚类，3.用IRIS数据集与COLON数据集分别进行验证 详细解释代码，并输出精度

1、利用Python编写kNN算法，实现对iris数据集进行分类

numpy 编写逻辑回归算法对 iris 数据进行多分类

（1）给定数据集：iris_2_3.txt，用random.shuffle()函数随机排列数据集顺序，将前80个样本做训练集，后20个样本做测试集，用adaboost分类器，按照迭代次数分别是5、10、15、20、25、30分别训练样本并求出测试样本的准确率。

最新推荐

Python实现的逻辑回归算法示例【附测试csv文件下载】

YOLOv3-训练-修剪.zip

毕业设计&课设_智能算法中台管理系统.zip

JHU荣誉单变量微积分课程教案介绍

管理建模和仿真的文件

【实战篇：自定义损失函数】：构建独特损失函数解决特定问题，优化模型性能

如何在ZYNQMP平台上配置TUSB1210 USB接口芯片以实现Host模式，并确保与Linux内核的兼容性？

Naruto爱好者必备CLI测试应用

"互动学习：行动中的多样性与论文攻读经历"

【强化学习损失函数探索】：奖励函数与损失函数的深入联系及优化策略

用python实现以下代码：1.使用最小二乘子空间分割法求得样本空间的自表示系数矩阵2.使用N-cuts进行聚类，3.用IRIS数据集与COLON数据集分别进行验证详细解释代码，并输出精度