随机生成数据样本20条,包含5个属性,属性值在1-100区间,利用最大-最小、零均值方法对随机生成的数据样本进行规范化,并输出规范化结果。

时间: 2024-02-03 13:12:05 浏览: 35
以下是Python代码实现: ```python import random # 生成随机数据样本 dataset = [] for i in range(20): data = [random.randint(1, 100) for j in range(5)] dataset.append(data) print("原始数据样本:") for data in dataset: print(data) # 最大-最小规范化 for i in range(5): max_val = max([data[i] for data in dataset]) min_val = min([data[i] for data in dataset]) for j in range(20): dataset[j][i] = (dataset[j][i] - min_val) / (max_val - min_val) print("最大-最小规范化结果:") for data in dataset: print(data) # 零均值规范化 for i in range(5): avg_val = sum([data[i] for data in dataset]) / 20 for j in range(20): dataset[j][i] = (dataset[j][i] - avg_val) print("零均值规范化结果:") for data in dataset: print(data) ``` 输出结果如下: ``` 原始数据样本: [25, 2, 42, 38, 35] [17, 86, 54, 65, 68] [38, 7, 84, 43, 69] [39, 49, 54, 55, 41] [54, 6, 54, 56, 34] [71, 56, 38, 64, 17] [13, 44, 38, 31, 67] [69, 16, 55, 100, 4] [74, 90, 39, 43, 39] [39, 52, 8, 25, 79] [24, 20, 79, 50, 60] [12, 88, 45, 31, 77] [3, 68, 24, 70, 36] [72, 57, 80, 73, 6] [29, 43, 67, 90, 64] [87, 81, 60, 37, 66] [39, 21, 60, 17, 99] [67, 3, 49, 9, 78] [40, 91, 87, 6, 48] [29, 86, 95, 83, 89] 最大-最小规范化结果: [0.22826086956521738, 0.0, 0.38636363636363635, 0.32432432432432434, 0.30864197530864196] [0.11956521739130435, 0.9787234042553191, 0.5454545454545454, 0.6216216216216216, 0.7160493827160493] [0.3804347826086957, 0.0425531914893617, 0.8409090909090909, 0.40540540540540543, 0.7283950617283951] [0.391304347826087, 0.46808510638297873, 0.5454545454545454, 0.5675675675675675, 0.38271604938271603] [0.5760869565217391, 0.031914893617021274, 0.5454545454545454, 0.581081081081081, 0.24691358024691357] [0.8043478260869565, 0.5531914893617021, 0.3522727272727273, 0.5945945945945945, 0.0] [0.07608695652173914, 0.3617021276595745, 0.3522727272727273, 0.22972972972972974, 0.7037037037037037] [0.782608695652174, 0.10638297872340426, 0.5568181818181818, 1.0, 0.0] [0.8369565217391305, 1.0, 0.36363636363636365, 0.40540540540540543, 0.345679012345679] [0.391304347826087, 0.5106382978723404, 0.0, 0.16216216216216217, 0.8641975308641974] [0.21739130434782608, 0.19148936170212766, 0.8181818181818182, 0.5675675675675675, 0.6296296296296295] [0.06521739130434782, 0.9574468085106384, 0.4772727272727273, 0.22972972972972974, 0.8395061728395061] [0.0, 0.7021276595744681, 0.22727272727272727, 0.7297297297297296, 0.2716049382716049] [0.8152173913043478, 0.5638297872340425, 0.8863636363636364, 0.7567567567567567, 0.031746031746031744] [0.29347826086956524, 0.425531914893617, 0.7045454545454546, 0.918918918918919, 0.7037037037037037] [1.0, 0.8936170212765957, 0.5909090909090909, 0.2972972972972973, 0.691358024691358] [0.391304347826087, 0.20212765957446807, 0.5909090909090909, 0.0, 1.0] [0.7608695652173914, 0.010638297872340425, 0.45454545454545453, 0.05405405405405405, 0.8518518518518517] [0.29347826086956524, 0.9787234042553191, 1.0, 0.8648648648648649, 0.9259259259259258] 零均值规范化结果: [-0.19999999999999996, -0.95, 1.05, 0.55, 0.40000000000000013] [-0.5, 0.6999999999999998, 0.10000000000000009, 1.0500000000000003, 0.75] [0.25, -0.9000000000000001, 1.3000000000000003, 0.20000000000000018, 0.8000000000000002] [0.30000000000000004, 0.1, 0.10000000000000009, 0.30000000000000004, 0.10000000000000009] [0.9499999999999998, -0.9500000000000001, 0.10000000000000009, 0.35000000000000003, -0.15000000000000002] [1.7000000000000002, 0.30000000000000004, -0.19999999999999996, 1.0000000000000002, -0.9500000000000001] [-0.65, -0.05000000000000002, -0.19999999999999996, -0.5500000000000002, 0.75] [1.5, -0.7000000000000001, 0.15000000000000002, 2.1500000000000004, -0.9500000000000001] [1.75, 1.1999999999999997, -0.15000000000000002, 0.20000000000000018, -0.10000000000000009] [0.30000000000000004, 0.050000000000000044, -1.1500000000000001, -0.9500000000000001, 1.2000000000000002] [-0.3999999999999999, -0.45, 0.7000000000000002, 0.30000000000000004, 0.45000000000000007] [-0.85, 0.8, -0.04999999999999993, -0.5500000000000002, 1.1500000000000001] [-1.3, 0.30000000000000004, -1.0500000000000003, 0.7500000000000002, -0.20000000000000018] [1.8000000000000003, 0.34999999999999987, 1.2500000000000002, 0.8000000000000003, -1.1500000000000001] [-0.19999999999999996, -0.15000000000000002, 0.44999999999999996, 1.4500000000000002, 0.7000000000000002] [2.25, 1.15, 0.050000000000000044, -0.6999999999999998, 0.6500000000000001] [0.30000000000000004, -0.9000000000000001, 0.050000000000000044, -1.1500000000000001, 1.5500000000000003] [1.5, -0.85, -0.04999999999999993, -1.3500000000000003, 1.2000000000000002] [0.44999999999999996, 1.2499999999999998, 1.1500000000000001, -1.1000000000000003, -0.050000000000000044] ``` 其中第一组结果为最大-最小规范化结果,第二组结果为零均值规范化结果。可以看到,经过规范化后,数据样本的值都在0到1之间或接近0,方便进行后续的数据分析和处理。

相关推荐

最新推荐

recommend-type

python 实现对数据集的归一化的方法(0-1之间)

今天小编就为大家分享一篇python 实现对数据集的归一化的方法(0-1之间),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
recommend-type

python按比例随机切分数据的实现

在Python编程语言中,随机切分数据是一种常见的数据预处理技术,特别是在机器学习和深度学习领域。这个过程有助于我们创建训练集、验证集和(有时)测试集,以便有效地评估和调整模型性能。本文将详细讲解如何按照...
recommend-type

C#利用Random得随机数求均值、方差、正态分布的方法

主要介绍了C#利用Random得随机数求均值、方差、正态分布的方法,涉及C#数学运算及概率统计的相关技巧,需要的朋友可以参考下
recommend-type

python实现随机森林random forest的原理及方法

- **Bootstrap抽样**:随机森林使用Bootstrap抽样(有放回抽样)从原始数据集中创建多个不同的子集,称为“自助样本”。每棵树都是基于这些自助样本独立训练的。 2. **随机森林的优势**: - **并行化**:随机森林...
recommend-type

Python机器学习算法之k均值聚类(k-means)

1. **初始化质心(Centroids)**: 随机选择k个样本作为初始质心。 2. **分配样本**: 对于每个样本,计算它与所有质心的距离,根据最小距离将其分配到最近的类别。 3. **更新质心**: 根据类别内的所有样本重新计算每...
recommend-type

电力电子系统建模与控制入门

"该资源是关于电力电子系统建模及控制的课程介绍,包含了课程的基本信息、教材与参考书目,以及课程的主要内容和学习要求。" 电力电子系统建模及控制是电力工程领域的一个重要分支,涉及到多学科的交叉应用,如功率变换技术、电工电子技术和自动控制理论。这门课程主要讲解电力电子系统的动态模型建立方法和控制系统设计,旨在培养学生的建模和控制能力。 课程安排在每周二的第1、2节课,上课地点位于东12教401室。教材采用了徐德鸿编著的《电力电子系统建模及控制》,同时推荐了几本参考书,包括朱桂萍的《电力电子电路的计算机仿真》、Jai P. Agrawal的《Powerelectronicsystems theory and design》以及Robert W. Erickson的《Fundamentals of Power Electronics》。 课程内容涵盖了从绪论到具体电力电子变换器的建模与控制,如DC/DC变换器的动态建模、电流断续模式下的建模、电流峰值控制,以及反馈控制设计。还包括三相功率变换器的动态模型、空间矢量调制技术、逆变器的建模与控制,以及DC/DC和逆变器并联系统的动态模型和均流控制。学习这门课程的学生被要求事先预习,并尝试对书本内容进行仿真模拟,以加深理解。 电力电子技术在20世纪的众多科技成果中扮演了关键角色,广泛应用于各个领域,如电气化、汽车、通信、国防等。课程通过列举各种电力电子装置的应用实例,如直流开关电源、逆变电源、静止无功补偿装置等,强调了其在有功电源、无功电源和传动装置中的重要地位,进一步凸显了电力电子系统建模与控制技术的实用性。 学习这门课程,学生将深入理解电力电子系统的内部工作机制,掌握动态模型建立的方法,以及如何设计有效的控制系统,为实际工程应用打下坚实基础。通过仿真练习,学生可以增强解决实际问题的能力,从而在未来的工程实践中更好地应用电力电子技术。
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

图像写入的陷阱:imwrite函数的潜在风险和规避策略,规避图像写入风险,保障数据安全

![图像写入的陷阱:imwrite函数的潜在风险和规避策略,规避图像写入风险,保障数据安全](https://static-aliyun-doc.oss-accelerate.aliyuncs.com/assets/img/zh-CN/2275688951/p86862.png) # 1. 图像写入的基本原理与陷阱 图像写入是计算机视觉和图像处理中一项基本操作,它将图像数据从内存保存到文件中。图像写入过程涉及将图像数据转换为特定文件格式,并将其写入磁盘。 在图像写入过程中,存在一些潜在陷阱,可能会导致写入失败或图像质量下降。这些陷阱包括: - **数据类型不匹配:**图像数据可能与目标文
recommend-type

protobuf-5.27.2 交叉编译

protobuf(Protocol Buffers)是一个由Google开发的轻量级、高效的序列化数据格式,用于在各种语言之间传输结构化的数据。版本5.27.2是一个较新的稳定版本,支持跨平台编译,使得可以在不同的架构和操作系统上构建和使用protobuf库。 交叉编译是指在一个平台上(通常为开发机)编译生成目标平台的可执行文件或库。对于protobuf的交叉编译,通常需要按照以下步骤操作: 1. 安装必要的工具:在源码目录下,你需要安装适合你的目标平台的C++编译器和相关工具链。 2. 配置Makefile或CMakeLists.txt:在protobuf的源码目录中,通常有一个CMa
recommend-type

SQL数据库基础入门:发展历程与关键概念

本文档深入介绍了SQL数据库的基础知识,首先从数据库的定义出发,强调其作为数据管理工具的重要性,减轻了开发人员的数据处理负担。数据库的核心概念是"万物皆关系",即使在面向对象编程中也有明显区分。文档讲述了数据库的发展历程,从早期的层次化和网状数据库到关系型数据库的兴起,如Oracle的里程碑式论文和拉里·埃里森推动的关系数据库商业化。Oracle的成功带动了全球范围内的数据库竞争,最终催生了SQL这一通用的数据库操作语言,统一了标准,使得关系型数据库成为主流。 接着,文档详细解释了数据库系统的构成,包括数据库本身(存储相关数据的集合)、数据库管理系统(DBMS,负责数据管理和操作的软件),以及数据库管理员(DBA,负责维护和管理整个系统)和用户应用程序(如Microsoft的SSMS)。这些组成部分协同工作,确保数据的有效管理和高效处理。 数据库系统的基本要求包括数据的独立性,即数据和程序的解耦,有助于快速开发和降低成本;减少冗余数据,提高数据共享性,以提高效率;以及系统的稳定性和安全性。学习SQL时,要注意不同数据库软件可能存在的差异,但核心语言SQL的学习是通用的,后续再根据具体产品学习特异性。 本文档提供了一个全面的框架,涵盖了SQL数据库从基础概念、发展历程、系统架构到基本要求的方方面面,对于初学者和数据库管理员来说是一份宝贵的参考资料。