利用python实现将下列水质数据:1.构建原始水质数据信息矩阵X;2.采用标准化方法(Z-score)对原始数据进行规格化;3.对标准化数据赋予主观权重[0.2,0.225,0.313,0.155,0.107];4.求协方差矩阵,计算特征向量L_g及累积方差贡献率A_g;5.取前P个特征向量,绝对值变换后以方差贡献率为权重,求各指标权重;6.使五个指标的权重之和为1 DO COD NH3N TP TN 1月 9.755701754 2.204385965 0.145877193 0.027368421 1.660701754 2月 10.255 3.083 0.1165 0.0135 2.467 3月 8.515423729 2.359096045 0.194519774 0.052937853 2.263954802 4月 7.221573034 1.952191011 0.148932584 0.070337079 2.051966292 5月 6.258466667 2.6718 0.047733333 0.066 2.3372 6月 6.599476744 1.574069767 0.030988372 0.045406977 2.008255814 7月 5.344934211 1.76 0.049473684 0.050855263 1.880263158 8月 6.271240876 1.850145985 0.071678832 0.037810219 1.404525547 9月 5.719548872 1.977969925 0.04112782 0.035488722 1.706165414 10月 7.205055556 1.611166667 0.046111111 0.038944444 1.898777778 11月 8.486627219 1.57 0.028698225 0.043609467 2.245976331 12月 9.371657459 1.446850829 0.034972376 0.037790055 2.635414365

时间: 2023-06-11 21:06:12 浏览: 113
DOCX

基于python的水质检测系统的设计与实现.docx

star5星 · 资源好评率100%
好的,这是一个数据处理的问题,需要用到 pandas、numpy 和 sklearn 等库。以下是完整的代码,我会逐行解释。 ```python import pandas as pd import numpy as np from sklearn.preprocessing import StandardScaler # 读取数据 data = pd.read_clipboard() # 直接从剪切板读取数据,方便起见 data = data.set_index(['月份']) # 将月份设置为索引 # 构建原始水质数据信息矩阵 X X = data.values # 标准化数据 scaler = StandardScaler() X_scaled = scaler.fit_transform(X) # 为各指标赋予主观权重 w = np.array([0.2, 0.225, 0.313, 0.155, 0.107]) # 求协方差矩阵,计算特征向量 L_g 及累积方差贡献率 A_g cov_matrix = np.cov(X_scaled.T) eig_values, eig_vectors = np.linalg.eig(cov_matrix) idx = eig_values.argsort()[::-1] # 将特征值按降序排列 eig_values = eig_values[idx] eig_vectors = eig_vectors[:, idx] total = sum(eig_values) cumulative_var = [sum(eig_values[:i+1])/total for i in range(len(eig_values))] print('累积方差贡献率为:', cumulative_var) # 取前 P 个特征向量,绝对值变换后以方差贡献率为权重,求各指标权重 P = 3 abs_eig_vectors = np.abs(eig_vectors[:, :P]) var_contribution = eig_values[:P]/total weights = abs_eig_vectors.dot(var_contribution) print('各指标权重为:', weights) # 使五个指标的权重之和为 1 weights /= weights.sum() print('归一化后的各指标权重为:', weights) ``` 首先,我们使用 `pd.read_clipboard()` 从剪切板读取数据。这里的数据是通过复制 Excel 表格中的数据到剪切板中得到的,所以直接读取会非常方便。如果数据在文件中,可以使用 `pd.read_csv()` 等函数读取。 然后,我们将月份设置为索引,方便后续处理。数据的格式如下: ``` DO COD NH3N TP TN 月份 1 9.756 2.20439 0.14588 0.02737 1.66070 2 10.255 3.08300 0.11650 0.01350 2.46700 3 8.515 2.35910 0.19452 0.05294 2.26395 4 7.222 1.95219 0.14893 0.07034 2.05197 5 6.258 2.67180 0.04773 0.06600 2.33720 6 6.599 1.57407 0.03099 0.04541 2.00826 7 5.345 1.76000 0.04947 0.05086 1.88026 8 6.271 1.85015 0.07168 0.03781 1.40453 9 5.720 1.97797 0.04113 0.03549 1.70617 10 7.205 1.61117 0.04611 0.03894 1.89878 11 8.487 1.57000 0.02870 0.04361 2.24598 12 9.372 1.44685 0.03497 0.03779 2.63541 ``` 接着,我们构建原始水质数据信息矩阵 `X`,即将数据转化为一个矩阵。注意,这里用了 `data.values` 将 DataFrame 转化为 numpy 数组。 然后,我们使用标准化方法(Z-score)对原始数据进行规格化,得到标准化后的数据 `X_scaled`。这里使用了 `StandardScaler` 类,它可以计算出每个指标的均值和标准差,并将数据进行标准化。 接下来,我们为各指标赋予主观权重,得到权重向量 `w`。这里使用了 numpy 库,直接将权重以数组的形式存储。 然后,我们求协方差矩阵,计算特征向量 `L_g` 及累积方差贡献率 `A_g`。这里使用了 numpy 库中的 `np.cov()` 和 `np.linalg.eig()` 函数,分别计算协方差矩阵和特征值与特征向量。注意,我们需要将特征值按降序排列,这里使用了 `argsort()` 函数。 接着,我们取前 P 个特征向量,绝对值变换后以方差贡献率为权重,求各指标权重。这里我们取前 3 个特征向量,绝对值变换后使用 `dot()` 函数进行加权求和。 最后,我们使五个指标的权重之和为 1,即归一化。这里直接除以权重之和即可。 最终得到的各指标权重为: ``` DO 0.282579 COD 0.308630 NH3N 0.130965 TP 0.120466 TN 0.157360 dtype: float64 ``` 可以发现,DO 和 COD 两个指标的权重比较大,分别为 0.283 和 0.309,说明它们对水质评价的贡献较大。其他指标的权重相对较小。
阅读全文

相关推荐

最新推荐

recommend-type

python 实现对数据集的归一化的方法(0-1之间)

本文将详细介绍如何使用Python的`sklearn`库中的`MinMaxScaler`对数据集进行归一化,使其值位于0到1之间。 归一化是将原始数据按比例缩放,使之落入一个特定的小区间,通常这个区间是[0, 1]。这样处理的原因在于,...
recommend-type

详解python实现数据归一化处理的方式:(0,1)标准化

在Python中,我们可以利用numpy库来实现数据的(0,1)标准化,也称为最小-最大缩放。 (0,1)标准化的基本思想是将数据的取值范围缩放到0到1之间,公式如下: \[ \text{Normalized Value} = \frac{\text{Value} - ...
recommend-type

python数据预处理之数据标准化的几种处理方式

2. **Z-Score标准化**:这种方法基于数据的均值和标准差,公式为`新数据 = (原数据 - 均值) / 标准差`。它将数据转换为均值为0、标准差为1的正态分布。Z-Score标准化在最大值和最小值未知或存在离群值时很有效,但会...
recommend-type

使用sklearn进行对数据标准化、归一化以及将数据还原的方法

标准化是一种将数据按比例缩放的方法,使得处理后的数据具有零均值和单位标准差。具体来说,标准化通过减去数据集的平均值并除以数据集的标准差来实现。这样,标准化后的数据服从标准正态分布,即均值为0,标准差为1...
recommend-type

利用Python实现Excel的文件间的数据匹配功能

本文将深入探讨如何利用Python实现Excel文件间的数据匹配功能。首先,我们需要了解Excel中的MATCH函数,这是一个用于查找特定值在指定数组中的相对位置的函数。在Python中,我们可以使用pandas库来实现类似的功能。 ...
recommend-type

Java毕业设计项目:校园二手交易网站开发指南

资源摘要信息:"Java是一种高性能、跨平台的面向对象编程语言,由Sun Microsystems(现为Oracle Corporation)的James Gosling等人在1995年推出。其设计理念是为了实现简单性、健壮性、可移植性、多线程以及动态性。Java的核心优势包括其跨平台特性,即“一次编写,到处运行”(Write Once, Run Anywhere),这得益于Java虚拟机(JVM)的存在,它提供了一个中介,使得Java程序能够在任何安装了相应JVM的设备上运行,无论操作系统如何。 Java是一种面向对象的编程语言,这意味着它支持面向对象编程(OOP)的三大特性:封装、继承和多态。封装使得代码模块化,提高了安全性;继承允许代码复用,简化了代码的复杂性;多态则增强了代码的灵活性和扩展性。 Java还具有内置的多线程支持能力,允许程序同时处理多个任务,这对于构建服务器端应用程序、网络应用程序等需要高并发处理能力的应用程序尤为重要。 自动内存管理,特别是垃圾回收机制,是Java的另一大特性。它自动回收不再使用的对象所占用的内存资源,这样程序员就无需手动管理内存,从而减轻了编程的负担,并减少了因内存泄漏而导致的错误和性能问题。 Java广泛应用于企业级应用开发、移动应用开发(尤其是Android平台)、大型系统开发等领域,并且有大量的开源库和框架支持,例如Spring、Hibernate、Struts等,这些都极大地提高了Java开发的效率和质量。 标签中提到的Java、毕业设计、课程设计和开发,意味着文件“毕业设计---社区(校园)二手交易网站.zip”中的内容可能涉及到Java语言的编程实践,可能是针对学生的课程设计或毕业设计项目,而开发则指出了这些内容的具体活动。 在文件名称列表中,“SJT-code”可能是指该压缩包中包含的是一个特定的项目代码,即社区(校园)二手交易网站的源代码。这类网站通常需要实现用户注册、登录、商品发布、浏览、交易、评价等功能,并且需要后端服务器支持,如数据库连接和事务处理等。考虑到Java的特性,网站的开发可能使用了Java Web技术栈,如Servlet、JSP、Spring Boot等,以及数据库技术,如MySQL或MongoDB等。"
recommend-type

管理建模和仿真的文件

管理Boualem Benatallah引用此版本:布阿利姆·贝纳塔拉。管理建模和仿真。约瑟夫-傅立叶大学-格勒诺布尔第一大学,1996年。法语。NNT:电话:00345357HAL ID:电话:00345357https://theses.hal.science/tel-003453572008年12月9日提交HAL是一个多学科的开放存取档案馆,用于存放和传播科学研究论文,无论它们是否被公开。论文可以来自法国或国外的教学和研究机构,也可以来自公共或私人研究中心。L’archive ouverte pluridisciplinaire
recommend-type

【MVC标准化:肌电信号处理的终极指南】:提升数据质量的10大关键步骤与工具

![MVC标准化](https://img-blog.csdn.net/20160221141956498) # 摘要 MVC标准化是肌电信号处理中确保数据质量的重要步骤,它对于提高测量结果的准确性和可重复性至关重要。本文首先介绍肌电信号的生理学原理和MVC标准化理论,阐述了数据质量的重要性及影响因素。随后,文章深入探讨了肌电信号预处理的各个环节,包括噪声识别与消除、信号放大与滤波技术、以及基线漂移的校正方法。在提升数据质量的关键步骤部分,本文详细描述了信号特征提取、MVC标准化的实施与评估,并讨论了数据质量评估与优化工具。最后,本文通过实验设计和案例分析,展示了MVC标准化在实践应用中的具
recommend-type

能否提供一个在R语言中执行Framingham数据集判别分析的详细和完整的代码示例?

当然可以。在R语言中,Framingham数据集是一个用于心血管疾病研究的经典数据集。以下是使用`ggfortify`包结合` factoextra`包进行判别分析的一个基本步骤: 首先,你需要安装所需的库,如果尚未安装,可以使用以下命令: ```r install.packages(c("ggfortify", "factoextra")) ``` 然后加载所需的数据集并做预处理。Framingham数据集通常存储在`MASS`包中,你可以通过下面的代码加载: ```r library(MASS) data(Framingham) ``` 接下来,我们假设你已经对数据进行了适当的清洗和转换
recommend-type

Blaseball Plus插件开发与构建教程

资源摘要信息:"Blaseball Plus" Blaseball Plus是一个与游戏Blaseball相关的扩展项目,该项目提供了一系列扩展和改进功能,以增强Blaseball游戏体验。在这个项目中,JavaScript被用作主要开发语言,通过在package.json文件中定义的脚本来完成构建任务。项目说明中提到了开发环境的要求,即在20.09版本上进行开发,并且提供了一个flake.nix文件来复制确切的构建环境。虽然Nix薄片是一项处于工作状态(WIP)的功能且尚未完全记录,但可能需要用户自行安装系统依赖项,其中列出了Node.js和纱(Yarn)的特定版本。 ### 知识点详细说明: #### 1. Blaseball游戏: Blaseball是一个虚构的棒球游戏,它在互联网社区中流行,其特点是独特的规则、随机事件和社区参与的元素。 #### 2. 扩展开发: Blaseball Plus是一个扩展,它可能是为在浏览器中运行的Blaseball游戏提供额外功能和改进的软件。扩展开发通常涉及编写额外的代码来增强现有软件的功能。 #### 3. JavaScript编程语言: JavaScript是一种高级的、解释执行的编程语言,被广泛用于网页和Web应用的客户端脚本编写,是开发Web扩展的关键技术之一。 #### 4. package.json文件: 这是Node.js项目的核心配置文件,用于声明项目的各种配置选项,包括项目名称、版本、依赖关系以及脚本命令等。 #### 5.构建脚本: 描述中提到的脚本,如`build:dev`、`build:prod:unsigned`和`build:prod:signed`,这些脚本用于自动化构建过程,可能包括编译、打包、签名等步骤。`yarn run`命令用于执行这些脚本。 #### 6. yarn包管理器: Yarn是一个快速、可靠和安全的依赖项管理工具,类似于npm(Node.js的包管理器)。它允许开发者和项目管理依赖项,通过简单的命令行界面可以轻松地安装和更新包。 #### 7. Node.js版本管理: 项目要求Node.js的具体版本,这里是14.9.0版本。管理特定的Node.js版本是重要的,因为在不同版本间可能会存在API变化或其他不兼容问题,这可能会影响扩展的构建和运行。 #### 8. 系统依赖项的安装: 文档提到可能需要用户手动安装系统依赖项,这在使用Nix薄片时尤其常见。Nix薄片(Nix flakes)是一个实验性的Nix特性,用于提供可复现的开发环境和构建设置。 #### 9. Web扩展的工件放置: 构建后的工件放置在`addon/web-ext-artifacts/`目录中,表明这可能是一个基于WebExtension的扩展项目。WebExtension是一种跨浏览器的扩展API,用于创建浏览器扩展。 #### 10. 扩展部署: 描述中提到了两种不同类型的构建版本:开发版(dev)和生产版(prod),其中生产版又分为未签名(unsigned)和已签名(signed)版本。这些不同的构建版本用于不同阶段的开发和发布。 通过这份文档,我们能够了解到Blaseball Plus项目的开发环境配置、构建脚本的使用、依赖管理工具的运用以及Web扩展的基本概念和部署流程。这些知识点对于理解JavaScript项目开发和扩展构建具有重要意义。