首页python 在一个文件夹中有很多csv文件，每个csv文件里都是第一列是预测值，第二列为真实值，第三列是“绝对误差”，第四列是“相对误差”，怎么求出每个csv文件里前两列预测值和真实值之间的均方根误差RMSE值，然后保存成新的csv文件

python 在一个文件夹中有很多csv文件，每个csv文件里都是第一列是预测值，第二列为真实值，第三列是“绝对误差”，第四列是“相对误差”，怎么求出每个csv文件里前两列预测值和真实值之间的均方根误差RMSE值，然后保存成新的csv文件

时间: 2024-09-09 12:11:52 浏览: 53

要计算每个CSV文件中预测值和真实值之间的均方根误差（RMSE），你可以使用Python的pandas库来读取数据和计算，以及numpy库来进行数学运算。以下是一个基本的步骤说明： 1. 首先，导入必要的库： ```python import pandas as pd import numpy as np import os ``` 2. 然后，创建一个函数来计算单个CSV文件的RMSE： ```python def calculate_rmse(file_path): # 读取CSV文件 df = pd.read_csv(file_path) # 计算平方误差 squared_errors = np.square(df.iloc[:, 0] - df.iloc[:, 1]) # 计算均方根误差 rmse = np.sqrt(np.mean(squared_errors)) return rmse ``` 3. 接着，遍历文件夹中的所有CSV文件，计算每个文件的RMSE并保存： ```python def process_all_files(folder_path): for file_name in os.listdir(folder_path): if file_name.endswith('.csv'): file_path = os.path.join(folder_path, file_name) rmse = calculate_rmse(file_path) # 将RMSE值保存到新的CSV文件中 output_df = pd.DataFrame({'RMSE': [rmse]}) output_file_path = os.path.join(folder_path, f"{file_name}_rmse.csv") output_df.to_csv(output_file_path, index=False) ``` 4. 最后，调用`process_all_files`函数处理指定文件夹中的所有CSV文件： ```python folder_path = 'path_to_your_folder' # 请替换为你的文件夹路径 process_all_files(folder_path) ``` 确保在运行这段代码之前已经安装了pandas和numpy库。你可以使用pip命令安装它们： ```shell pip install pandas numpy ```

阅读全文