python 读取文件夹内的csv文件,并且记录文件名称,清楚文件里面的NAN值,分别取第四列数据作为y变量,第七列数据作为x变量,作图 代码
时间: 2023-06-06 16:07:38 浏览: 80
moxing_python数据清洗_读取csv文件_数据清洗_
5星 · 资源好评率100%
以下是 Python 代码实现:
```python
import os
import pandas as pd
import matplotlib.pyplot as plt
folder_path = "/path/to/folder" # 文件夹路径
y_label = "col4" # y变量所在列名
x_label = "col7" # x变量所在列名
nan_value = 0 # NAN值填充值
# 遍历文件夹内的csv文件
for filename in os.listdir(folder_path):
if filename.endswith(".csv"):
file_path = os.path.join(folder_path, filename)
print("Processing file:", file_path)
# 读取csv文件
df = pd.read_csv(file_path)
# 记录文件名
df["filename"] = filename
# 清除NAN值
df = df.fillna(nan_value)
# 取第四列和第七列作为y和x变量,并作图
plt.scatter(df[x_label], df[y_label])
plt.title(filename)
plt.xlabel(x_label)
plt.ylabel(y_label)
plt.show()
```
解释:以上代码遍历指定文件夹内的csv文件,对每个文件进行以下步骤:(1)读取csv文件;(2)记录文件名;(3)清除NAN值,将NAN值替换为指定的填充值;(4)取第四列和第七列作为y和x变量,并作图。注:NAN值填充值可根据具体需求更改。
阅读全文