读取文件夹里的文件里的.csv文件并作为数据集
时间: 2023-12-03 19:02:41 浏览: 124
同一文件夹下所有文件间隔取值并合并.txt
可以使用 Python 的 `os` 模块来遍历文件夹中的文件,然后使用 Pandas 的 `read_csv` 方法来读取 CSV 文件并将它们合并为一个数据集。以下是一个示例代码:
```python
import os
import pandas as pd
# 将所有 CSV 文件合并为一个数据集
data = pd.DataFrame()
folder_path = 'your_folder_path'
for file_name in os.listdir(folder_path):
if file_name.endswith('.csv'):
file_path = os.path.join(folder_path, file_name)
df = pd.read_csv(file_path)
data = pd.concat([data, df], ignore_index=True)
# 输出数据集的基本信息
print(data.shape)
print(data.head())
```
其中 `your_folder_path` 是你需要读取的文件夹路径,`os.listdir` 方法可以列出文件夹中所有文件的文件名,然后根据文件名的后缀名筛选出 CSV 文件,并使用 `os.path.join` 方法构造文件的绝对路径,最后使用 Pandas 的 `concat` 方法将所有 CSV 文件合并为一个数据集。
阅读全文