X_train, y_train如何用8000个csv文件的数据集,csv文件包含path路径,map地图start起点,end终点
时间: 2024-05-03 09:18:51 浏览: 101
假设每个CSV文件都包含一条路径数据,其中包含path、map、start和end四个字段。我们可以将CSV文件读取为一个 Pandas DataFrame,然后将所有的 DataFrame 合并成一个大的 DataFrame,最终得到一个包含所有路径数据的 DataFrame。
首先,我们需要导入 Pandas 库,并创建一个空的 DataFrame。
```python
import pandas as pd
all_data = pd.DataFrame()
```
然后,我们可以使用 Pandas 的 `read_csv()` 函数读取每个 CSV 文件,并将其合并到 `all_data` 中。
```python
import os
csv_folder = '/path/to/csv/folder'
for csv_file in os.listdir(csv_folder):
if csv_file.endswith('.csv'):
csv_path = os.path.join(csv_folder, csv_file)
df = pd.read_csv(csv_path)
all_data = pd.concat([all_data, df], ignore_index=True)
```
现在,`all_data` 就包含了所有路径数据。我们可以使用 `X_train` 和 `y_train` 分别表示路径和终点的坐标。假设 `path` 字段是一个字符串,我们可以使用 `eval()` 函数将其转换为 Python 列表,并将其作为 `X_train`。
```python
X_train = all_data['path'].apply(eval).tolist()
```
对于 `y_train`,我们可以将 `start` 和 `end` 字段合并为一个二元组,并将其作为 `y_train`。
```python
y_train = all_data[['start', 'end']].apply(tuple, axis=1).tolist()
```
现在,`X_train` 和 `y_train` 就是我们需要的训练数据了。
阅读全文