首页X_train, y_train如何用8000个csv文件的数据集，csv文件包含path路径，map地图start起点，end终点

X_train, y_train如何用8000个csv文件的数据集，csv文件包含path路径，map地图start起点，end终点

时间: 2024-05-03 09:18:51 浏览: 101

假设每个CSV文件都包含一条路径数据，其中包含path、map、start和end四个字段。我们可以将CSV文件读取为一个 Pandas DataFrame，然后将所有的 DataFrame 合并成一个大的 DataFrame，最终得到一个包含所有路径数据的 DataFrame。首先，我们需要导入 Pandas 库，并创建一个空的 DataFrame。 ```python import pandas as pd all_data = pd.DataFrame() ``` 然后，我们可以使用 Pandas 的 `read_csv()` 函数读取每个 CSV 文件，并将其合并到 `all_data` 中。 ```python import os csv_folder = '/path/to/csv/folder' for csv_file in os.listdir(csv_folder): if csv_file.endswith('.csv'): csv_path = os.path.join(csv_folder, csv_file) df = pd.read_csv(csv_path) all_data = pd.concat([all_data, df], ignore_index=True) ``` 现在，`all_data` 就包含了所有路径数据。我们可以使用 `X_train` 和 `y_train` 分别表示路径和终点的坐标。假设 `path` 字段是一个字符串，我们可以使用 `eval()` 函数将其转换为 Python 列表，并将其作为 `X_train`。 ```python X_train = all_data['path'].apply(eval).tolist() ``` 对于 `y_train`，我们可以将 `start` 和 `end` 字段合并为一个二元组，并将其作为 `y_train`。 ```python y_train = all_data[['start', 'end']].apply(tuple, axis=1).tolist() ``` 现在，`X_train` 和 `y_train` 就是我们需要的训练数据了。

阅读全文