pyg.data自制数据集
时间: 2023-08-21 17:07:02 浏览: 152
制作自己的数据集.txt
在使用PyTorch Geometric (pyg)创建自制数据集时,你可以继承`InMemoryDataset`类,并重写一些必要的方法来实现数据集的下载、处理和加载。首先,你需要定义一个类,例如`MyDataset`,并将其继承自`InMemoryDataset`。在构造函数中,你可以调用父类的构造函数,并在其中加载数据集。你可以使用`torch.load`函数加载数据,并将其赋值给`self.data`和`self.slices`。同时,你可以重写`raw_file_names`和`processed_file_names`方法来指定原始文件和处理后的文件的名称。在`download`方法中,你可以实现数据集的下载逻辑。在`process`方法中,你可以对数据集进行处理,并将处理后的数据保存到指定的路径。最后,在`collate`函数中,你可以将一个python列表形式的数据转换为`InMemoryDataset`内部存储数据的格式。你可以使用`data_list\[0\].__class__()`来创建一个空的数据对象,然后将列表中的每个数据对象转换为该类型。\[2\]\[3\]
#### 引用[.reference_title]
- *1* [在PyG上构建自己的数据集](https://blog.csdn.net/qq_32113189/article/details/126663738)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item]
- *2* *3* [【PyG入门学习】四:构建自己的数据集](https://blog.csdn.net/TwT520Ly/article/details/105633847)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^koosearch_v1,239^v3^insert_chatgpt"}} ] [.reference_item]
[ .reference_list ]
阅读全文