图数据集存储库汇总:31个图分类基准数据集

需积分: 50 6 下载量 88 浏览量 更新于2024-11-16 收藏 36.25MB ZIP 举报
资源摘要信息:"该资源是一份包含31个图数据集的图分类基准数据存储库。图分类作为一项技术,近年来随着对具有结构关系的对象进行分析的应用增多而变得日益重要。在生物信息学、脑网络、图像结构分析以及学术引用网络等领域,图数据能够有效模拟对象间复杂的关系。不同于传统数据用特征向量表示每个实例,图数据通过节点-边结构关系呈现,导致缺乏自然的向量表示形式。这对图分类算法的研究提出了挑战。图分类的目标是,给定一系列带有类别标签的训练图,通过学习这些训练图来预测未来未知图的类别。 本存储库中的数据集包括多个类型的数据集,具体如下: 化学化合物:这类数据集包含各种化学物质的图结构,通常采用“.sdf”(结构数据文件)或“.smi”(简化分子输入线性表示法)格式。这些数据对于药物发现、材料科学等领域的研究具有重要价值。 引文网络:该数据集涉及学术文献之间的引用关系,这些关系被表示为图结构,通常用于研究学术影响力、文献推荐等。 社交网络:这类数据集反映了社交平台中个体或组织之间的互动关系,通常用于社交网络分析和社区检测等领域。 脑网络:这类数据集来源于大脑的神经成像数据,如功能性磁共振成像(fMRI),它们被转化为图结构以研究大脑连接和功能。 数据集文件通常以“.nel”格式存储,这是一种专门用于存储图数据的格式。通过这些数据集,研究人员可以开发和测试新的图分类算法,并在实际应用中进行验证。 本存储库名为“graph_datasets-master”,其中“graph”一词强调了数据集以图的形式存储,而“dataset”则表示该存储库是一个数据集合。关键词“graph-database”和“graph-classification”直接关联到图数据库和图分类这两个与图相关的专业领域,说明了该存储库在图数据管理和分类算法研究中的重要性。"
2021-03-29 上传