常用的用于图卷积的图网络数据集以及其节点个数和标签数量
时间: 2024-01-29 15:02:40 浏览: 32
常用的图卷积网络数据集包括:
1. Cora:这是一个文献引用的数据集,包含2708个科学出版物,分为七个类别。
2. Citeseer:这是另一个文献引用数据集,包含3327个科学出版物,分为六个类别。
3. Pubmed:这是一个医学文献引用数据集,包含19717个科学出版物,分为三个类别。
4. Reddit:这是一个社交媒体平台Reddit上的帖子数据集,包含232965个节点和11484890个边。
5. PPI:这是一个蛋白质相互作用数据集,包含PPI网络中的20000个节点和121万个边。
这些数据集中,节点数量和标签数量各不相同,例如Cora数据集中有2708个节点和7个标签,而Reddit数据集中则有232965个节点和一个二元标签。
相关问题
常用的用于图卷积的图网络数据集
以下是一些常用的用于图卷积的图网络数据集:
1. Cora:一个用于文献分类的数据集,其中每个节点表示一篇论文,每个标签表示论文所属的类别。
2. Citeseer:类似于Cora数据集,也用于文献分类,但包含的论文数量更多。
3. Pubmed:另一个用于文献分类的数据集,其中每个节点表示一篇医学文章,每个标签表示文章所属的类别。
4. Reddit:一个包含数百万个帖子和评论的社交网络数据集,可以用于社区发现和推荐系统等任务。
5. PPI:一个用于蛋白质相互作用预测的数据集,其中每个节点表示一个蛋白质,边表示蛋白质之间的相互作用。
6. AMiner:一个用于学术合作关系预测的数据集,其中每个节点表示一个研究员,边表示两个研究员之间的合作关系。
7. Yelp:一个包含数百万条评论和用户之间交互的数据集,可以用于推荐系统等任务。
这些数据集可以在许多开源的图神经网络框架中使用,并且已经被广泛应用于各种领域的研究中。
关于图卷积神经网络的数据集的论述
图卷积神经网络的数据集通常是图形数据集,这些数据集包含节点和它们之间的连接。这些节点可以代表不同的实体,如人、物品、地点等。连接可以表示这些实体之间的关系,如社交网络中的朋友关系、物品之间的相似性等。
常用的图形数据集包括Cora、Citeseer、PubMed等,这些数据集用于节点分类和图分类任务。除此之外,还有一些专门针对图形数据集的数据集,如PPI(蛋白质相互作用)数据集、MUTAG(分子图)数据集等,这些数据集用于生物学、化学等领域的图形分析任务。
此外,还有一些图形生成数据集,如ER图、BA图等,用于生成图形分析模型的训练和测试。在大多数情况下,这些数据集采用的是图形表示形式,即将图形表示为邻接矩阵和特征矩阵的形式。