GCN数据集Cora、Citeseer、Pubmed文件分析

分类:网络文章 时间:2024-01-15 02:48 浏览:0 评论:0
0

Cora、Citeseer 和 Pubmed 是三个常用的图分类数据集,用于研究和评估图分类算法。

  1. Cora 数据集:

    • 由康奈尔大学研究人员创建。
    • 文献库收录科研论文2708篇,分为7个领域。
    • 每篇论文都由一个 128 维的词袋模型表示。
    • 论文之间的边缘代表引用关系。
  2. Citeseer 数据集:

    • 由康奈尔大学研究人员创建。
    • 包含3327篇科研论文,分为6个领域。
    • 每篇论文都由一个 3703 维的词袋模型表示。
    • 论文之间的边缘代表引用关系。
  3. Pubmed 数据集:

    • 由美国国立卫生研究院创建。
    • 包含 19,717 篇生物医学论文,分为 3 个领域。
    • 每篇论文都由 500 维的词袋模型。
    • 论文之间的边缘代表共同作者关系。

这些数据集通常用于图分类任务,其中图分类是指将图中的节点分为不同的类别。这些数据集对研究人员非常有用,因为它们提供了各个领域的真实数据,可用于评估和比较不同图分类算法的性能。

1. 本站所有资源来源于用户上传或网络,仅作为参考研究使用,如有侵权请邮件联系站长!
2. 本站积分货币获取途径以及用途的解读,想在本站混的好,请务必认真阅读!
3. 本站强烈打击盗版/破解等有损他人权益和违法作为,请各位会员支持正版!
4. 网络文章 > GCN数据集Cora、Citeseer、Pubmed文件分析

用户评论