[数据集]新浪微博数据集MicroblogPCU
时间: 2023-11-30 08:31:19 浏览: 132
自然语言处理数据集-36 万多条-带情感标注 新浪微博-包含 4 种情感,其中喜悦约 20 万条,愤怒、厌恶、低落各约 5 万条
5星 · 资源好评率100%
新浪微博数据集MicroblogPCU是一个包含了大量微博数据的数据集,其中包括了用户的个人信息、微博内容、转发和评论等信息。该数据集包含了从2010年到2012年期间的微博数据,涵盖了全国各地的用户。这个数据集可以用于社交网络分析、情感分析、文本分类等多个领域。
MicroblogPCU数据集共包含了3个部分:
1.用户信息数据集:包括了用户的昵称、性别、地区、生日等信息。
2.微博内容数据集:包括了微博的内容、发布时间、转发数、评论数等信息。
3.社交关系数据集:包括了用户之间的关注关系和粉丝关系等信息。
这个数据集可以帮助我们了解用户在社交网络上的行为和交互,挖掘用户的兴趣、情感和行为等特征。同时,它也可以用于构建用户画像、推荐系统和广告投放等应用。
阅读全文