在UCI中采集有传媒特色的数据
时间: 2024-06-09 15:11:58 浏览: 124
UCI机器学习库中有一些与传媒相关的数据集,例如:
1. "Online News Popularity"数据集:该数据集包含了在2013年1月至2015年11月期间,新闻网站上发布的超过39,000篇文章的详细信息,其中包括文章的标题、作者、发布时间、正文内容等等。这个数据集可以用于预测一篇新闻文章有多大的可能性会被分享和传播。
2. "Reuters-21578 Text Categorization Collection"数据集:该数据集包含了来自路透社的21,578篇新闻文章的文本数据,这些文章被分为了90个不同的主题类别,例如"earnings"、"money-fx"、"ship"等等。这个数据集可以用于训练文本分类模型,以便对新闻文章进行自动分类。
3. "TV News Channel Commercial Detection Dataset"数据集:该数据集包含了来自美国两个不同的电视新闻频道的视频片段,其中包括了广告和非广告内容。这个数据集可以用于训练自动化的广告检测模型,以便在电视广告中自动检测和跟踪广告内容。
希望这些信息能够帮助您找到合适的数据集!
阅读全文