从Kaggle、UCI Machine Learning Repository等平台中选定一个数据集,包括数据集介绍,数据类型,数据量等基本信息。
时间: 2024-03-29 07:38:14 浏览: 15
好的,下面给你介绍一些从Kaggle、UCI Machine Learning Repository等平台中选定的常见数据集。
1. Titanic: Machine Learning from Disaster(Kaggle)
该数据集包含有关泰坦尼克号乘客的信息,包括乘客的姓名、性别、年龄、票价等等。目标是根据乘客的特征预测他们是否在灾难中幸存下来。该数据集包含891个训练样本和418个测试样本。
2. Wine Quality(UCI Machine Learning Repository)
该数据集包含红葡萄酒和白葡萄酒的化学特征,例如酸度、酒精含量、pH值等等。目标是根据化学特征预测酒的质量评分。该数据集包含4898个样本。
3. Fashion MNIST(Kaggle)
该数据集包含10个类别的时尚商品图片,包括T恤、裤子、衬衫等等。目标是根据图片预测它所属的类别。该数据集包含60,000个训练样本和10,000个测试样本。
4. Boston Housing(UCI Machine Learning Repository)
该数据集包含波士顿地区的房屋价格和房屋属性信息,例如房龄、房间数量、犯罪率等等。目标是根据房屋属性预测房屋价格。该数据集包含506个样本。
以上是一些常见的数据集,它们包含了不同类型的数据,可以用于不同的机器学习任务。如果你需要更多的数据集,可以在Kaggle、UCI Machine Learning Repository等平台上进行搜索。
相关问题
uci常用数据集 免费下载
以下是一些常用的免费下载数据集:
1. UCI Machine Learning Repository: 这是一个非常著名的机器学习数据集资源库,包括多种数据集,例如波士顿房价、鸢尾花、手写数字等等。您可以在官方网站上下载这些数据集。网站链接:https://archive.ics.uci.edu/ml/index.php
2. Kaggle: Kaggle是一个面向数据科学家和机器学习工程师的平台,提供了很多免费的数据集。您可以在https://www.kaggle.com/datasets 上找到各种数据集。
3. Google Dataset Search: Google Dataset Search 是一个用于查找各种数据集的搜索引擎,您可以在其中找到各种类型的数据集。网站链接:https://datasetsearch.research.google.com/
4. Amazon AWS: Amazon AWS 提供了大量的公共数据集,包括气象数据、生命科学数据、经济数据等等。您可以在https://aws.amazon.com/datasets/ 上找到各种数据集。
5. Data.gov: Data.gov 是美国政府提供的一个免费数据集资源库,包括各种类型的数据集,例如环境、能源、金融等等。您可以在https://www.data.gov/ 上下载这些数据集。
希望这些资源能对您有所帮助。
文本分类数据集从哪里找
可以从以下几个渠道找到文本分类数据集:
1. Kaggle:Kaggle是一个数据科学竞赛平台,提供了大量的数据集,其中包括文本分类数据集。
2. UCI Machine Learning Repository:UCI Machine Learning Repository是一个公共数据集的存储库,其中包括了各种类型的数据集,包括文本分类数据集。
3. GitHub:GitHub上有许多开源项目,其中包括了一些文本分类数据集。
4. 自己爬取:如果你有一个特定的领域,你可以自己编写爬虫程序从网上爬取相关的文本数据,然后进行分类。