从Kaggle、UCI Machine Learning Repository等平台中选定一个数据集,包括数据集介绍,数据类型,数据量等基本信息。
时间: 2024-03-29 21:38:14 浏览: 128
机器学习数据集
好的,下面给你介绍一些从Kaggle、UCI Machine Learning Repository等平台中选定的常见数据集。
1. Titanic: Machine Learning from Disaster(Kaggle)
该数据集包含有关泰坦尼克号乘客的信息,包括乘客的姓名、性别、年龄、票价等等。目标是根据乘客的特征预测他们是否在灾难中幸存下来。该数据集包含891个训练样本和418个测试样本。
2. Wine Quality(UCI Machine Learning Repository)
该数据集包含红葡萄酒和白葡萄酒的化学特征,例如酸度、酒精含量、pH值等等。目标是根据化学特征预测酒的质量评分。该数据集包含4898个样本。
3. Fashion MNIST(Kaggle)
该数据集包含10个类别的时尚商品图片,包括T恤、裤子、衬衫等等。目标是根据图片预测它所属的类别。该数据集包含60,000个训练样本和10,000个测试样本。
4. Boston Housing(UCI Machine Learning Repository)
该数据集包含波士顿地区的房屋价格和房屋属性信息,例如房龄、房间数量、犯罪率等等。目标是根据房屋属性预测房屋价格。该数据集包含506个样本。
以上是一些常见的数据集,它们包含了不同类型的数据,可以用于不同的机器学习任务。如果你需要更多的数据集,可以在Kaggle、UCI Machine Learning Repository等平台上进行搜索。
阅读全文