来自 UCI Machine Learning Repository 的糖尿病数据集:这个数据集包含了 442 名糖尿患者的数据,其中包含了年龄、BMI、血压等指标。
时间: 2023-07-15 12:13:19 浏览: 42
这是一个非常常用的机器学习数据集,可以用来探究糖尿病的预测和诊断。数据集中包含了8个输入特征和一个输出标签(即是否患有糖尿病)。其中年龄、BMI、血压等指标是一些常见的糖尿病风险因素,因此这个数据集可以用来训练机器学习模型,从而预测一个人是否患有糖尿病。同时,这个数据集也可以用来探究糖尿病风险因素之间的关系,比如年龄和BMI之间的相关性等。
相关问题
UCI Machine Learning Repository 的糖尿病数据集
UCI Machine Learning Repository 的糖尿病数据集包含了具有不同特征的病人,包括年龄、性别、BMI、血压等。数据集中的目标变量是病人是否患有糖尿病。这个数据集常用于二分类问题的机器学习任务,例如预测一个病人是否患有糖尿病。数据集可以从UCI Machine Learning Repository官网上下载。
从Kaggle、UCI Machine Learning Repository等平台中选定一个数据集,包括数据集介绍,数据类型,数据量等基本信息。
好的,下面给你介绍一些从Kaggle、UCI Machine Learning Repository等平台中选定的常见数据集。
1. Titanic: Machine Learning from Disaster(Kaggle)
该数据集包含有关泰坦尼克号乘客的信息,包括乘客的姓名、性别、年龄、票价等等。目标是根据乘客的特征预测他们是否在灾难中幸存下来。该数据集包含891个训练样本和418个测试样本。
2. Wine Quality(UCI Machine Learning Repository)
该数据集包含红葡萄酒和白葡萄酒的化学特征,例如酸度、酒精含量、pH值等等。目标是根据化学特征预测酒的质量评分。该数据集包含4898个样本。
3. Fashion MNIST(Kaggle)
该数据集包含10个类别的时尚商品图片,包括T恤、裤子、衬衫等等。目标是根据图片预测它所属的类别。该数据集包含60,000个训练样本和10,000个测试样本。
4. Boston Housing(UCI Machine Learning Repository)
该数据集包含波士顿地区的房屋价格和房屋属性信息,例如房龄、房间数量、犯罪率等等。目标是根据房屋属性预测房屋价格。该数据集包含506个样本。
以上是一些常见的数据集,它们包含了不同类型的数据,可以用于不同的机器学习任务。如果你需要更多的数据集,可以在Kaggle、UCI Machine Learning Repository等平台上进行搜索。