早期糖尿病风险预测数据集:体征与症状分析
版权申诉
125 浏览量
更新于2024-10-13
收藏 70KB ZIP 举报
资源摘要信息:"早期糖尿病风险预测数据集是一个专门用于预测和分析个体发展为糖尿病的风险的数据集。该数据集包含520个个体的体征和症状记录,这些记录被标记为正类(患有糖尿病)或负类(未患糖尿病)。数据集包含16个特征,旨在帮助研究人员或医疗专业人士通过分析患者的症状和体征,预测糖尿病的早期风险。
数据集中的特征包括:
1. 年龄(Age):记录了患者的年龄范围,从20岁到65岁。
2. 性别(Sex):记录了患者的性别,分为男性和女性。
3. 多尿(Polyuria):记录患者是否存在多尿的症状,分为是和否。
4. 多饮(Polydipsia):记录患者是否存在多饮的症状,分为是和否。
5. 突然体重下降(sudden weight loss):记录患者是否有突然的体重下降,分为是和否。
6. 乏力(weakness):记录患者是否有乏力的症状,分为是和否。
7. 多食(Polyphagia):记录患者是否存在多食的症状,分为是和否。
8. 阴道念珠菌病(Genital thrush):记录女性患者是否有阴道念珠菌病,分为是和否。
9. 视力模糊(visual blurring):记录患者是否存在视力模糊的症状,分为是和否。
10. 瘙痒(Itching):记录患者是否存在瘙痒的症状,分为是和否。
11. 易怒(Irritability):记录患者是否有易怒的症状,分为是和否。
12. 愈合迟缓(delayed healing):记录患者是否有伤口愈合迟缓的症状,分为是和否。
13. 部分瘫痪(partial paresis):记录患者是否有部分瘫痪的症状,分为是和否。
14. 肌肉僵硬(muscle stiness):记录患者是否有肌肉僵硬的症状,分为是和否。
15. 脱发(Alopecia):记录患者是否存在脱发的症状,分为是和否。
16. 肥胖(Obesity):记录患者是否肥胖,分为是和否。
最后一项特征为分类标签(Class),它标识患者是属于正类还是负类,其中1表示正类(患有糖尿病),2表示负类(未患糖尿病)。
该数据集的文件名称列表包含了以下几个文件:
- diabetes_data_upload.csv:这是一个CSV文件,用于存储数据集中的所有记录。
- code.ipynb:这是一个Jupyter Notebook文件,可能包含了用于分析该数据集的Python代码。
- 1. 数据集介绍.md:这是一个Markdown文件,里面应包含对数据集的详细介绍。
- README.md:这是一个Markdown文件,通常用于提供项目或数据集的基本使用说明和文档。
- image:这个文件夹可能包含了与数据集相关的图表、图片或其他视觉资料。
该数据集可以用于开发和测试机器学习模型,特别是分类算法,以预测个体是否可能患有糖尿病。通过分析这些特征与最终分类标签之间的关系,研究者可以识别哪些体征和症状与糖尿病风险相关性最高,并可能用于制定早期干预策略。"
2024-03-17 上传
2024-01-30 上传
2021-09-19 上传
2023-12-29 上传
2023-05-02 上传
2021-10-18 上传
2024-04-25 上传
2021-11-11 上传
2023-09-18 上传
Scikit-learn
- 粉丝: 4302
- 资源: 1868
最新资源
- 正整数数组验证库:确保值符合正整数规则
- 系统移植工具集:镜像、工具链及其他必备软件包
- 掌握JavaScript加密技术:客户端加密核心要点
- AWS环境下Java应用的构建与优化指南
- Grav插件动态调整上传图像大小提高性能
- InversifyJS示例应用:演示OOP与依赖注入
- Laravel与Workerman构建PHP WebSocket即时通讯解决方案
- 前端开发利器:SPRjs快速粘合JavaScript文件脚本
- Windows平台RNNoise演示及编译方法说明
- GitHub Action实现站点自动化部署到网格环境
- Delphi实现磁盘容量检测与柱状图展示
- 亲测可用的简易微信抽奖小程序源码分享
- 如何利用JD抢单助手提升秒杀成功率
- 快速部署WordPress:使用Docker和generator-docker-wordpress
- 探索多功能计算器:日志记录与数据转换能力
- WearableSensing: 使用Java连接Zephyr Bioharness数据到服务器