【数据分享】糖尿病患者研究数据集

原文链接:http://tecdat.cn/?p=23848

原文出处:拓端数据部落公众号

数据简介

该数据集最初来自国家糖尿病/消化/肾脏疾病研究所。数据集的目标是基于数据集中包含的某些诊断测量来诊断性的预测 患者是否患有糖尿病。从较大的数据库中选择这些实例有几个约束条件。尤其是,这里的所有患者都是印第安至少21岁的女性。数据集由多个医学预测变量和一个目标变量组成Outcome。预测变量包括患者的怀孕次数、BMI、胰岛素水平、年龄等。(查看文末了解获取方式)

数据详情

数据格式

csv

字段

怀孕次数

葡萄糖 

血压 (mm Hg) 

皮层厚度 (mm) 
胰岛素 2小时血清胰岛素(mu U / ml
体重指数 (体重/身高)^2
糖尿病谱系功能 
年龄 (岁) 
类标变量 (0或1)

大小

23.3kb

样本量

768

数据浏览

以前5行数据为例,我们来预览一下:

图片

变量探索:

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

图片

数据获取

在下面公众号后台回复“糖尿病患者数据”,可获取完整数据。


点击标题查阅相关文章

图片

PYTHON用决策树分类预测糖尿病和可视化实例

左右滑动查看更多

01

图片

02

图片

03

图片

04

图片

点击标题查阅往期内容

Python决策树、随机森林、朴素贝叶斯、KNN(K-最近邻居)分类分析银行拉新活动挖掘潜在贷款客户

R语言逻辑回归(Logistic Regression)、回归决策树、随机森林信用卡违约分析信贷数据集

R语言对用电负荷时间序列数据进行K-medoids聚类建模和GAM回归

R语言进行支持向量机回归SVR和网格搜索超参数优化

R语言贝叶斯MCMC:GLM逻辑回归、Rstan线性回归、Metropolis Hastings与Gibbs采样算法实例

在R语言中实现Logistic逻辑回归

R语言逻辑回归、Naive Bayes贝叶斯、决策树、随机森林算法预测心脏病

R语言用Rcpp加速Metropolis-Hastings抽样估计贝叶斯逻辑回归模型的参数

R语言逻辑回归logistic模型分析泰坦尼克titanic数据集预测生还情况

R语言用lme4多层次(混合效应)广义线性模型(GLM),逻辑回归分析教育留级调查数据

R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析

R语言基于Bagging分类的逻辑回归(Logistic Regression)、决策树、森林分析心脏病患者

R语言逻辑回归(Logistic回归)模型分类预测病人冠心病风险

欲获取全文文件,请点击左下角“阅读原文”。

图片

▍关注我们 【大数据部落】第三方数据服务提供商,提供全面的统计分析与数据挖掘咨询服务,为客户定制个性化的数据解决方案与行业报告等。 ▍咨询链接:http://y0.cn/teradat ▍联系邮箱:3025393450@qq.com
原文地址:https://www.cnblogs.com/tecdat/p/15768355.html