youliangyu Blog

HeartDisease Risk Prediction System简要说明

Word count: 458Reading time: 1 min
2019/07/18 Share

本项目测试并筛选了UCI心脏病数据集上的数据给出的的各个属性,预测这些属性诱发心脏病的概率。我的目标是从用户提供的数据来预测是否会以最大的准确度对心脏病预测以及进行治疗的可能性,并找出哪些属性对诱发心脏病的影响最大。

该数据集包含4个关于心脏病诊断的数据库。所有属性都是数字值。数据由UCI提供,来自以下四个地点:

  • 克利夫兰诊所基金会
  • 布达佩斯匈牙利心脏病研究所
  • VA医疗中心,长滩,加利福尼亚州
  • 瑞士苏黎世大学医院

属性信息:

1.age:年龄

2.sex:(1 =男性; 0 =女性)

3.cp:胸痛型

  • Value1:典型心绞痛
  • Value2:非典型心绞痛
  • Value3:非心绞痛
  • Value4:无症状
4.trestbps:静息血压

5.HOLC:cholestoral

6.fbs :(空腹血糖> 120 mg / dl)(1 =真; 0 =假)

7.restecg

  • Value0:正常
  • Value1:具有ST-T波异常
  • Value2:显示可能或确定的左心室肥大

8.thalach:达到最大心率

9.exang:运动诱发心绞痛(1 =是; 0 =否)

10.oldpeak:运动引起的ST抑郁相对于休息

11.slope:峰值运动ST段的斜率

  • Value1:uploping
  • Value2:持平
  • Value3:下滑

12.ca:由蓬松染色的主要容器(0-3)的数量

13.thal

  • 3 =正常
  • 6 =固定缺陷
  • 7 =可逆缺陷

14.category:心脏病的诊断[0-4](预测属性)
这里1-4表示诊断为True,0表示没有心脏病

基于ExtraTreeClassifier的属性重要性

依赖库

  • Flask Server
  • Keras
  • Pandas
  • Numpy
  • Sklearn

Testing and Training

使用2层神经N / W我们得到准确度:96%和精度:93%

前端与结果

欠缺

数据量少;

算法较弱;

功能太少;

CATALOG
  1. 1. 属性信息:
  2. 2. 基于ExtraTreeClassifier的属性重要性
  3. 3. 依赖库
  4. 4. Testing and Training
  5. 5. 前端与结果
  6. 6. 欠缺