[제로베이스 데이터 취업 스쿨]
1. 심장병 환자 데이터를 기반으로 한 심장병 예측(분류 모델)
- Kaggle
Heart Disease dataset
- 데이터 크기: 320K
- 성별, 나이, 인종, BMI, 흡연/음주/뇌졸중/보행장애 여부, 수면 시간,
physical health(1~30), mental health(1~30), physical activity(Y/N), general health(good/very good/excellent/fair/poor), 천식/신장질환/피부암/당뇨 여부,
심장병 여부(Y/N)
cardiovascular risk factor dataset
- 데이터 크기: 3,390개
- 성별, 나이, 교육수준, 흡연 여부 및 흡연량, 혈압약 복용 여부,
뇌졸중/고혈압/당뇨병이 있었는지, 총콜레스테롤, 혈압, BMI, 심박수, 혈당,
10년동안 관상동맥질환위험(1,0)
2. 운동 효과 예측(회귀 모델)
- Kaggle
Exercise and Fitness Metrics Dataset
- 데이터 크기: 3,864개
- 운동 종류(1~10), 칼로리 소모량, 목표 체중, 실제 체중, 나이, 성별, 운동 시간, 심박수, BMI, 날씨(cloudy, rainy, sunny), 운동 강도(1~10)
- 특성에 날씨가 있어서 주제를 바꿀 수 있다.
그 외에 관심 있는 주제
1) 치매 예측 모델(분류)
2) 병원 추천 시스템
- 응급실 뺑뺑이: 구급차로 호송된 환자를 받아주는 응급실을 찾지 못해 다른 병원을 찾아다니다가 치료 시간이 늦어지는 현상
- 원인: 전문의 또는 병상 부족, 비교적 증상이 가벼운 환자들이 응급 병상에 많은 것
3) 헬스장 추천 시스템
4) 병원 대기시간 예측(회귀)
5) mental health