[ML] 프로젝트 주제 선정

YJ·2023년 6월 4일

machine learning 팀스터디 프로젝트

[제로베이스 데이터 취업 스쿨]

1. 심장병 환자 데이터를 기반으로 한 심장병 예측(분류 모델)

Kaggle
Heart Disease dataset
- 데이터 크기: 320K
- 성별, 나이, 인종, BMI, 흡연/음주/뇌졸중/보행장애 여부, 수면 시간,
physical health(1~30), mental health(1~30), physical activity(Y/N), general health(good/very good/excellent/fair/poor), 천식/신장질환/피부암/당뇨 여부,
심장병 여부(Y/N)
cardiovascular risk factor dataset
- 데이터 크기: 3,390개
- 성별, 나이, 교육수준, 흡연 여부 및 흡연량, 혈압약 복용 여부,
뇌졸중/고혈압/당뇨병이 있었는지, 총콜레스테롤, 혈압, BMI, 심박수, 혈당,
10년동안 관상동맥질환위험(1,0)

2. 운동 효과 예측(회귀 모델)

Kaggle
Exercise and Fitness Metrics Dataset
- 데이터 크기: 3,864개
- 운동 종류(1~10), 칼로리 소모량, 목표 체중, 실제 체중, 나이, 성별, 운동 시간, 심박수, BMI, 날씨(cloudy, rainy, sunny), 운동 강도(1~10)
- 특성에 날씨가 있어서 주제를 바꿀 수 있다.

그 외에 관심 있는 주제

1) 치매 예측 모델(분류)

Kaggle
Dementia Prediction Dataset
AI Hub
치매 고위험군 웨어러블 라이프로그

2) 병원 추천 시스템

응급실 뺑뺑이: 구급차로 호송된 환자를 받아주는 응급실을 찾지 못해 다른 병원을 찾아다니다가 치료 시간이 늦어지는 현상
원인: 전문의 또는 병상 부족, 비교적 증상이 가벼운 환자들이 응급 병상에 많은 것

3) 헬스장 추천 시스템

4) 병원 대기시간 예측(회귀)

5) mental health

이전 포스트

EDA 테스트_5

다음 포스트

Numpy.reshape

0개의 댓글