대출 승인 데이터를 활용해서 어떤 요인이 대출 승인과 연관성이 높은지, 어떤 모델을 사용했을 때 대출 승인 정확도가 높은지 확인해보자.
대출과 관련된 요인들 중에서는 Gender, Self-employed, property, married, education, dependants 등이 있다.
사용하는 모델은 random forest, decision tree, SVM, KNN을 사용한다.
이를 통해 추후 대출을 신청하는 사람의 대출 승인 여부를 빠르고 정확하게 파악할 수 있다. 처리 속도를 높일 수 있다.
# 패키지 가져오기
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.ensemble import GradientBoostingClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.model_selection import cross_val_score
from sklearn.tree import DecisionTreeClassifier
from sklearn.neighbors import KNeighborsClassifier
from sklearn import svm
# warning 무시하기 코드 추가하기
import warnings
warnings.filterwarnings(action = 'ignore')
# CSV 데이터 읽기
data = pd.read_csv("[Dataset] Module 19 (Loan Prediction).csv")
#데이터 미리보기
#상위 5개 미리보기
data.head(5)