오늘은 forge를 이용하여 분류를 공부해 보려고합니다.
input
import matplotlib.pyplot as plt
import mglearn
X,y=mglearn.datasets.make_forge() #분류용 랜덤 데이터셋
mglearn.discrete_scatter(X[:,0], X[:,1], y) #산점도
plt.legend(['class 0', 'class 1'],loc=4)
plt.show()
output
forge는 인위적으로 만들어진 분류 데이터 셋입니다.
mglearn의 make_forge()함수를 이용하여 X,y에 각각 데이터를 넣으면 됩니다.
mglearn에는 산점도를 그리는 scatter 대신 discrete_scatter를 사용합니다.
mglearn은 그래프나 데이터 적재 유틸리티 함수입니다.
input
from sklearn.linear_model import LogisticRegression
fig,axes=plt.subplots(1,1,figsize=(5,3)) # 1행 1열의 서브플롯
model=LogisticRegression() # 로지스틱 회귀분석 모형
model=model.fit(X,y) # 학습
mglearn.plots.plot_2d_separator(model, X, fill=True, eps=0.5, ax=axes, alpha=0.7) #구분면 표시
mglearn.discrete_scatter(X[:,0],X[:,1],y,ax=axes) #산점도
axes.legend()
output
학습을 시켜 직접 분류를 하게됩니다.
input
output
92.5943812832
두 가지 데이터를 잘못 측정하였기 때문에 92%의 정확도의 모델이 되었습니다.
오늘은 간단하게 forge에 대해서 알아 보았습니다. 또한 mglearn함수로 이미지로 시각화 하는 법에대해 알아 보았습니다.