ValueError: Unknown label type: 'continuous'

우주먼지·2020년 8월 5일

from sklearn.tree import DecisionTreeClassifier
feature_names = ['pclass', 'sex', 'fare', 'Embarked_C', 'Embarked_Q', 'Embarked_S']
label_name = 'survived'
X = titanic_data[feature_names]
y = titanic_data[label_name]

model = DecisionTreeClassifier(max_depth=3, random_state=13)
model.fit(X_train, y_train)

결정트리를 만들기 위해 타이타닉 데이터를 이용하여 모델을 학습시키는데

위의 사진과 같은 에러가 발생했다.

검색결과 타입의 문제라는 결론이 생겼다.

현재 사진과 같이 y 데이터의 타입은 float로 되어있는데, 이진분류를 위한 0과 1의 값은 int형이어야한다는 것이다...

feature_names = ['pclass', 'sex', 'fare', 'Embarked_C', 'Embarked_Q', 'Embarked_S']
label_name = 'survived'
X = titanic_data[feature_names]
titanic_data = titanic_data.astype({'survived': 'int'})
y = titanic_data[label_name]