EDA이유
데이터 보기
트레인 및 테스트 Y축 보존
트레인 및 테스트 데이터 연결
훈련용 데이터: train.csv
최종 시험용 데이터: test.csv
train.csv + test.csv = data
Gender Submission
챌린지에서 주어진 승객들에게 순서대로 번호 준 것 : passenger ID , 승객 연번
Train파일에는 답이 있지만 Test파일에선 빈 값: Survived 생존 여부 0=NO, 1=YES
Pclass 선실등급 1=1st, 2=2nd, 3= 3rd
Sex = male Female
Age 나이: 여기에 빈 값이 많아서 어떻게 처리하는지 중요
Sibsp :형제 자매의 수/배우자 등이 승선한 경우의 수, 같이 탄 형제의 수 또는 배우자 또는 배우자+형제의 수
Parch 부모나 자식과 같이 탄 경우 수, 부모+아이의 가족 탑승자 수
Ticket 표 번호, 티켓에 주어진 표의 번호
Fare 요금, 티켓 가격의 금액
Cabin 선실 번호로 여기에도 빈 값이 많음
embarked 승선한 항구, C= Cherbourg, Q = Queenstown, S= Southampton