# .drop()

Pandas기초-9.문제풀이
목표: 타이타닉호 승객데이터를 기반으로 생존에 영향을 미치는 요인을 분석합니다. 주요 과제: 기본 EDA (Exploratory Data Analysis) 데이터 전처리 (불필요한 데이터 삭제, 추가, 변경) 인사이트 발굴 변수명: df >데이터는 총 몇개의 행과 열로 이루어졌는지 확인하라. > column별 데이터 확인 (dtype,갯수 등) > 컬럼별 결측치가 몇 개 있는지 확인하라. > 생존자와 사망자의 분포를 확인하라 'survived' = 0이면 사망 1이면 생존 분포확인 = 갯수 > 항구별 생존자 인원을 확인하라. 항구 컬럼 = embarked = C , Q , S 생존자인지 확인컬럼 = 'survived' > 항구별 생존자의 생존률을 구하라 기준컬럼: embarked 항구별 조건컬럼: survived 생존했는지 안했는지 생존률 : 평균 > 성별 생존률의 합계와 평균치를 동시에 출력하라. 
Pandas기초-6. 전처리,추가,삭제,데이터변환
변수['새컬럼명']=True > 새 컬럼 추가 넣기 > 기존데이터에 새컬럼이 추가되면서 모든 값은 True로 된다. 따로 변수에 추가저장하지 않아도, 바로 반영된다. row행 삭제 .drop(숫자) > 변수.drop(삭제되는 열) 변수.drop(1) 이면 1번째 인덱스 가로줄 row행이 보이지않음. 변경값이 저장되지 않는다. .drop([숫자,숫자,숫자,,]) >여러열 rows 안보이게 하고 싶은경우 
03. 캐글 설문조사 분석하기
캐글에서 실시한 설문조사 내용을 시각화해보고 간단히 분석해보려 한다. 박조은 님의 인프런 강좌를 기반으로 한 내용이다. " 캐글에선 해마다 설문조사가 올라옵니다. 세계적으로 어떤 기술들이 많이 쓰이는지 등 현황을 볼 수 있어 데이터사이언스 공부를 시작하는 사람들이 보면 도움이 됩니다." 캐글 소개 캐글은 전 세계 데이터 전문가들이 경쟁하는 플랫폼이다. : 다양한 경진대회. 상금, 상, 리크루팅 등의 보상 있음. : 다양한 데이터셋 제공. 코로나 데이터 인기 많았음. : 다른 사람들의 분석사례를 볼 수 있음. 'most votes'로

12. 데이터 수정
데이터를 다루다보면, 불필요한 데이터를 삭제하거나 새로운 데이터를 추가하는 등의 수정 작업이 필요할 때가 있다. 데이터 준비 (이전과 동일) Coulmn 수정 .replace() : 특정 데이터를 원하는 데이터로 바꿔줌. (딕셔너리 형태로 입력!) .str.lower() : 입력된 문자열을 소문자로 바꿔줌 (전에 했던 내용^^) .str.upper() : 입력된 문자열을 대문자로 바꿔줌 ![](https://velog.velcdn.com/images/s