데이터 얻기

  • 구글링 또는 공공데이터 활용(csv, xlsx 파일 활용)

데이터 읽기

  • 테이블 데이터는 대부분 pandas 모듈 활용
  • 데이터 불러오기 : 코드명 = pd.read_csv(경로)
  • 데이터 읽기 : 코드명.head(n(숫자)) 제일 첫 n줄(기본값 5)
    코드명.tail(n(숫자))
    제일 끝 n줄(기본값 5)
    *코드명은 파일명이 아닌 앞으로 호출할 변수명
  • 데이터 오류 시 : 경로 내에 추가 [,encoding="utf-8")]
  • 경로 앞 ..은 현재 폴더에서 상위 폴더로 이동하라는 명령어(소스코드 파일이 저장된 폴더 기준)
  • 컬럼명 읽기 : 파일명.columns -> 컬럼명이 리스트 형태로 출력 *columns 뒤에 index 추가 시([n]) 해당 컬럼명만 출력
  • 컬럼명 변경 : 파일명.rename(columns={파일명.columns[n] : "변경할컬럼명"})
    • 이후 변경 사항 저장 시 뒤에 [, inplace=True)] 추가
  • header 명령어 : read 명령문 의 경로명 뒤에 [, header=n)] 추가 시 n번째 인덱스부터 출력
  • usecols 명령어 : read 명령문 의 경로명 뒤에 [, usecols="컬럼명")] 추가 시 해당 컬럼만 출력
profile
개발도상인 냄비짱

0개의 댓글