[인프런] 데이터 분석4

타키탸키·2022년 6월 21일
0

데이터 사이언스

목록 보기
25/26
  • apply()
    • 특정 컬럼값 변경할 때 사용 가능
    • 인자로 함수를 넘길 수 있다
    • ex:) df.apply(func, axis=0)
    • 데이터프레임의 열이 함수의 인자로 들어온다
    • axis 옵션
      • 0: 열
      • 1: 행
    • 첫번째 행과 열에 대해서는 두 번 호출(for 최적화)
    • 반환값으로 인자로 받았던 데이터프레임을 넘기면 값 수정이 가능하다

      어려운 부분이므로 강의 복습 꼭 할 것(pandas 라이브러리로 실제 데이터 전처리하기2)

  • split()
    • 인자는 구분자
    • 구분자에 따라 문자열을 나눠서 리스트로 반환한다
  • lstrip()
    • 인자의 문자가 나올때까지 왼쪽에서부터 제거
    • 오른쪽에서부터 제거하려면 rstrip()
  • replace()
    • 첫번째 인자는 대상 문자, 두번째 인자는 적용할 문자
  • groupby()
    • 인자는 중복될 컬럼명
    • 중복되는 컬럼을 하나의 값으로 묶는다
      • 평균, 합...
    • 반환된 데이터프레임에는 인자의 컬럼이 인덱스가 된다
  • 데이터 전처리
    • raw 데이터를 내가 원하는 형태로 가공하는 과정
  • listdir
    • OS 라이브러리
    • 인자로 받은 경로의 파일들을 리스트로 반환

  • keep_default_na=False
    • 결측치와 유사하지만 결측치가 아닌 값에 대한 처리
    • ex:) NA
    • na_values=''와 함께 사용하여 공백 값에 대해서만 결측치로 인정
  • 복합 조건
    • and: &
    • or: |
  • 컬럼 리스트 변수로 저장하기
    • .columns.tolist()
  • rename
    • df = df[컬럼 리스트 변수명]

  • numpy 랜덤 행렬 만들기
    • np.random.rand(행, 열)
    • 데이터 프레임에 적용
      • pd.DataFrame(np.random.rand(행,열), columns=['A','B'])```
  • google matrial palette
    • 여러 색상표 확인 가능
  • layout 변수들
    • plot_bgcolor
      • 그래프 배경색 변경
    • showticklabels:True
      • 축 제목 설정
    • dtick
      • 축 단위 설정


profile
There's Only One Thing To Do: Learn All We Can

0개의 댓글