BD 의 함수 정의(ing...)

장민식·2021년 12월 10일
0

파일을 chipo객체를 생성했다는 가정하에..

chipo.head()

  • 위쪽부터 head(갯수) 를 위쪽부터 차례로 출력

chipo.shape

  • chipo의 전체 행과열을 출력

chipo.index

  • 첫값,끝값,증가값 을 가진 chipo객체의 전체 길이

chipo.tail()

  • head와 반대로 끝에서 부터 차례로 출력

chipo.columns

  • columns은 시리즈(인덱스값)을 갖고있는 객체이다
  • columns에 대한 출력은 열의 형태로 나온다.

chipo.describe()

  • describe()는 수치상 계산가능한 부분만을 도표로 표시해준다.
  • 예를들어
    count 4622.000000 4622.000000 -개수
    mean 1.075725 7.464336 -평균
    std 0.410186 4.245557 -표준 편차
    min 1.000000 1.090000 -최솟값
    25% 1.000000 3.390000 -25/100
    50% 1.000000 8.750000 -50/100
    75% 1.000000 9.250000 -75/100
    max 15.000000 4 -최댓값

unique()

  • 값에 대한 고유의 수 즉, 칼럼에 있는 빈 배열은 출력되지 않는다

value_counts()

  • 벨류 값의 counts()의 개수 만큼 나타냄.
  • 주의점:시리즈 객체에만 적용 가능한 함수.

for idx,(val,cnt) in enumerate(item_count.iteritems(),1)

  • idx=인덱스 enumerate(),1중 1에 해당하는 목록을 만들기위한 인덱스
  • iteritems()는 키,벨류값을 튜플 형태로 나타내줌)
  • enumerate란 (시작~끝값)을 몇 번째 반복문인지 순서를 확인하는 것

상관관계 메소드

상관관계:피어슨:pearson,스피어먼:spearman

  • 단순 상관 분석[2개]:파일[[구할 컬럼 x,y]].정의한함수(method='pearson')
  • 다중 상관 분석(전체출력)[3개이상] corr: drinks.corr(method='pearson')<<드링크스 파일.corr(메서드=피어슨)

seaborn라이브러리 사용

  • pip install seaborn 설치(주피터내 코드입력란에 !을 앞에 붙히면 임시로 설치가능)
  • bar와 사각형을 이용하여 색깔별로 수치 표현하기
  • 예)

  • 점으로 수치를 나타내기.
  • 예)

style:darkgrid,whitegrid,dark,white,ticks: 이미지의 전반적인 모임을 스타일링 5가지 스타일 지원
context:notebook,paper,talk,poster:어떤 상황에서 보여줄 것인가에 따라 4종류의 텍스트 스케일 사용

profile
피나게노력중

0개의 댓글