멋사 ai 스쿨 TIL - (9)

eve·2022년 9월 26일
0

likeLion

목록 보기
9/45

1. unique value in pandas

출처: https://snepbnt.tistory.com/570
(1) distinct는 sql에서 select 시 출력되는 row들의 중복값을 제거한 나머지 값들을 출력한다.
(2) unique는 create table 시 사용되며, table 내 unique가 적용된 특정 컬럼의 중복값이 insert되지 않도록 설정하는 것이다. 설정 컬럼에서 중복값이 들어갈 경우 error message 등장.

2. Dendrogram

(1) 의미: 클러스터링 결과를 시각화
출처: https://blog.naver.com/breezehome50/222374389827

부족한 점

(1) 그래프 보는 법
pandas Profiling Report만 보아도 알 수 있듯이, 다양한 수치들을 출력할 수 있으므로 통계학 기초를 수강할 필요가 있음 - Coursera 참고

(2) 범주형 자료와 수치형 자료의 차이점 확인할 것!

  • ... 필기가 다 날라갔다
    05, 06 노트북 자료 참고해서 복습하자 ........

3. 수치변수

(1) KDE

  • col: subplot으로 나눈 값임
  • kde: False를 입력하면 그래프가 나오지 않음
  • hist: 빈도
  • KDE: 밀도 (=적분했을 때 1이 되는 값)

(2) scaling

  • df_num.head():
  • df_std = df.select)dtypes(include="number")
    (cf. include="object"에 따라 수치형 데이터/범주형 테이터 확인 가능)
  • df_num.head(1)

(3) violinplot
: 하얀색 점이 중간값임

-- 참고

profile
유저가 왜 그랬을까

0개의 댓글