멋사 ai스쿨 TIL - (6)

eve·2022년 9월 21일
0

likeLion

목록 보기
6/45

복습

as: alias
행-열 순서대로 0,1 (axix, shape 등의 적용기준)
inplace: axis 다음에 콤마 찍으면 물음표 도움말을 통해 설명 확인 가능.

1교시

(1) 기타 어휘
브로드캐스팅: 테이블 전체에 설정
프로파일링: 성능검증
모든 출력 지우기
method chaining: period를 붙여서 판다스 기능활용
(inplace는 적용되지 않음)

(2) loc

df.types

그냥 index는 키값 지정, RangeIndex는 숫자 키값 지정, loc으로는 오류
loc은 다음과 같이 사용한다.

df.set_index("약품명").loc["소화제"]

결과는 아래와 같다.

가격    3500
지역      서울
Name: 소화제, dtype: object

iloc는 순서대로 가져온다.
loc는 인덱스의 value값 그대로 데이터를 가져오고, iloc는 순서대로 얻는다.

iat와 at 기능은 판다스에서 없어질 예정이므로 딱히 외우지는 말자.

행, 열의 값으로 데이터 불러오기

df.loc[0,"약품명"]

결과는 "소화제"
아래와 같이 여러개를 불러오는 것도 가능하다.

df.loc[[0,1,2],"약품명"]

2교시

iloc의 칼럼명을 문자로 언급해주는 경우

#파이썬의 정규표현식에서는 |는 or를 &는 and를 의미합니다.
#여러 검색어로 검색을 한다 가정하고 | 로 검색어를 넣어준다고 생각하면 됩니다.
#str.contains 를 사용해서 약품명을 가져올 수 있습니다.

df[df["약품명"].str.contains("vita")]

3교시

na: not applicable/available

4교시

1. 원하는 값을 head등에서 불러오는 방법

df.head()
df.iloc[:n]
  • head = 처음 5개 행 불러옴
  • n 번째 줄 불러오기
  • self.iloc[:n]으로 불러올 수도 있음

2. 컬럼명은 어떤 자료형이라도 올 수 있음

  • 컬럼명은 큰따옴표로 감싸줘야 함

3. 상관계수에서 두 데이터값의 대칭 관계
= 자기 자신에 대한 상관계수는 다음과 같이 나타남

4. groupby
(1) 변수에 넣고 사용 가능
(2) 괄호 사용에 유의
(3) 상관계수 구하기

df.groupby("dataset").corr()

(4) seaborn으로 countplot과 barplot 사용하기

sns.barplot을 사용해보자

sns.barplot(data=df, x="dataset", y="x")

  • ci: 통계의 신뢰구간
  • ci는 제대로 된 값을 구하는 데 시간이 걸리므로, 빼고 계산하기도 함
sns.barplot(data=df, x="dataset", y="y", ci=None)

seaborn barplot에서는 이런 식으로 사용!

  • np.sum : 합계를 의미
  • 아래의 다이아몬드 표시는 '이상치(outlier)'를 의미

6교시

1. 여러가지 그래프들
(1) 참말로 신기하게 생긴 바이올린플롯

sns.violinplot(data=df, x="dataset", y="y")

또는 아래와 같이 바꾸는 것도 가능함

sns.violinplot(data=df, y="dataset", x="y", orient="h")

(2) 히스토그램

df.hist(bins=10)

(3) displot

sns.displot(data=df, x="y", hue="dataset", kde=True, col="dataset")

(4) kde

  • 히스토그램에 대한 밀도를 출력함
  • document 꼭 참고할 것

(5) col

  • 서브플롯을 작성하는데 쓰인다

(6) 그래프 유형 비교

  • 바이올린 플롯에 비해서 박스플롯은 밀도 추정값의 추이가 robust!

-- 퀴즈 및 오답노트 --

  • 콜론 슬라이싱 대한 이해도 부족
  • 제발 부수적인 건 넘어가 큰 틀부터 보자
  • 카글 뜯어보기+기초문법 반복학습 필요
  • 관측값 - 평균 = 편차
  • join 함수 사용법
' '.join(gu_list)
profile
유저가 왜 그랬을까

0개의 댓글