as: alias
행-열 순서대로 0,1 (axix, shape 등의 적용기준)
inplace: axis 다음에 콤마 찍으면 물음표 도움말을 통해 설명 확인 가능.
(1) 기타 어휘
브로드캐스팅: 테이블 전체에 설정
프로파일링: 성능검증
모든 출력 지우기
method chaining: period를 붙여서 판다스 기능활용
(inplace는 적용되지 않음)
(2) loc
df.types
그냥 index는 키값 지정, RangeIndex는 숫자 키값 지정, loc으로는 오류
loc은 다음과 같이 사용한다.
df.set_index("약품명").loc["소화제"]
결과는 아래와 같다.
가격 3500
지역 서울
Name: 소화제, dtype: object
iloc는 순서대로 가져온다.
loc는 인덱스의 value값 그대로 데이터를 가져오고, iloc는 순서대로 얻는다.
iat와 at 기능은 판다스에서 없어질 예정이므로 딱히 외우지는 말자.
행, 열의 값으로 데이터 불러오기
df.loc[0,"약품명"]
결과는 "소화제"
아래와 같이 여러개를 불러오는 것도 가능하다.
df.loc[[0,1,2],"약품명"]
#파이썬의 정규표현식에서는 |는 or를 &는 and를 의미합니다.
#여러 검색어로 검색을 한다 가정하고 | 로 검색어를 넣어준다고 생각하면 됩니다.
#str.contains 를 사용해서 약품명을 가져올 수 있습니다.
df[df["약품명"].str.contains("vita")]
na: not applicable/available
1. 원하는 값을 head등에서 불러오는 방법
df.head()
df.iloc[:n]
2. 컬럼명은 어떤 자료형이라도 올 수 있음
3. 상관계수에서 두 데이터값의 대칭 관계
= 자기 자신에 대한 상관계수는 다음과 같이 나타남
4. groupby
(1) 변수에 넣고 사용 가능
(2) 괄호 사용에 유의
(3) 상관계수 구하기
df.groupby("dataset").corr()
(4) seaborn으로 countplot과 barplot 사용하기
sns.barplot을 사용해보자
sns.barplot(data=df, x=fi"dataset", y="x")
sns.barplot(data=df, x="dataset", y="y", ci=None)
seaborn barplot에서는 이런 식으로 사용!
1. 여러가지 그래프들
(1) 참말로 신기하게 생긴 바이올린플롯
sns.violinplot(data=df, x="dataset", y="y")
또는 아래와 같이 바꾸는 것도 가능함
sns.violinplot(data=df, y="dataset", x="y", orient="h")
(2) 히스토그램
df.hist(bins=10)
(3) displot
sns.displot(data=df, x="y", hue="dataset", kde=True, col="dataset")
(4) kde
(5) col
(6) 그래프 유형 비교
-- 퀴즈 및 오답노트 --
' '.join(gu_list)