멋쟁이 사자처럼 AI 스쿨 TIL-11

김영민·2022년 10월 5일
0

merge : 키 값을 기준으로 합쳐줌
도움말 : (shift+tab+tab)

기간 수익률 비교하기
가격마다 스케일이 다르기 때문에 데이터프레임 기준 첫날을 0으로 맞추고 상대적으로 상승했는지 하락했는지에 대한 값을 구합니다.
다른 스케일 값의 상승/하락 비율을 비교해 볼 수 있도록 합니다.
다른 스케일의 값을 조정할 때 표준화 혹은 정규화 방법을 사용하기도 합니다.
표준화(standardization) :
데이터가 평균으로 부터 얼마나 떨어져 있는지 나타내는 값으로 변환
(Z-score 표준화) : (측정값 - 평균) / 표준편차
정규화(normalization) :
데이터의 상대적 크기에 대한 영향을 줄이기 위해 0~1로 변환
(측정값 - 최소값) / (최대값 – 최소값)

cut : 같은 길이로 나누기 ex) 절대평가 -> 히스토그램
qcut :같은 개수로 나누기 ex) 상대평가

시각화 할 때 데이터가 많으면 오래 걸리는데 속도를 개선해 보는 방법?
-> 대표값을 표시해야 한다면 그래프에서 계산하지 않고 미리 계산해서 시각화 하기

정순으로 출력 .sort()
역순으로 출력 .sort(reverse=True)
리스트에서 중복제거 -> list(set(a)) . set() 활용

컨브리헨션
[ 리스트에 들어갈 값 for문 조건문]

with open[file, mode=] as f:
f.~
자동으로 닫아줌

연산을 하는 장치
-> CPU : 병렬 x
-> GPU : 병렬 o

enumerate : 인덱스 값이랑 같이 나옴

pandas는 반복문을 잘 사용하지 않기 때문에 map을 이용

lambda 반환값 : 처리된 값
ex) df[“A”].map(lambda x: x+10)

profile
배운걸 다 흡수하는 제로민

0개의 댓글