python
외부 라이브러리 설치 series형태의 데이터 생성pd.Series()DataFrame 형태의 데이터 생성DataFrame의 value,index,column의 값을 출력딕셔너리 형태의 데이터를 데이터 프레임의 형태로 변경상단의 행을 기준으로 출력을 하는 head(n)
np에 있는 array형태의 데이터구조를 만든다.array의 행의 수와 크기를 출력0 행렬 -> zeros(크기)1로 채워진 행렬 -> ones(크기)full(크기, 채워줄 숫자) -> 0,1이 아닌 원하는 숫자로 채워서 행렬을 만들때 사용단위행렬 만드는 함수 -> e
데이터의 시각화를 위한 라이브러리 plot 그래프 -> 라인 그래프 생성 도화지에 그려질 x,y축의 수치를 지정 이 도화지 안에 plot을 그려준다. /;'.lk
클래스 선언 후선언한 클래스 생성클래스 생성시 init을 사용하여 self 인자 값을 생성class_2 클래스에 인자 값 부여class 내부 함수 생성self 인자 값은 초기 class 생성시 정해진 값을 통하여 함수 생성 가능list.append() - 리스트안에 값
pandas 와 numpy를 이용하여 간단한 전처리를 실시series형태의 데이터를 딕셔너리로 합쳐df으로 만들어줌외부 csv 파일을 통하여 전처리를 실시Order Date 컬럼의 데이터형태를 시계열 데이터로 변경
단순한 행, 열 결합특정한 조건에 따라서 열을 추가하는 경우데이터프레임을 결합하는 함수매개변수 axis -> 행을 추가를 할지 열을 추가 할지 지정 단순한 결합매개변수 ignore_index -> 기본값이 false, 인덱스의 값을 그대로 유지할지 지정데이터프레임을 결
drinks.csv 파일 로드 'beer_serving', 'sprit_serving', 'wine_serving', 'total_litres_of_pure_alcohol' 컬럼 데이터 간의 상관관계 출력행렬 히트맵 시각화국가별 술 소비량 대비 알콜 비율 컬럼 추가국가
컬럼의 이름을 변경 -> "총 금액","팁","성별","흡연 여부","요일","시간","인원"총 금액, 팁 소수점 첫째 자리는 유지하고 나머지 값은 반올림하여 올려준다.식사 인원, 성별 팁의 비율의 평균의 값을 구하고 시각화(bar)
그룹화 행 인덱스열 인덱스데이터의 값데이터의 집계 (ex/ min max mean sum)
사용하는 라이브러리 matplotlip라인 , 바, 산점도, 히스토그램 그래프 시각화그 외의 그래프가 여러 종류가 존재subplot()한 영역에 여러개의 그래프를 그려주기위한 함수subplot(행의개수, 열의개수 ,위치)그래프를 그릴 때 주의 할 점y축의 값만 입력하는