- Numpy = np
- Pandas
- Matplotlib
C언어로 개발된 파이썬에서 과학적 계산을 위한 핵심 라이브러리.
다차원 배열 객체와 배열과 함께 작동하는 도구 제공.
고수준 데이터 분석 제공 X.
- Arange()
- np.arange()
list 대신
1) (10)
(0,1,2,3,4,5,6,7,8,9)
2) (1,10)
시작, 끝나는지점
(1,2,3,4,5,6,7,8,9)
3) (1,10,2)
초기값, 끝나는 지점, 증가값
(1,3,5,7,9)
- ndarray
- arr.ndim (차원의 확인)
- arr.shape (데이터의 모양을 확인)
- arr.dtype (데이터 타입의 확인)
(Type, Description 표 참고)
1) int
2) float
3) astype
- 배열의 연산
- np.array
- add연산자
(0417_1_1:50:00)
np.loadtxt(fname = 'winequality-red.csv', delimiter=';', skiprows=1)
import : 모듈(module)을 가져오는 키워드.
모듈 : 변수, 함수, 클래스 등을 정의하고 있는 파이썬 파일을 의미. (import 키워드를 사용하여 해당 모듈가져오기.)
NumPy 라이브러리를 사용하기 위해서는 import numpy 라는 코드를 작성하여 NumPy 모듈을 가져오기.
(NumPy에서 제공하는 함수나 클래스를 사용 가능.)
python
Copy code
import module_name
위와 같이 import 키워드를 사용, module_name이라는 이름의 모듈.
이렇게 가져온 모듈을 사용하기 위해서는 module_name.function_name()과 같은 형식으로 함수나 클래스를 호출.
또는, 다음과 같이 as 키워드를 사용하여 모듈 이름을 축약어로 변경.
python
Copy code
import module_name as short_name
위와 같이 import 키워드와 함께 as 키워드를 사용하면, module_name이라는 이름의 모듈을 short_name이라는 축약어로 사용 이렇게 하면 코드를 더 간결하게 작성.
또는, 다음과 같이 from 키워드를 사용하여 특정 함수나 클래스만 .
python
Copy code
from module_name import function_name, class_name
위와 같이 from 키워드를 사용하면, module_name 모듈에서 function_name이나 class_name 등의 특정 함수나 클래스만. 이렇게 하면 모듈 전체를 가져오는 것보다 메모리 절약.
1) print(redwine)
2) 기초 통계함수
[데이터사이언스]
https://programmer-ririhan.tistory.com/203
0번 세로축으로 합계 (세로축으로 sum)
전체 데이터 출력
0번축의 평균값, 0번축의 데이터
std : 표준 편차 (데이터의 정확성을 알고 싶을때 사용)
var : 분산 (std의 제곱) 확대, zoom
min : 최소값 (0번축 최하점)
max : 최대값 (0번축 최고점)
- 엑셀
1) 시점, 행렬전환
2) CSV
3) 데이터 분석
파일 - 정보 - 옵션 - 추가 기능 - 분석 도구
- Pandas = pd
- import pandas
dataframe 구조
series객체
전체적인 표 : Dataframe
Numpy
1) Dataframe
4) 슬라이싱
숫자 바로앞
문자는 그 문자까지
- 데이터의 정렬
- ascending=T/F
* Anders Hejlsberg
Turbo pascal (Borland)
* Bill Gates
Visual Basic (MS)
- 상관 관계
- 핵심기능
- Group By