Python library 1일차

정준호·2022년 4월 22일
0

PythonLibrary

목록 보기
1/4

Big Data분석

기존 데이터베이스 관리도구의 능력을 넘어서

가치를 추출

결과를 분석

Data science

Skillset

Data Science Process

1.데이터수집 - web Crawling(웹상에서 돌아다니는 정보를 수집하는행위)

2.데이터전처리 - 분석전단계 (정제,정리)

결측치(빈공간보다 데이터가많다면 예시로 평균값을 넣거나 데이터보다 빈공간이많다면 빈공간으로 만듦)

전처리의 중요성

3.데이터분석

4.데이터예측

5.데이터시각화/서비스화

단계별 python 패키지

모듈(라이브러리)

  • NumPy : 고성능 과학계산을 위한 데이터 분석 라이브러리
  • Pandas : 행과 열로 구성된 표 형식의 데이터를 지원하는 라이브러리
  • Matplotlib : 2D그래프로 시각화가 가능한 라이브러리

NumPy의 주요기능

numpy basic



Array Operation

문제

풀이

boolean 색인 - True에 해당하는 값만 가져온다(요소갯수동일해야함)

profile
파이팅

0개의 댓글