[boostcourse] 머신러닝을 위한 파이썬 - 2주차

김민수·2023년 9월 25일
0

boostcourse

목록 보기
2/8
post-thumbnail

📌 머신러닝을 위한 파이썬 - 2주차

1. Numpy

1) 개념

  • Numerical Python
  • 파이썬의 고성능 과학 계산용 패키지
  • Matrix와 Vector와 같은 Array 연산의 사실상의 표준

2) 특징

  • 일반 List에 비해 빠르고, 메모리 효율적임
  • 반복문 없이 데이터 배열에 대한 처리를 지원함 - 선형대수와 관련된 다양한 기능을 제공함

3) 활용

  • Array Shape

    • shape
    • ndim
    • size
  • Array dtype

    • dtype: Ndarray의 single element가 가지는 data type
  • Handling Shape

    • reshape

    • flatten

  • Indexing & Slicing

    • indexing
    • scling
  • Creation Function

    • arange
    • ones
    • zeros
    • empty
    • identity
    • random sampling
  • Array Operations

    • Dot product
    • transpose: 이전 shape의 행과 열을 반대로 변환
    • broadcasting: shape이 다른 배열 간 연산을 지원하는 기능
  • Comparisons

    • Any & All: Numpy는 배열의 크기가 동일 할 때 element간 비교의 결과를 Boolean type으로 반환하여 돌려줌
    • np.where: 조건에 맞는 값의 index 반환
    • argmax & argmin: array내 최대값 또는 최소값의 index를 반환함

2. Pandas

3. Matplotlib

4. Data Cleansing

0개의 댓글