머신러닝

YunGyu Choi·2023년 2월 10일
0

Data Science

목록 보기
8/10

머신러닝이란?

  • 명시적인 프로그래밍 없이 컴퓨터가 학습하는 능력을 갖추게하는 연구분야
  • 머신러닝은 데이터를 통해 다양한 패턴을 감지하고, 스스로 학습할 수 있는 모델 개발에 초점

머신러닝 분류

지도학습

  • 지도학습은 주어진 입력으로부터 출력 값을 예측하고자 할 때 사용
  • 입력과 정답 데이터를 사용해 모델을 학습 시킨 후 새로운 데이터에 대해 정확한 출력을 예측하도록 하는 것이 목표
  • 지도 학습 알고리즘의 학습 데이터를 만드는 것은 많은 사람들의 노력과 자원이 필요하지만 높은 성능을 기대할 수 있음

분류와 회귀

  • 지도학습 알고리즘은 크게 분류와 회귀로 구분
  • 분류는 입력 데이터를 미리 정의된 여러개의 클래스 중 하나로 예측하는 것
  • 분류는 클래스의 개수가 2개인 이진 분류와 3개 이상인 다중 분류로 나눌 수 있음
  • 회귀는 연속적인 숫자를 예측하는 것으로 어떤 사람의 나이, 농ㅈ악물의 수확량, 주식 가격 등 출력 값이 연속성을 갖는 다면 회귀 문제라고 할 수 있음

지도 학습 알고리즘

  • Linear Regression(Ridege, Lasso)
  • Logistic Regression
  • Support Vector Machine
  • k-Nearest Neighbors
  • Decision Tree

비지도학습

  • 비지도학습은 원하는 출력 없이 입력 데이터를 사용
  • 입력 데이터의 구조나 패턴을 찾는 것이 목표
  • 미리 정해진 결과가 없고, 방대한 양의 데이터에서 유용한 통찰력을 얻을 수 있음

클러스트링, 차원축소, 연관규칙

  • 클러스트링 : 공간상에서 서로 가깝고 유사한 데이터를 클러스트로 그룹화
  • 차원 축소 : 고차원의 데이터에 대해서 너무 많은 정보를 잃지 않으면서 데이터를 축소시키는 방법
  • 연관 규칙 : 데이터에 특성간의 연관성이 있는 흥미로운 규칙을 찾는 방법

비지도학습 알고리즘

  • 클러스트링(Cluerstirng)

    • k-Means
    • DBSCAN
    • 계층 군집 분석(Hierarchical Cluster Analysis)
    • 이상탐지(Outlier Detection), 특이값 감지(Novelty Detection)
  • 차원 축소(Dimensionality)

    • 주성분 분석(Principal Component Analysis)
    • 커널 PCA(Kernel PCA)
    • t-SNE(t-Distributed Stochastic Neighbor Embedding)
  • 연관 규칙(Association Rules)

    • Apriori
    • Eclat

강화학습(Reinforcement Learning)

  • 동적 환경과 함께 상호 작용하는 피드백 기반 학습 방법
  • 에이전트(Agent)가 환경을 관찰하고, 행동을 실행하고, 보상(reward) 또는 벌점(penality)을 받음
  • 에이전트는 이러한 피드백을 통해 자동으로 학습하고 성능을 향상시킴
  • 어떤 지도가 없이 일정한 목표를 수행
profile
velog에는 이론을 주로 정리하고, 코드와 관련된 것은 Git-hub로 관리하고 있어요. 포트폴리오는 링크된 Yun Lab 홈페이지를 참고해주시면 감사하겠습니다!

0개의 댓글