내일배움캠프 6주차 Weekly I Learned

정형빈·2022년 10월 11일
0

WIL

목록 보기
6/15

내일배움캠프 6주차 회고

6주차 시간표

이번 주는 공휴일이 끼어있어서 월요일은 쉬었고 다음주도 월요일은 쉬다보니 아무래도 들뜬 기분에 집중이 좀 덜되는듯한 기분이 들기도 하는 한 주 였다.

장고 인스타그램 클론코딩 프로젝트

A-5 삘이 오조 팀 프로젝트 S.A. 링크

A-5 삘이 오조팀 팀 프로젝트 GitHub주소

A-5 삘이 오조 팀 프로젝트 시연영상

A-5 삘이 오조 팀 프로젝트 KPT회고 링크

프로젝트 매니지먼트 세션 특강

- 최양임 매니저님

프로젝트 매니지먼트 세션 노션링크

실전 머신러닝 적용 원격강의

1주차 내용 요약

  • 머신러닝이란?

    • 직역하면 기계를 가르친다라는 뜻으로 컴퓨터 프로그램이 알고리즘을 사용하여 데이터에서 패턴을 찾는 인공 지능 애플리케이션을 의미한다.
  • 머신러닝에서 문제를 풀 때, 해답을 내는 방법을 크게 회귀 또는 분류로 나눌 수 있다.

    • 회귀 : 출력값이 연속적인 소수점으로 예측하게 하도록 푸는 방법
    • 분류 : 분류 모델은 레이블이 달린 학습 데이터로 학습한 후에 새로 입력된 데이터가 학습했던 어느 그룹에 속하는 지를 찾아내는 방법
  • 머신러닝은 크게 세 가지로 나눌 수 있다. 지도/비지도/강화 학습이다.

    • 지도 학습(Supervised learning): 정답을 알려주면서 학습시키는 방법
    • 비지도 학습 (Unsupervised learning): 정답을 알려주지 않고 군집화(Clustering)하는 방법
    • 강화 학습(Reinforcement learning): 주어진 데이터없이 실행과 오류를 반복하면서 학습하는 방법 (알파고를 탄생시킨 머신러닝 방법!!)
  • 선형회귀 : 데이터를 놓고 그걸 가장 잘 설명할 수 있는 선을 찾는 분석하는 방법을 선형 회귀(Linear Regression) 분석이라 부른다.

  • 경사 하강법 : 일단 파라미터를 임의로 정한 다음에 조금씩 변화시켜가며 손실을 점점 줄여가는 방법으로 최적의 파라미터를 찾아가는 방법

  • 데이터셋 분할

      1. Training set (학습 데이터셋, 트레이닝셋) = 교과서

      머신러닝 모델을 학습시키는 용도로 사용하고 전체 데이터셋의 약 80% 정도를 차지한다.

      1. Validation set (검증 데이터셋, 밸리데이션셋) = 모의고사

      머신러닝 모델의 성능을 검증하고 튜닝하는 지표의 용도로 사용한다. 이 데이터는 정답 라벨이 있고, 학습 단계에서 사용하기는 하지만, 모델에게 데이터를 직접 보여주지는 않으므로 모델의 성능에 영향을 미치지는 않는다. 손실 함수, Optimizer 등을 바꾸면서 모델을 검증하는 용도로 사용하며 전체 데이터셋의 약 20% 정도를 차지한다.

      1. Test set (평가 데이터셋, 테스트셋) = 수능

      정답 라벨이 없는 실제 환경에서의 평가 데이터셋이다. 검증 데이터셋으로 평가된 모델이 아무리 정확도가 높더라도 사용자가 사용하는 제품에서 제대로 동작하지 않는다면 소용이 없기 때문에 중요하다.

이번 주를 마치며

이번 주차는 장고 인스타그램 클론코딩 프로젝트를 마무리 짓고 발표 후 프로젝트 회고, 그리고 새로운 원격 강의에 들어가는 주차였다.
프로젝트의 경우 아직은 부족한 점을 너무 많이 느끼게 된 것 같다. 하지만 그만큼 뭔가를 해냈을 때의 성취감도 많이 느낄 수 있어서 복합적으로 좋은 경험을 가졌던 것 같다. 정말 바쁘고 힘들었지만 재미있었기 때문에 다음 프로젝트도 기대가 되기 시작했다.

profile
스파르타 내일배움캠프 3기 수강생 정형빈

0개의 댓글