# Classfication

3개의 포스트
post-thumbnail

교차 검증과 그리드 서치

이전 글 이 전에 학습용 데이터셋을 기준으로 잘 맞게 학습시켜 만든 모델을 과대적합된 모델이라 하였다. 하지만 테스트용 데이터셋으로만 평가하면 결국 테스트용 데이터셋에 잘 맞는 모델이 만들어지는 것이 아닌가? 테스트용 데이터셋은 모델을 구현 후 마지막에 딱 한 번만 사용하는 것이 좋다. 그렇다면 max_depth를 이용한 하이퍼파라미터 튜닝은 어떻게 해야하는가? > 여기에서 하이퍼파라미터란(Hyper Parameter)? 모델 학습 과정에 반영되는 값, 학습 시작 전에 미리 조정 > 파라미터(Parameter): 모델 내부에서 결정되는 변수, 데이터로부터 학습 또는 예측되는 값 테스트용 데이터셋을 사용하지 않고,이를 측정하는 간단한 방법은 바로 학습용 데이터셋을 또 나누는 것이다. 이 데이터를 **검증

2023년 1월 3일
·
0개의 댓글
·
post-thumbnail

Machine Learning

Machine Learning 명시적인 programming 없이 컴퓨터가 학습하는 능력을 갖추게 하는 연구 분야 데이터를 통해 다양한 pattern을 감지하고 스스로 학습 가능한 model 개발에 초점 Supervised Learning 주어진 입력으로부터 출력값을 예측할 때 사용 입력과 정답 data를 통해 모델을 학습시킨 후 새로운 input data에 대해 정확한 출력을 예측하도록 하는 것이 목표 supervised learning algorithm의 학습 data를 만드는 것 자체가 많은 노력과 resources를 필요로 하지만, high performance 기대 가능 Classification & Regression supervised learning algorithm은 크게 classification과 regression으로 구분 classification은 입력 data를 미리 정의된 여러 개의 class 중 하나로

2021년 7월 13일
·
0개의 댓글
·
post-thumbnail

[Colab x PyTorch] 이미지 분류(Image Classification)

Colab met PyTorch Introduction Colab 과 PyTorch 를 이용하여 프로젝트를 진행 하려니 막히는 부분이 생긴다. 어떻게 나의 데이터셋을 Colab 상에서 Load 할 수 있을까? 실제로 딥 러닝을 프로젝트에 적용하기 위해서는 처리하고자 하는 데이터 혹은 데이터셋을 프로그램 상에서 Load 하고 처리 할 줄 아는 것이 중요하다. 그런데, 대부분의 예제들은 MNIST, CIFAR 10 과 같이 Library 단에서 자동으로 다운로드 해주고 Load 까지 해주는 데이터셋에 대한 학습과 처리 방법에 대해 소개한다. 본 포스트에서는 Colab 상에서 자신이 가진 데이터셋(이미지 인식)을 프로그램 상에서 Load 하고 그에 맞는 이미지 분류 모델을 학습시키는 방법을 소개한다.

2020년 3월 15일
·
7개의 댓글
·