첫번째 모델 만들기

JH.SUNG·2021년 11월 30일

fastai 사전학습 전이학습 첫번째모델

인공지능(머신러닝)

목록 보기

5/13

fast.ai 첫 번째 모델 만들기

제일 간단하게 첫 모델을 만들어보려고 한다.
첫 모델은 고양이와 강아지를 분류하는 모델이다.

고양이,개 이미지 데이터셋 불러오기
사전 학습된 모델 불러오기
전이 학습을 통해서 모델을 미세 조정하기

모델 구성

from fastai.vision.all import *

path = untar_data(URLs.PETS)/'images'

def is_cat(x): return x[0].isupper()
dls = ImageDataLoaders.from_name_func(
    path, get_image_files(path), valid_pct=0.2, seed=42,
    label_func=is_cat, item_tfms=Resize(224))
    
learn = cnn_learner(dls, resnet34, metrics=error_rate)
learn.fine_tune(1)

첫번째 문장은 fastai의 다양한 영상 처리 모델을 생성하는데 필요한 함수와 클래스를 불러오는 구문이다.
2번째 문장은 fastai의 데이터셋 컬렉션에서 고양이,강아지 데이터셋을 불러오고(다운로드), 압축해제하고, 추출된 위치를 path 객체로 반환한다.

3번째 문장은 이미지데이터를 fastai 모델에 들어갈 수 있도록 데이터셋의 종류를 알려주고 구조를 설정해주는 코드이다.
is_cat 함수는 파일 첫번째 문자의 대소문자 여부를 통해서 레이블을 정해주는 함수이다.

DataLoader앞에 image,text와 같이 단어를 붙여서 데이터의 유형을 표현한다.

tfms는 transform(변형)의 약자로 두 종류가 있으며, item_tfms와 batch_tfms가 있다.
item_tfms는 개별 데이터 적용되는 변형이고, batch_tfms는 배치에 GPU가 빠르게 한 번에 처리할 변형이다.

224는 일반적인 픽셀 크기이고, 얼마든지 자유롭게 설정할 수 있다.

valid_pct=0.2는 데이터의 20%를 검증용으로 따로 사용하도록 설정하는 코드이다.
seed=42는 코드를 실행할 때마다 동일한 임의성으로 데이터셋을 구성하도록 시드값을 고정한 것이다.

마지막 줄 위의 코드는 이미지 분야에서 널리 쓰이는 CNN(합성공 신경망)모델을 생성한다. 이때 사용할 데이터셋과 모델의 종류 및 평가지표를 설정한다.

우리는 여기서 ResNet이라는 구조의 모델을 사용한다. 여러상황 특히나 이미지와 관련된 상황에서 빠르고 정확하게 작동하는 모델이다. 뒤에붙는 숫자는 계층의 숫자이며, resnet34는 34개의 계층이 있다는 뜻이다.
ResNet이라는 사전 학습된 모델을 사용하여 cnn_learner는 새로 추가된 데이터셋에 맞추어 마지막 부분의 계층(머리)을 업데이트 합니다.

이와 같은 사전 학습된 모델을 사용하는 일을 전이 학습이라고 한다.

마지막 문장은 사전학습된 모델인 resnet34에 아까 구성한 이미지 데이터셋 dls를 적용하여 fine_tune 메소드를 통해서 미세 조정을 한다.

모델 활용(이미지 예측)

학습된 모델을 통해서 새로 들어오는 이미지가 고양이인지 강아지인지 예측한다.

uploader = widgets.FileUpload()
uploader

업로드 위젯을 불러오고, 위젯을 클릭하여 이미지를 업로드

img = PILImage.create(uploader.data[0])
is_cat,_,probs = learn4.predict(img)
print(f"Is this a cat?: {is_cat}.")
print(f"Probability it's a cat: {probs[1].item():.6f}")

Is this a cat?: True.
Probability it's a cat: 0.988204