유넷 정리

행동하는 개발자·2023년 1월 30일
1

segmentation

목록 보기
1/1

유넷 요약

  1. Convolution Encoder(Contracting Path) + Convolution Decoder(Expanding Path)

  2. Expanding Path에서 Upsampling 할때, 좀 더 정확한 Localization을 하기 위해서 Contracting Path Feature를 Copy and Crop 하여 Concat하는 구조

  3. Data Augmentation

유넷 원리

많은 수의 Feature Channels를 사용하는데, DownSampling시에는 64->1024채널까지 증가되고, UpSampling시에는 1024->64채널을 사용한다. fully connected layers를 전혀 사용하지 않고 각 layer에서 convolution만 사용한다.

Segmentation시 overlab-tile 전략을 사용하는데, 전자 현미경 데이터의 특성상 이미지 사이즈의 크기가 상당히 크기 때문에 Patch 단위로 잘라서 Input으로 사용한다.

경계 부분에 정보가 없는 빈 부분을 0으로 채우거나, 주변의 값들로 채우는게 아니라 Mirroring 방법으로 pixel의 값을 채워주는 것이다. 즉 파랑색 안의 노랑색부분을 복사해서 파랑색 나머지 부분을 채운다.

유넷 학습

학습 시에 배치 사이즈를 크게하여 학습시키는 게 아닌 input tile의 size를 크게 주는 방법을 사용한다. 배치 사이즈가 작기 때문에 momentum의 값을 0.99로 주어 과거의 값들을 더 많이 반영하게 하여 학습이 더 잘되도록 했다.

출처: https://medium.com/@eunsook/u-net-%EB%85%BC%EB%AC%B8-b84e17d6378e

profile
끊임없이 뭔가를 남기는 사람

0개의 댓글