[논문리뷰 | CV ] U-Net : Convolutional Networks for Biomedical Image Segmentation(2015) Summary

9e0na·2024년 3월 25일
0

[논문리뷰]

목록 보기
37/42
post-thumbnail

Title

  • U-Net : Convolutional Networks for Biomedical Image Segmentation


1. Introduction

1.1. 논문이 다루는 Task

  • 생물의학적 이미지의 Segmentation Task
  • 세포, 장기, 기타 해부학적 구조체 등의 이미지를 정밀하게 분리하는 작업을 포함

1.2. 기존 연구 한계점

  • sliding window 방식을 사용하면 patch별로 네트워크를 별도로 실행해야하고 patch의 중복으로 인한 중복성이 많기 때문에 속도가 느림.
  • localization accuracy와 context 사이의 trade-off가 존재 : patch가 크면 context 정보를 더 많이 활용할 수 있지만 localization accuracy는 감소, patch가 작으면 localization accuracy는 증가하지만 context를 거의 볼 수 없음.

2. Architecture

  • UNET은 3부분으로 나누어 볼 수 있음.
  • 일반적으로 Semantic Segmentation 모델들은 Down-sampling을 통해 크기가 줄어들었다가 다시 Up-sampling을 통해 크기가 늘어나는 구조를 취하는데, U-Net 논문에서는 이를 각각 Contracting Path, Expanding Path라고 부름.
  1. Contracting Path: 점진적으로 넓은 범위의 이미지 픽셀을 보며 의미정보(Context Information)을 추출

  2. Bottle Neck: 수축 경로에서 확장 경로로 전환되는 전환 구간

  3. Expanding Path: 의미정보를 픽셀 위치정보와 결합(Localization)하여 각 픽셀마다 어떤 객체에 속하는지를 구분


3. 제안 방법론

3.1. Main Idea

  • 첫번째, 인코더(Contract path)의 feature map을 디코더 feature map에 Concat하여 위치 정보전달
  • 두번째, 데이터셋의 전처리, 변형(deformation)을 이용하여 데이터 수 증가
  • 세번째, 테두리(border line)를 더 잘 분할하기 위해 Weight를 추가한 손실함수(Loss function)

3.2. Contribution

  • Encoder가 확장함에 따라 채널 수를 1024까지 증폭
    -> 이때 좀 더 고차원에서 정보를 매핑
  • 각기 다른 계층의 Encoder 출력을 Decoder와 결합하고 이전 레이어의 정보를 효율적으로 활용

4. 실험 및 결과

4.1. Dataset

  • Dataset: Transmitted light microscopy images (Phase contrast and DIC)
  • Transmitted light microscopy images: 투과 광선 현미경 검사
  • Phase contrast: 위상차 현미경
  • DIC (Differential interference contrast microscope) = 차등간섭대비 현미경

4.2. Baseline


4.3. 결과

  • Unet architecture는 biomedical segmentation application에서 매우 우수한 성능을 달성
  • FCN을 확장시켜 context 정보와 local 정보를 충분히 활용할 수 있는 U모양의 architecture를 제안
  • Elastic distortion으로 Data Augmentation을 했기 대문에 적은 dataset에서도 훈련 가능

📚 References

profile
디지털 마케터가 되기 위해 [a-zA-Z]까지 정리하는 거나입니다 😊

0개의 댓글