[논문리뷰] UNet++: A Nested U-Net Architecturre for Medical Image Segmentation

반디·2023년 9월 6일

CV

목록 보기

2/2

UNet 구조보다 좀 더 nested된 형태의 구조를 제안 $\rightarrow$ 인코더와 디코더 특성 맵의 semantic gap을 줄이기 위해 고안

다음 가정을 기반으로 더 높은 정확도를 가지는 semantic segmantation 모델을 구성하고자 함
- 가정: 고해상도의 encoder network의 특성 맵이 decoder network에서 특성 맵과 합쳐지기 전에, 풍부한 표현을 가질 수 있도록 구성 $\rightarrow$ decoder network와 encoder network의 semantic gap을 줄임으로써 학습을 더 용이하게 할 수 있음 $\rightarrow$ 디테일들을 더 잘 포착할 수 있도록 유도

UNet 구조와 비교하여 다른 점
- (초록색) convolutional layers on skip pathway
- (파란색) dense skip connection
  $\rightarrow$ down-sample 결과를 다시 up-sample한 결과를 붙임으로써 decoder network와 encoder network 사이의 semantic gap을 줄이고자 함
- (빨간색) deep supervision: 모델이 다음 두 가지 모드로 동작할 수 있도록 제안
  - accurate mode: 모든 segmenation branch들의 출력의 평균을 취할 때 동작하는 모드
  - fast mode: segmentation branch에서 최종 segmentation 결과를 선택할 때 동작하는 모드 (모델의 복잡도를 결정)
loss function = binary cross-entropy loss + dice coefficient $L(Y, \hat{Y}) = -\frac{1}{N}\Sigma_{b=1}{N}\left( \frac{1}{2} \cdot Y_b \cdot log\hat{Y}_b + \frac{2 \cdot Y_b \cdot \hat{Y_b}}{Y_b+\hat{Y_b}}\right)$

꾸준히!