U-Net : Convolutional Networks for Biomedical Image Segmentation
1. Introduction
1.1. 논문이 다루는 Task
생물의학적 이미지의 Segmentation Task
세포, 장기, 기타 해부학적 구조체 등의 이미지를 정밀하게 분리하는 작업을 포함
1.2. 기존 연구 한계점
sliding window 방식을 사용하면 patch별로 네트워크를 별도로 실행해야하고 patch의 중복으로 인한 중복성이 많기 때문에 속도가 느림.
localization accuracy와 context 사이의 trade-off가 존재 : patch가 크면 context 정보를 더 많이 활용할 수 있지만 localization accuracy는 감소, patch가 작으면 localization accuracy는 증가하지만 context를 거의 볼 수 없음.
2. Architecture
UNET은 3부분으로 나누어 볼 수 있음.
일반적으로 Semantic Segmentation 모델들은 Down-sampling을 통해 크기가 줄어들었다가 다시 Up-sampling을 통해 크기가 늘어나는 구조를 취하는데, U-Net 논문에서는 이를 각각 Contracting Path, Expanding Path라고 부름.
Contracting Path: 점진적으로 넓은 범위의 이미지 픽셀을 보며 의미정보(Context Information)을 추출
Bottle Neck: 수축 경로에서 확장 경로로 전환되는 전환 구간
Expanding Path: 의미정보를 픽셀 위치정보와 결합(Localization)하여 각 픽셀마다 어떤 객체에 속하는지를 구분