[논문리뷰 | CV ] U-Net : Convolutional Networks for Biomedical Image Segmentation(2015) Summary

9e0na·2024년 3월 25일

Computer Vision DeepLearning paper-review

0

1. Introduction

1.1. 논문이 다루는 Task

1.2. 기존 연구 한계점

2. Architecture

3. 제안 방법론

3.2. Contribution

4. 실험 및 결과

📚 References

[논문리뷰]

목록 보기

37/42

Title

U-Net : Convolutional Networks for Biomedical Image Segmentation

1. Introduction

1.1. 논문이 다루는 Task

생물의학적 이미지의 Segmentation Task

세포, 장기, 기타 해부학적 구조체 등의 이미지를 정밀하게 분리하는 작업을 포함

1.2. 기존 연구 한계점

sliding window 방식을 사용하면 patch별로 네트워크를 별도로 실행해야하고 patch의 중복으로 인한 중복성이 많기 때문에 속도가 느림.

localization accuracy와 context 사이의 trade-off가 존재 : patch가 크면 context 정보를 더 많이 활용할 수 있지만 localization accuracy는 감소, patch가 작으면 localization accuracy는 증가하지만 context를 거의 볼 수 없음.

2. Architecture

UNET은 3부분으로 나누어 볼 수 있음.

일반적으로 Semantic Segmentation 모델들은 Down-sampling을 통해 크기가 줄어들었다가 다시 Up-sampling을 통해 크기가 늘어나는 구조를 취하는데, U-Net 논문에서는 이를 각각 Contracting Path, Expanding Path라고 부름.

Contracting Path: 점진적으로 넓은 범위의 이미지 픽셀을 보며 의미정보(Context Information)을 추출
Bottle Neck: 수축 경로에서 확장 경로로 전환되는 전환 구간
Expanding Path: 의미정보를 픽셀 위치정보와 결합(Localization)하여 각 픽셀마다 어떤 객체에 속하는지를 구분

3. 제안 방법론

3.1. Main Idea

첫번째, 인코더(Contract path)의 feature map을 디코더 feature map에 Concat하여 위치 정보전달

두번째, 데이터셋의 전처리, 변형(deformation)을 이용하여 데이터 수 증가

세번째, 테두리(border line)를 더 잘 분할하기 위해 Weight를 추가한 손실함수(Loss function)

3.2. Contribution

Encoder가 확장함에 따라 채널 수를 1024까지 증폭
-> 이때 좀 더 고차원에서 정보를 매핑

각기 다른 계층의 Encoder 출력을 Decoder와 결합하고 이전 레이어의 정보를 효율적으로 활용

4. 실험 및 결과

4.1. Dataset

Dataset: Transmitted light microscopy images (Phase contrast and DIC)

Transmitted light microscopy images: 투과 광선 현미경 검사

Phase contrast: 위상차 현미경

DIC (Differential interference contrast microscope) = 차등간섭대비 현미경

4.2. Baseline

4.3. 결과

Unet architecture는 biomedical segmentation application에서 매우 우수한 성능을 달성

FCN을 확장시켜 context 정보와 local 정보를 충분히 활용할 수 있는 U모양의 architecture를 제안

Elastic distortion으로 Data Augmentation을 했기 대문에 적은 dataset에서도 훈련 가능

📚 References

https://wikidocs.net/148870

https://velog.io/@mink7878/Segmentation-U-Net-Convolutional-Networks-for-Biomedical-Image-Segmentation-%EB%85%BC%EB%AC%B8-%EB%A6%AC%EB%B7%B0

AI 전문가가 되기 위해 [a-zA-Z]까지 정리하는 거나입니다 😊

이전 포스트

[논문리뷰 | NLP ] MASS: Masked Sequence to Sequence Pre-training for Language Generation (2019) Summary

다음 포스트

[논문리뷰 | NLP ] RoBERTa: A Robustly Optimized BERT Pretraining Approach(2019) Summary

0개의 댓글