[SW 중심대학 AI 경진대회 2023] 대회 요구 사항 요약 및 필요한 내용

LONGNEW·2023년 7월 15일
0

연구

목록 보기
2/10

주제 : 위성 이미지 건물 영역 분할

데이터

제공되는 데이터는 위성 이미지, 건물 영역 범위가 제공된다.
RLE 인코딩 방식으로 해당 건물 영역 범위를 나타낸다.

출처 : 고영준 교수님 강의자료
제공되는 Baseline에서는 RLE 인코딩/ 디코딩 하는 코드가 존재한다.

Baseline의 DataLoader의 경우 사진 자체를 224 * 224로 resize를 하므로 화질과 같은 부분에서 저하가 있을 것으로 예상된다.

모델

사용할 만한 모델은 segmentation이 대상이 될 것이다.
데이터는 위의 Baseline 방식의 데이터를 우선적으로 사용(?)하는 걸 예상하고
어떠한 모델들을 사용할 수 있을지부터 한번 생각해보겠다.

semantic

건물이 있는 1의 위치를 RLE로 디코드 해서 판단할 거니까 괜찮을거고.
그런 결과가 없으면 -1 주면 될 거고

instance

어떠한 건물이 있는지 없는지만 알면 그냥 그 위치를 RLE 인코드 해서 주면 되니까 얘도 쓸 수 있을 듯

=> 일단 두 모델 모두 적용이 가능할 것 같다.

Deeplab, resnet, unet을 대상으로 우선 확인해 봐야겠다

Idea

data :
1. RLE 값들을 decode 한다.
2. 224 * 224 patch로 우, 하의 방향으로 이동하며 제작한다.
2.1 224 기준으로 4번에 걸쳐 이동을 하게 56 pixel씩 이동하며 제작하자.
2.2 그렇게 되면 한 사진에 대략 16 * 16 개 정도의 데이터가 제작되겠다.
3. 이상황에서 랜덤으로 데이터를 한 100,000개 정도로 제 하는 방식을 사용해 학습 시간을 좀 줄이던지 해보자.

model : residual포함되어야 함.
deeplab, resnet, unet등을 우선 확인하기.

0개의 댓글