Image Classification start overview

Dongbin Lee·2021년 3월 29일

2021부캠AI

목록 보기

24/24

data explore

분류 :

마스크 착용여부 (3:Wear, Incorrect, Not Wear)
성별(2: Male, Female)
나이 기준(3: <30, >=30 and <60, >=60)
총 18개 클래스

=> multi task learning을 사용해야 좋을 지?
참고 : https://mapadubak.tistory.com/40

전체 사람 명 수 : 4,500
=> train set이 너무 적다. data augmentation을 적용해서 늘려야 할 것 같은데 어떻게 적용해야될까?
추가적인 데이터 :
동양인, 나이, 성별: https://afad-dataset.github.io/
(마스크를 쓴 상태의 나이를 알아내야하므로 추가적인 데이터는 사용하지 않는 것이 좋아보인다.)

한 사람당 사진의 개수: 7 [마스크 착용 5장, 이상하게 착용(코스크, 턱스크) 1장, 미착용 1장]
=> 마스크 착용 5장의 마스크 색, 무늬가 전부 다르다.
augmentation에서 color jitter를 넣어서 색에 대한 민감도를 줄여주는 것도 좋을 것 같다.

나이는 20대부터 70대
=> 분포를 한번 봐야 될 것 같다. 20~30, 30~60, 60~70이 될 것이기때문에
30~60의 이미지가 제일 많을 듯?
=>
paperswithcode :
https://paperswithcode.com/task/age-estimation
https://paperswithcode.com/paper/consistent-rank-logits-for-ordinal-regression
https://github.com/Raschka-research-group/coral-cnn/tree/master/single-image-prediction__w-pretrained-models

성별은 남자, 여자 : binary classification
=> 이진 분류문제이므로 이 부분에서는 어느정도의 정확도를 끌어올릴 수 있을 것 같다. multi task learning보다는 single task learning이 좋을 듯?

이미지 크기: (384, 512)
=> 일반적인 imagenet의 경우 224 x 224로 이미지가 줄여지게 됨.
이렇게 진행하는 것이 좋을까?
512x512를 input으로 받는 imagenet을 좀 알아봐야겠다.

정리:
single task learning으로 나누어서 진행하고,
각 augmentation, input size, loss function을 다르게 주어 학습을 진행하는 것이 좋을 것 같다.

얼마전에 알게 된 arcfaceloss가 좋을 수도 있지 않을까?
마스크 착용은 제외하고, 나이와 성별분류에서는 좋을 수도 있을것 같은 생각이 든다.
triplet loss 는 뭘까?

현재 pre-train되있는 모델들이 많을텐데 이를 가져와서 사용한다면 정확도가 어느정도 보장되어있지 않을까?

Dongbin Lee

Preparation student who dreams of becoming an AI engineer.

Image Classification start overview

2021부캠AI

0개의 댓글