0726 개발일지

이나겸·2022년 7월 26일

1. 개발기록

cv2를 사용하면 코드가 길어지는데, PIL을 사용하면 코드가 아주 간결해진다.
cv2를 사용했을 때는 색상 변화나 엣지를 잡아주는 코드를 만들어야했다.
PIL을 사용했을 때는 컬러반전을 따로 해줄 필요가 없었는데,
일단 기본 코드로도 잘 인식하는 것 같아서 모델을 호출해서 detect 하는 부분을 신경썼다.

model = torch.hub.load('ultralytics/yolov5', 'custom', path='yolov5n_best.pt', force_reload=False)

이 부분을 사용해서 이미 학습된 모델을 호출했다.
호출된 모델에 이미지를 넣어서 crop을 진행해서 easy OCR로 인식 시켰다.

2. 느낀점

tesseract와 easy OCR 둘 다 많이 사용되는데 인식률이 확실히 떨어진다고 한다.
마이크로 소프트에서 제공하는 ocr을 사용해 봐야 할 것 같다.

0개의 댓글