OpenCv 이론

문승훈·2024년 7월 10일
1

이번 작업에서 템플릿 매칭 후 ocr를 하려고 한다
여기서 주위 할 부분은 텍스트 전체를 인식하기엔 인식률이 떨어져서
전처리 작업으로 보통 opencv 를 통해 그레이스케일 작업을 거치기 때문에
나도 마찬가지로 그레이스케일을 진행하기로 결정했다

그레이스케일 이란 ?

8비트 R.G.B(3채널)의 이미지를 1채널로 변화시키는 것을 의미
다시 말해, 색상 정보를 갖지 않고 0~ 255밝기의 차이로 이미지를 변환시키는 것을 말하는데
3채널의 이미지가 1채널의 이미지로 변환이 되면 컴퓨터가 처리해야 할 계산이 줄어들기 때문에
이미지, 영상을 처리하는 데 있어 그레이스케일을 활용하는 것이 좋다.

이진화란 ?

그레이스케일이 3채널의 이미지를 1채널로 바꾸는 거라면 이진화는 1채널의 이미지 0~255를 0 or 1로 바꿔주는 것이다.
쉽게 말해, 특정값 을 흑 또는 백으로 구분 짓는 것
보통 이미지나 영상에 등장하는 사물의 특징을 추출하기 위한 최적의 임계값을 찾기 위해 이진화를 진행한다.

블러링 (Bluring)

추가로 블러링을 진행하여 노이즈를 제거할 수 있지만
나는 게임에서 찍은 스크린샷을 대상으로 진행할 것이기 떄문에
제거할 노이즈가 따로 없기에 진행하지 않았다.

openCv란?

open source computer vision library 의 약자로
이미지,영상 처리에 사용할 수 있는 오픈소스 라이브러리다.
이미지 처리, 객체 감지, 얼굴 인식,동작 인식,패턴 인식, 영상 부선 등의 작업에 활용되며
실시간 처리에 중점을 두고 설계되서 빠른 속도와 효율성을 자랑한다.
C++ 기반 언어지만 최근에는 파이썬의 대중화로 파이썬에서도 많이 사용되며
내 경우엔 opeencv를 자바스크립트로 사용할 것이다.

https://docs.opencv.org/3.4/index.html

profile
차기 GDE 개발자 문승훈

0개의 댓글