# OCR

68개의 포스트
post-thumbnail

한글 OCR with opencv, pytesseract - 시작

ocr, opencv, tesseract

2023년 9월 6일
·
0개의 댓글
·
post-thumbnail

Naver Clova OCR API 사용 - Spring

로컬에 저장된 이미지를 읽어오는 예제와 HTML에서 submit으로 전송받은 이미지를 OCR하는 예제 두개를 다뤄볼 예정이다.이용신청은 사실 어려운게 없다 https://www.ncloud.com/product/aiService/ocr 여기서 이용신청하기 버튼

2023년 9월 3일
·
0개의 댓글
·
post-thumbnail

Tesseract (테서렉트)를 이용한 문자인식

Tesseract는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다.요즘 스마트폰을 이용해서 글이나 문자를 카메라로 찍어서 사진을 확인해보면. 그 문자들을 인식해서, 복사를 하거나, 검색을 할 수 있는 기능이 있다.이러한 기능이 바로 OCR(광학문자인식)을 이용한 것

2023년 8월 14일
·
1개의 댓글
·
post-thumbnail

OCR 찾아 삼만리

최근에 갑작스럽게 시작하게 된 프로젝트의 백엔드를 담당하면서 글자 인식에 대해 자세히 알아보게 되었다.

2023년 8월 12일
·
1개의 댓글
·

UiPath Document Understanding 교육

* DU 문서 처리 과정 Digitize -> Classify(생략가능) -> Extract *재학습 가능 * Classify 종류 Keyword Classifier 키워드를 사람이 선정 여러개의 키워드를 복합적으로 사용 가능 Intelligent Keyword C

2023년 8월 10일
·
1개의 댓글
·
post-thumbnail

[인턴 프로젝트] 3. paddleOCR을 써보자

Easyocr을 이용한 영상처리의 경우 일부 bounding box를 못찾는 문제도 있었고 인식률이 그리 좋다고 할 순 없었다. 커스텀 트레이닝도 진행 했었는데 별로 결과가 좋지 못했고중국 baidu에서 개발한 paddle을 사용 해보기로 했다.아나콘다 환경을 만들되

2023년 7월 20일
·
1개의 댓글
·
post-thumbnail

[인턴 프로젝트] 2. EasyOCR을 써보자

EasyOCR은 네이버 Clovaai의 CRAFT, deep-text-recognition benchmark 을 기반으로 만든 오픈 소스 라이브러리다. 코드는 파이썬으로 작성 되었고, 딥러닝을 기반으로 하여 텍스트를 이미지나 스캔한 문서에서 추출하는 기능을 제공한다.라

2023년 7월 20일
·
1개의 댓글
·
post-thumbnail

PPOCRLabel을 이용한 OCR 데이터 Annotation (for Windows)

PaddlePaddle에서 제공하는 Annotation 프로그램 을 PPOCRLabel을 이용해 한국어 데이터에 직접 BBox를 만들어보자!

2023년 7월 19일
·
2개의 댓글
·
post-thumbnail

[인턴 프로젝트] 1. OCR이란 무엇인가?

개요이번에 학교 전공필수 실습 수업으로 랩실 인턴을 했다.사실 교수님이 실험도구를 다 집에다 차로 옮겨주셔서 집에서 했지만 이번에 실습을 진행하며 사용했던 알고리즘, 과정들을 써볼 예정이다. 목표는 다음과 같다. 다음 이미지들을 ocr로 추출해서 excel 파일로

2023년 7월 6일
·
0개의 댓글
·
post-thumbnail

Python OCR tesseract

문자 도착까지 잘 작동하는 것을 확인할 수 있습니다.

2023년 7월 5일
·
0개의 댓글
·
post-thumbnail

라벨 image 유의미한 데이터로 환원하기

주제 OCR 서비스 구현 및 완결성, 이식성을 갖춘 코드 작성기획의도 이미지로 되어있는 제품의 정보를 문자열로 치환하여 유용한 데이터로 저장

2023년 6월 29일
·
0개의 댓글
·
post-thumbnail

Handwritten Mathematical Expression Recognition with Bidirectionally Trained Transformer

논문 및 이미지 출처 : Abstract Encoder-decoder 로 Handwritten Mathematical expression Recognition (HMER) 에서 좋은 진척을 뵈지만, 여전히 image feature 에 attention 을 align

2023년 6월 23일
·
0개의 댓글
·
post-thumbnail

Handwritten Mathematical Expression Recognition via Attention Aggregation based Bi-directional Mutual Learning

논문 및 이미지 출처 : Abstract Handwritten Mathematical expression Recognition (HMER) 는 이미지로 LaTeX 생성이 목적이며, 최근 attention 기반의 encoder-decoder 모델이 널리 사용. 일반적

2023년 6월 21일
·
0개의 댓글
·
post-thumbnail

Text Detection

Taxonomy Text Detection모델의 경우 regression과 segmentation 기반의 관점으로 볼 수 있다. Regression-Based regression-base Text Detection 모델 예시: TextBoxes'18 ssd를 글자 영

2023년 5월 23일
·
0개의 댓글
·
post-thumbnail

OCR project

Optical Character Recognition 광학문자인식으로 알려진 ocr은 텍스트를 기계가 인식할 수 있는 텍스트 형식으로 변환하는 Task이다.

2023년 5월 23일
·
0개의 댓글
·
post-thumbnail

[CaptchaCracker] 매크로 방지문자 OCR모델 만들기 (with TensorFlow)

광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정입니다. 예를 들어 양식 또는 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지 파일로 저장합니다. 이미지 파일에서는 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를

2023년 3월 8일
·
0개의 댓글
·

OCR

이미지에서 text를 찾는 모델은 일반적으로 ocr이라고 하는데요~제경험상 easyOCR이라는 모델이 가장 사용하기 쉽고 성능이 좋았습니다.네이버에서 개발한 CRAFT라는 모델을 기반으로 만들어졌습니다.https://github.com/JaidedAI/Easy

2022년 12월 30일
·
0개의 댓글
·

[졸업 프로젝트-1] Korean Receipt 문자 인식을 위한 OCR 모델 개발, 그리고 predict API 만들기

(0) 텐센트 클라우드 연결 --> OCR 모델을 개발하기 위해서 💡 중요한 것은 그냥 ssh원격 접속을 해서 저장을 하게 되면 permission없다는 에러 메세지가 뜨게 된다는 것이다. 그렇게 때문에 무조건 가상 머신의 서버 내에서 편집이나 파일 추가 등을 하기

2022년 12월 23일
·
0개의 댓글
·