# OCR

Naver Clova OCR API 사용 - Spring
로컬에 저장된 이미지를 읽어오는 예제와 HTML에서 submit으로 전송받은 이미지를 OCR하는 예제 두개를 다뤄볼 예정이다.이용신청은 사실 어려운게 없다 https://www.ncloud.com/product/aiService/ocr 여기서 이용신청하기 버튼

Pix2Struct: Screenshot Parsing as Pretraining for Visual Language Understanding (ICML 2023)

Tesseract (테서렉트)를 이용한 문자인식
Tesseract는 다양한 운영 체제를 위한 광학 문자 인식 엔진이다.요즘 스마트폰을 이용해서 글이나 문자를 카메라로 찍어서 사진을 확인해보면. 그 문자들을 인식해서, 복사를 하거나, 검색을 할 수 있는 기능이 있다.이러한 기능이 바로 OCR(광학문자인식)을 이용한 것
UiPath Document Understanding 교육
* DU 문서 처리 과정 Digitize -> Classify(생략가능) -> Extract *재학습 가능 * Classify 종류 Keyword Classifier 키워드를 사람이 선정 여러개의 키워드를 복합적으로 사용 가능 Intelligent Keyword C

[인턴 프로젝트] 3. paddleOCR을 써보자
Easyocr을 이용한 영상처리의 경우 일부 bounding box를 못찾는 문제도 있었고 인식률이 그리 좋다고 할 순 없었다. 커스텀 트레이닝도 진행 했었는데 별로 결과가 좋지 못했고중국 baidu에서 개발한 paddle을 사용 해보기로 했다.아나콘다 환경을 만들되

[인턴 프로젝트] 2. EasyOCR을 써보자
EasyOCR은 네이버 Clovaai의 CRAFT, deep-text-recognition benchmark 을 기반으로 만든 오픈 소스 라이브러리다. 코드는 파이썬으로 작성 되었고, 딥러닝을 기반으로 하여 텍스트를 이미지나 스캔한 문서에서 추출하는 기능을 제공한다.라

PPOCRLabel을 이용한 OCR 데이터 Annotation (for Windows)
PaddlePaddle에서 제공하는 Annotation 프로그램 을 PPOCRLabel을 이용해 한국어 데이터에 직접 BBox를 만들어보자!

[인턴 프로젝트] 1. OCR이란 무엇인가?
개요이번에 학교 전공필수 실습 수업으로 랩실 인턴을 했다.사실 교수님이 실험도구를 다 집에다 차로 옮겨주셔서 집에서 했지만 이번에 실습을 진행하며 사용했던 알고리즘, 과정들을 써볼 예정이다. 목표는 다음과 같다. 다음 이미지들을 ocr로 추출해서 excel 파일로

라벨 image 유의미한 데이터로 환원하기
주제 OCR 서비스 구현 및 완결성, 이식성을 갖춘 코드 작성기획의도 이미지로 되어있는 제품의 정보를 문자열로 치환하여 유용한 데이터로 저장

Handwritten Mathematical Expression Recognition with Bidirectionally Trained Transformer
논문 및 이미지 출처 : Abstract Encoder-decoder 로 Handwritten Mathematical expression Recognition (HMER) 에서 좋은 진척을 뵈지만, 여전히 image feature 에 attention 을 align

Handwritten Mathematical Expression Recognition via Attention Aggregation based Bi-directional Mutual Learning
논문 및 이미지 출처 : Abstract Handwritten Mathematical expression Recognition (HMER) 는 이미지로 LaTeX 생성이 목적이며, 최근 attention 기반의 encoder-decoder 모델이 널리 사용. 일반적

Text Detection
Taxonomy Text Detection모델의 경우 regression과 segmentation 기반의 관점으로 볼 수 있다. Regression-Based regression-base Text Detection 모델 예시: TextBoxes'18 ssd를 글자 영

OCR project
Optical Character Recognition 광학문자인식으로 알려진 ocr은 텍스트를 기계가 인식할 수 있는 텍스트 형식으로 변환하는 Task이다.

[CaptchaCracker] 매크로 방지문자 OCR모델 만들기 (with TensorFlow)
광학 문자 인식(OCR)은 텍스트 이미지를 기계가 읽을 수 있는 텍스트 포맷으로 변환하는 과정입니다. 예를 들어 양식 또는 영수증을 스캔하는 경우 컴퓨터는 스캔본을 이미지 파일로 저장합니다. 이미지 파일에서는 텍스트 편집기를 사용하여 단어를 편집, 검색하거나 단어 수를
OCR
이미지에서 text를 찾는 모델은 일반적으로 ocr이라고 하는데요~제경험상 easyOCR이라는 모델이 가장 사용하기 쉽고 성능이 좋았습니다.네이버에서 개발한 CRAFT라는 모델을 기반으로 만들어졌습니다.https://github.com/JaidedAI/Easy
[졸업 프로젝트-1] Korean Receipt 문자 인식을 위한 OCR 모델 개발, 그리고 predict API 만들기
(0) 텐센트 클라우드 연결 --> OCR 모델을 개발하기 위해서 💡 중요한 것은 그냥 ssh원격 접속을 해서 저장을 하게 되면 permission없다는 에러 메세지가 뜨게 된다는 것이다. 그렇게 때문에 무조건 가상 머신의 서버 내에서 편집이나 파일 추가 등을 하기