OCR (windows)

BABY CAT·2023년 7월 18일
0

ai

목록 보기
7/12

1. Windows에 Tesseract 설치 (import pytesseract)

설치파일 다운
https://github.com/UB-Mannheim/tesseract/wiki

tesseract-ocr- ~~.exe .다운로드하여 설치

환경변수 설정

설정 후 컴퓨터 재시작

2. pip install translate

(pip install googletrans==3.1.0a0)

3. 코드 실행 (ocr.jpeg파일배치)


import pytesseract

from PIL import Image

from translate import Translator



# 이미지 파일 불러오기

image_path = 'ocr.jpeg'

image = Image.open(image_path)



# 이미지에서 텍스트 추출

text = pytesseract.image_to_string(image, lang='eng')



# 추출된 텍스트 출력

print()

print("Extracted Text (English):")

print()

print(text)



# 번역

translator = Translator(to_lang='ko', from_lang='en')

translation = translator.translate(text)



# 번역된 텍스트 출력

print("\nTranslated Text (Korean):")

print()

print(translation)

1개의 댓글

comment-user-thumbnail
2023년 7월 18일

소중한 정보 잘 봤습니다!

답글 달기