내일배움캠프 12일차 개발일지

김광훈·2021년 9월 28일
4

TIL(Today I Learned)

목록 보기
11/49

활활 태워🔥

한 주를 시작하는 월요일 프로젝트 발표까지 단 5일밖에 남지 않았기에 체력을 활활 태우면서 코드를 짰다. 내 체력을 태우는만큼 컴퓨터도 타버렸는지 엄청나게 버벅이기 시작했다. 재부팅을 해도 증상이 사라지지 않는다... 내 컴퓨터😢 컴퓨터를 희생해서 오늘 한 일을 정리해보면

  • 프로젝트 프론트 페이지와 레시피 리스트 화면 연동
  • 단어 오탈자 교정 방법 구글링
  • 추천받은 레시피를 출력하도록 API 작성

하루종일 단어 오탈자를 어떻게 처리할 수 있을까에 대해 고민을 했다.

  • 단어 맞춤법 파이썬 라이브러리
  • 구글 검색엔진 이용

💻본론

오탈자 교정

팀 프로젝트에서 사용하는 openAPI의 자료를 자세히 보니 '머스타드'를 '머드타드'와 같이 잘모된 방법으로 표기되는 문제를 발견했다. 이 자료는 프론트 부분에서 사용자가 직접 마주하는 부분이기에 '머스타드', '머드타드' 두가지가 동시에 보여졌을 경우 상당한 혼란을 야기할 수 있고 올바른 데이터를 출력하는데도 큰 장애물이 될게 분명해 보였다. 이 문제를 해결하기 위해서 우리 팀은 다양한 방법을 시도해 보았다.

py-hanspell

네이버 맞춤법을 이용한 오탈자 교정해주는 라이브러리로서 띄어쓰기,오타 등을 교정해주는 python 라이브러리이다. 라이브러리를 사용하기 전 테스트로서 DB에서 발생하는 문제점 중 몇가지를 네이버 맞춤법에 입력했을 때, 다음과 같은 문제가 발생했다

  • 머드타드 -> 머드 타드

문장이 아닌 단어 단위를 입력하다보니 우리가 원하는 오탈자 교정을 제대로 해주지 못했다.

정리 : 네이버 맞춤법은 DB에 저장된 단어를 교정하는데 적합하지 않음.

구글 검색 엔진

구글에 오타를 내서 검색을 하면 구글 검색 엔진이 제안하는 단어라고 오탈자를 정정해주는 기능이 있다. 이 기능을 이용해서 구글 검색창에 DB상에 단어들을 자동으로 입력하고 출력되어 나오는 정정해준 값을 db에 업데이트하는 프로그램을 작성해서 테스트 해보았다.

  • 머드타드 -> 머스타드 로 오탈자에 대해 대부분 올바르게 수정됨을 확인
  • Selenium을 이용해서 검색하는 만큼 컴퓨의 무리가 갈 뿐만 아니라, 작업 속도가 극악임

정리 : 값의 신뢰도는 높으나 작업 속도가 너무나도 느려서 이방법을 채택하기엔 부적합하다.

😥 😥 😥

위 와 같은 방법 외에도 자연어 처리, KoNLPy 등 여러가지 고민을 하고 구글링을 해봤지만, 지금 진행하기엔 난이도가 너무 높거나 우리가 처한 상황에는 어울리지 않는 방법들이 많았다.
결국 한정된 시간동안 이 문제를 해결하기 위해 여러 기능을 확인해 봤지만 생각보다 적은 데이터인 만큼 지금은 함수를 만들어 직접 해결하는 것이 맞다는 결과가 나왔다.😥

✔생각 정리

하루 종일 구글링해도 해결하지 못하는 문제들이 나오기 시작했다. TIL작성할 때가 되어서 오늘 분명 바빴는데 결과가 하나도 없어서 뭘 써야할지 모르겠다는 생각이 들 때면 가슴이 조금 아프다
그래도 분명 하루하루 성장해 나가고 있는 것이 분명하겠지.

  • 내가 구글링한 것중 기억에 남는 것, 의미 있는 것은 정리해 놓기!
profile
잘 부탁드려요

4개의 댓글

comment-user-thumbnail
2021년 9월 28일

고생하셨습니다 👍👍

1개의 답글
comment-user-thumbnail
2021년 9월 28일

희생된 컴퓨터와 광훈님 체력에 묵념 ༼;´༎ຶ ۝༎ຶ`༽

1개의 답글