자연스러운 UX 라이팅을 위한 형태소 분석기 도입 및 자체 서비스 개발

원승현·2023년 7월 11일
0

API설명

목록 보기
2/3

지금 다니고 있는 회사는 UX라이팅 회사이다.
회사별로 여러명이 작성을 해도 한명이 작성을 한 것처럼 자동으로 빠르게 문체나 말투를 변환해주는 서비스이다.

입사 후 지금까지 개발의 모든 백엔드 작업은 혼자 담당해서 와서 기존의 서비스에서 아쉬운점이 있었는데 난이도가 매우 높았다.

한국어는 다른 언어와 다르게 문장을 어떻게 난잡하게 써도 이해가 가능하다
좋게 말하면 너무나 좋은 언어이지만, 누구든 다르게 문장을 쓸수 있다는 단점도 있다.
또한 동음이의어도 다수 존재 하다보니 한국어 자연어 처리는 난이도가 많이 높았다.

이번에 형태소 분석기를 통해 기존 웹에서 제공하는 서비스에 접목시켜 기존보다 정확한 문장 작성 및 수정이 가능하도록 코드를 수정하였다.

아래 두 사진은 동일한 데이터 베이스 , 동일한 문장이다.
다른점은 기존 엔진 과 이번에 새로운 엔진의 차이점이다.

기존 엔진에서는 동음이의어 , 어미 , 접두사 와 같은걸 잡아내지 못했다.
그래서 다른 방법으로 해당 문제를 해결해 왔으나,
근본적으로 문맥을 파악하고 , 해당 위치에 맞는 형태의 맞춤 문장을 추천해주고 싶었다.


이렇게 같은 단어이지만 , 위치에 따라 추천을 해줘야 할 부분과 해주면 안되는 부분이 명확하게 구분이 되고 있는 모습이다.

물론 테스트 데이터 베이스라 , 데이터의 양이 적지만, 기존 데이터 베이스에 접목 시키면 기존보다 훨씬 정확하고 깔끔한 변환이 이뤄진다.

약 2달동안 영혼을 갈아넣어 엔진을 업그레이드 시키고 금일 QA를 하면서 발생하는 에러를 다 수정하고 최종 결과를 보니 너무 기분이 좋다.

profile
Back-Dev

0개의 댓글