# komoran

4개의 포스트
post-thumbnail

[Konlpy / TF-IDF] 한글 문장 유사도 측정

한글 문장 사이의 유사도는 어떻게 계산할까? 비슷한 문장은 어떻게 찾지?? 인공지능 없이도 아주 간단하게 만들 수 있습니다😎

2022년 11월 21일
·
3개의 댓글
·

Komoran error - java.lang.NullPointerException

문제 형태소 분석을 위해 komoran을 사용할 때 java.lang.NullPointerException 에러가 발생하는 경우 해결법 대부분 데이터에 '\n'가 있어서 발생하는 문제이다. 따라서, ''로 치환해준 뒤, 형태소분석을 진행해야 한다. > 데이터 수집 후 3가지 값은 기본적으로 치환해주는 것이 좋다.

2021년 10월 14일
·
0개의 댓글
·
post-thumbnail

취향저격 - 형태소 분석기(1)

오류가 있는 내용이나 정확하지 않은 내용에 대해서는 댓글로 피드백 달아 주세요! 형태소 분석기를 설명하기에 앞서 자연어처리를 하기위해 필요한 전처리에 대해 간단하게 설명하고자 한다. 전처리의 필요성 자연어처리를 하기 위해서는 전처리 과정이 필수다. 전처리가 필요한

2021년 2월 24일
·
0개의 댓글
·
post-thumbnail

최다 반복된 한글 형태소 추출 | 유튜버 말싸미 | 개발일지 #3-2

이전 글에서 예고한 대로 '오늘 할 것'을 처리한다.오늘 할 것1.형태소 분석 후 명사/형용사(이하 키워드) 만 추출하여 리스트 담기2.최다 반복된 키워드를 10위까지 추출하기 (전체 영상에서)3.영상 전체를 구간화 시키기 (5분할 or 10분할)4\. 구간 중 최다

2020년 2월 22일
·
0개의 댓글
·