konlpy - 한국어 형태소 추출 라이브러리

화이팅·2023년 3월 1일
0

konlpy를 이용해 키워드 추출 ( Okt tagger)

from konlpy.tag import Okt
# Counter객체 : {'단어' :'빈도'..}
from collections import Counter 

#konly의 형태소 분석기로 명사 단위 키워드 추출

nouns_tagger=Okt()
nouns=nouns_tagger.nouns(counter_corpus)
count=Counter(nouns)

키워드 다듬기 1 - 한 글자 키워드 제거

remove_char_counter=Counter({ x : count[x] for x in count if len(x) >1})

키워드 다듬기2- 불용어 사전 (stopwrods)

  • 불용어 : 실직ㄹ적인 의미 없는 키워드 + 의미적인 독립을 할 수 없는 품사
    ex) 입니다, 그, 저, .. 관사 , 접속사
    -> 텍스트 마이닝에서 불용어 제거해야함
profile
하하...하.

0개의 댓글