텍스트 문자열 전처리

BABY CAT·2022년 11월 8일
0

python

목록 보기
4/22

코퍼스 : 말뭉치
정제(cleaning) : 갖고 있는 코퍼스로부터 노이즈 데이터를 제거한다.
정규화(normalization) : 표현 방법이 다른 단어들을 통합시켜서 같은 단어로 만들어준다.

정규표현식

https://wikidocs.net/21703

0개의 댓글