텍스트 데이터 전처리

화이팅·2023년 2월 28일
0

한글 이외 문자 전부 제거

import re

def text_cleaning(text):
hangul = re.compile('[^ㄱ-|가-힣]+')
result=hangul.sub('',text)
return result

df['ko'] = df['ko'].apply(lambda x: text_cleanint(x))

출처 : 이것이 데이터 분석이다

profile
하하...하.

0개의 댓글