import re

jaeha_lee·2023년 4월 4일
0

NLP 전처리 공부 중 import re 이 부분이 이해하는데 오래 걸려 또 한번 헷갈렸을 때 참고하기 위한 용도로...

import re
regex = re.compile('[^a-zA-Z]')
# re.compile 은 정규식을 return 한다. (정규식에 대해서는 설명하지 않겠다.)
# 이 정규식의 의미는 소문자,대문자 알파벳을 제외한 것을 말한다.
# 이렇게 정규식을 만들고 나서
test_str = "@31AvvCdsd33~!24"
result = regex.sub("",test_str) # 정규식 제외한 부분을 ""으로 바꾸겠다는 말
# 즉 여기서는 알파벳을 제외한 부분은 빈칸 즉 제거하겠다는 말
# regex.sub("뭘로 바꿀지","바꿀 문자열")

print(result) # AvvCdsd

0개의 댓글