[자연어처리] 정규표현식 패턴(Regular expression)

hugingstar·2023년 11월 30일
0

1. 내가 찾고자 하는 텍스트를 그대로 적는 방법

  • Source
Hello, world!
  • Case1
Regural expression : Hello
Hello에 해단되는 텍스트를 찾아준다.
'Hello'를 인식한다.
  • Case2
Regural expression : hello
대소문자를 구분하기 때문에 'Hello'를 인식하지 않는다.
  • Case3
Regural expression : Hello,  world!
Hello, world!
띄어쓰기 두번되면 그것도 별도로 인식하기 때문에 확인이 필요하다.

2. 문자열의 위치를 지정하는 방법

  • Source 1
who is who
  • Case1
    ^ : 이 마크는 캐럿이라로 부르고 소스에서 시작되는 부분이 who로 시작되는 것을 검출한다.
Regural expression : ^who
who is who
  • Case2
    $ : 이 마크는 달러마크로 소스에서 who로 끝나는 것을 검출한다.
Regural expression : who$
who is who
  • Source 2
$12$\-\$25$
  • Case1
Regural expression :^$
$12$\-\$25$
  • Case2 : escape
    \ :는 백슬래쉬로서 문자로 인식할 수 있도록 만들어준다.
    \^ : 문자 캐럿이 된다.(본래 ^ 마크의 역할이 사라진다.)
    $ : 문자 달러마크가 된다. (본래 $ 마크의 역할이 사라진다.)
Regural expression :\$
$12$\-\$25$에서 $들을 인식된다.
  • Case3
Regural expression : ^\$
$12$\-\$25$중에서 $라는 문자가 어두에 있는 것을 인식된다.
  • Case4
Regural expression : \$$
$12$\-\$25$ 중에서 가장 끝에 있는 문자열 $가 인식된다.
  • Case5
Regural expression : \\
$12$\-\$25$에서 \ 역슬래쉬 문자를 인식하도록 한다.

0개의 댓글