정규표현식

JUNHO YEOM·2023년 2월 1일
0

기타

목록 보기
1/1
  1. 정규표현식은 대소문자를 구분합니다.

^ (carrot): 뒤에 오는 문자와 첫번째로 매칭되는 문자
& 뒤에 오는 문자중 마지막으로 매칭되는 문자
. 모든 문자와 매칭 됩니다.
[^a-z] 안에 들어있는 것을 제외하고 선택합니다.(대괄호 안에서는 ^가 부정을 의미합니다
| 여러개의 문자를 하나의 문자단위로 나눕니다. (on|vs|cd)

sub pattern

(Mon|Tues|Fri)
Mon, Tues, Fri가 한덩어리가 됩니다.

(Mon|Tues|Fri)day
Monday, Tuesday, Friday가 한덩어리가 됩니다.

Quantifiers(수량자)

'문자'* 문자 0개이상이 올 수 있다. 해당 하는 문자가 있을수도 있고, 없을 수 도 있다.
'문자'+ 문자 1개이상이 올 수 있다. 반드시 한개는 있어야 합니다.
'문자'? 문자가 없거나, 1인 경우만 선택 됩니다.
{'숫자'} 숫자의 개수만큼 끊어서 문자를 매칭합니다.
'문자'{'숫자1','숫자1'} 숫자1의 개수 이상, 숫자2의 개수 이하인 문자를 매칭합니다
['문자']{'숫자',} 문자가 숫자개 이상 등장한 경우 매칭합니다.
''문자'*? 별표 뒤에 수량자 '?'를 쓰게 되면 수량자 0이 됩니다. 0개만 매칭되게 합니다
'문자'+? 더하기 뒤에 수량자 '?'를 쓰게 되면 수량자 1이 됩니다. 문자 1개만 온 경우 매칭됩니다.
'문자'?? 물음표 뒤에 수량자 '?'를 쓰게 되면 수량자 0이 됩니다. 0개만 매칭되게 합니다.

\ (escape 문자) 뒤에 문자가 오게 되면 정규표현식에서 사용되는 기능이 아닌, 일반 문자로써의 역할만 하게 됩니다.

[] 대괄호와 대괄호 사이에 있는 문자와 매칭 됩니다.

\w word(단어)만 선택합니다 [A-z0-9__] 와 같은 의미 입니다. (알파벳, 숫자, 언더라인(_))
\W word(단어)가 아닌 문자만 선택합니다. (공백, 특수문자)
\d digit(숫자)만 매칭합니다.
\D digit(숫자)를 제외한 문자만 매칭합니다.

word 바운더리 패턴
\b'문자' 단어를 찾습니다. 앞이 같은 모양일 경우 찾아요
\bcat: concat cat catcon
cat\b: concat cat catcon

\B'문자' 문자에 해당하지 않는 글자들을 매칭합니다.

\A'문자' 시작점을 의미합니다.
'문자'\Z 제일 마지막의 경계를 의미합니다.

^'문자'와 \A'문자'의 차이 : 멀티 라인일 때, 줄바꿈이 일어나면 ^'문자'는 새로운 줄에서 새로운 문자를 매칭하지만, \A'문자'는 줄바꿈이 일어날 때도, 가장 첫번째 있는 결과만 리턴합니다.

?='문자' '문자열을 검색할 때는 문자를 사용하지만, 문자를 선택할 때는 '문자'를 제외합니다.

0개의 댓글