뭐야 정규표현식 재밌는데?

가은·2022년 9월 26일
0

숨참고 딥 다이브

목록 보기
29/31

28장 Number, 29장 Math, 30장 Date, 32장 String은 메서드 설명들 뿐이라 필요한 그때그때 찾아보자!

31장 RegExp

정규 표현식은 일정한 패턴을 가진 문자열의 집합을 표현하기 위해 사용하는 형식 언어다.

정규 표현식은 문자열을 대상으로 패턴 매칭 기능을 제공한다.
→ 패턴 매칭 기능이란 특정 패턴과 일치하는 문자열을 검색하거나 추출 또는 치환할 수 있는 기능을 말한다.

✔️ 정규 표현식은 주석이나 공백을 허용하지 않아 가독성은 떨어진다.

정규 표현식의 생성

RegExp 메서드

  • RegExp.prototype.exec

exec 메서드는 인수로 전달받은 문자열에 대해 정규 표현식의 패턴을 검색하여 매칭 결과를 배열로 반환한다.

매칭 결과가 없는 경우 null을 반환한다.

g플래그를 지정해도 첫 번째 매칭 결과만 반환한다.

  • RegExp.prototype.test

test 메서드는 인수로 전달받은 문자열에 대해 정규 표현식 패턴을 검사하여 매칭 결과를 불리언 값으로 반환한다.

  • String.prototype.match

String 표준 빌트인 객체가 제공하는 match 메서드는 대상 문자열과 인수로 전달받은 정규 표현식과의 매칭 결과를 배열로 반환한다.

g플래그를 지정하면 모든 매칭 결과를 배열로 반환한다.

플래그

  • i , Ignore case
    대소문자를 구별하지 않고 패턴을 검색한다.

  • g , Global
    대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.

  • m , Multi line
    문자열의 행이 바뀌더라도 패턴 검색을 계속한다.

어떠한 플래그도 사용하지 않은 경우에는 대소문자를 구별하여 패턴을 검색한 후 패턴 검색 매칭 대상이 1개 이상 존재해도 첫 번째 매칭한 대상만 검색하고 종료한다.

패턴

- 문자열 검색

const target = 'Is this all there is?';

// 'is' 문자열과 매치하는 패턴.
// 플래그 i를 추가하면 대소문자를 구별하지 않는다.
// 플래그 g를 추가하면 대상 문자열 내에서 패턴과 일치하는 모든 문자열을 전역 검색한다.
const regExp = /is/ig;

target.match(regExp); // -> ["Is", "is", "is"]

- 임의의 문자열 검색

. 은 임의의 문자 한 개를 의미한다.

const target = 'Is this all there is?';

// 임의의 3자리 문자열을 대소문자를 구별하여 전역 검색한다.
const regExp = /.../g;

target.match(regExp); // -> ["Is ", "thi", "s a", "ll ", "the", "re ", "is?"]

- 반복 검색

{m , n}은 앞선 패턴(A)이 최소 m번, 최대 n번 반복되는 문자열을 의미한다.

const target = 'A AA B BB Aa Bb AAA';

// 'A'가 최소 1번, 최대 2번 반복되는 문자열을 전역 검색한다.
const regExp = /A{1,2}/g;

target.match(regExp); // -> ["A", "AA", "A", "AA", "A"]

{n}은 앞선 패턴이 n번 반복되는 문자열을 의미한다.

{n,}은 앞선 패턴이 최소 n번 이상 반복되는 문자열을 의미한다.

패턴+는 앞선 패턴이 최소 한 번 이상 반복되는 문자열을 의미한다. == {1,}

패턴?는 앞선 패턴이 최대 한 번(0번 포함) 이상 반복되는 문자열을 의미한다. == {0,1}

- or 검색

| 은 or의 의미를 갖는다.

const target = 'A AA B BB Aa Bb';

// 'A' 또는 'B'를 전역 검색한다.
const regExp = /A|B/g;

target.match(regExp); // -> ["A", "A", "A", "B", "B", "B", "A", "B"]

분해 되지 않은 단어 레벨로 검색하기 위해서는 +를 함께 사용한다.
→ [ ] 내의 문자는 or로 동작하지 때문에 그 뒤에 +를 사용하면 앞선 패턴을 한 번 이상 반복한다.
범위를 지정하려면 [ ] 내에 - 를 사용한다. ([A-Za-z가-힣0-9])

\d는 숫자를 의미하고 \D는 숫자가 아닌 문자를 의미한다.

\w는 알파벳, 숫자, 언더스코어를 의미한다. 즉, \w는 [A-Za-z0-9_]를 의미한다.
\W는 알파벳, 숫자, 언더스코어가 아닌 문자를 의미한다.

/ / 시작, 종료 기호 안에서 / 기호를 쓰고 싶다면 \/으로 사용한다.

\s는 여러 가지 공백 문자(스페이스, 탭 등)을 의미한다.

- NOT 검색

[ ] 대괄호 내의 ^은 not의 의미를 갖는다.

- 시작 위치로 검색

[ ] 대괄호 밖의 ^은 문자열의 시작을 의미한다.

- 마지막 위치로 검색

$는 문자열의 마지막을 의미한다.

잘 정리 되어있는 표

표 출처

표 출처

profile
일이 재밌게 진행 되겠는걸?

0개의 댓글