인프런 강의 <데이터 분석을 위한 고급 SQL>을 듣고, 중요한 점을 정리한 글입니다.
: 문자열에서 패턴을 찾아내는 데 쓰이는 것. 예를 들어, 모음으로 시작하지 말라든지, 내가 가지고 있는 문자열에서 숫자가 3개는 들어가야 되든지, 또는 이메일 패턴을 찾아달라든지.
Query the list of CITY names starting with vowels (i.e., a, e, i, o, or u) from STATION. Your result cannot contain duplicates.
Input Format
The STATION table is described as follows:
where LAT_N is the northern latitude and LONG_W is the western longitude.
SELECT DISTINCT city
FROM station
WHERE city REGEXP '^[aeiou].*'
REGEXP
: regular expression의 줄임말
'^[aeiou].*'
: [a,e,i,o,u]는 어떤 문자 중에 하나라도 들어가면, '^'은 이 문자열이 여기에서 시작해야 하고, '.*'은 '%'와 똑같은 기능. 즉, a, e, i, o, u 중에 하나로 시작하는 어떤 문자열이든지 가져와주라.
'.*'
'.'은 line break(줄바꿈)을 제외하고는 어떤 문자에다가도 매치를 해줌. 그 뒤에는 이 점이 몇번 반복될 것이냐. ''를 써주면 하나도 없거나 또는 몇개가 있어도 상관없다. 즉 '.'는 '%'기능을 해주는 것.