문제
1단계 new_id의 모든 대문자를 대응되는 소문자로 치환합니다.
2단계 new_id에서 알파벳 소문자, 숫자, 빼기(-), 밑줄(_), 마침표(.)를 제외한 모든 문자를 제거합니다.
3단계 new_id에서 마침표(.)가 2번 이상 연속된 부분을 하나의 마침표(.)로 치환합니다.
4단계 new_id에서 마침표(.)가 처음이나 끝에 위치한다면 제거합니다.
5단계 new_id가 빈 문자열이라면, new_id에 "a"를 대입합니다.
6단계 new_id의 길이가 16자 이상이면, new_id의 첫 15개의 문자를 제외한 나머지 문자들을 모두 제거합니다.
만약 제거 후 마침표(.)가 new_id의 끝에 위치한다면 끝에 위치한 마침표(.) 문자를 제거합니다.
7단계 new_id의 길이가 2자 이하라면, new_id의 마지막 문자를 new_id의 길이가 3이 될 때까지 반복해서 끝에 붙입니다.
나의 풀이
def solution(new_id):
N = list(new_id.lower())
M = []
s = True
for i in range(len(N)):
if N[i] == "~" or N[i] == "!" or N[i] == "@" or N[i] == "#" or N[i] == "$" or N[i] == "%" or N[i] == "^" or N[i] == "="\
or N[i] == "&" or N[i] == "*" or N[i] == "(" or N[i] == ")" or N[i] == "+" or N[i] == "[" or N[i] == "]" \
or N[i] == "{" or N[i] == "}" or N[i] == ":" or N[i] == "?" or N[i] == "," or N[i] == "<" or N[i] == ">" or \
N[i] == "/":
N[i] = " "
else:
M.append(N[i])
while s:
while len(M) > 0:
join_M = ''.join(M)
M = list(join_M.replace("..", "."))
if M[0] == ".":
del M[0]
continue
if M[-1] == ".":
del M[-1]
continue
elif ".." not in join_M:
break
join_M = ''.join(M)
M = list(join_M.replace(" ", ""))
if len(M) <= 2:
if len(M) == 0:
M.append("a")
while len(M) <= 2:
M.append(M[-1])
elif len(M) >= 16:
M = M[:15]
if M[-1] != "." and M[0] != ".":
s = False
return ''.join(M)
- 무작정 풀긴 했지만 정규표현식을 활용했다면 좀 더 순서에맞고
직관적인 코드를 작성할 수 있었을 것 같다.
정규식 활용 풀이(java)
class Solution {
public String solution(String new_id) {
String answer = "";
answer = new_id.toLowerCase();
answer = answer.replaceAll("[^0-9a-z-_.]", "");
answer = answer.replaceAll("[.]{2,}",".");
answer = answer.replaceAll("^[.]|[.]$", "");
if (answer.equals("")) answer = "a";
if (answer.length() >= 16) answer = answer.substring(0, 15);
answer = answer.replaceAll("[.]$", "");
if (answer.length() <= 2) {
char ch = answer.charAt(answer.length() - 1);
while (answer.length() < 3) {
answer += ch;
}
}
return answer;
}
}
정규 표현식
- 텍스트 처리 작업에 매우 유용합니다.
- 데이터 검증(주민번호, 휴대폰 번호등등)에 사용되기도 합니다.
표현식 | 의미 | |
---|
^x | 문자열의 시작, x문자로 시작됨을 의미 | |
x$ | 문자열의 종료, x문자로 종료됨을 의미 | |
.x | 임의의 한 문자, 문자열이 x로 끝남(" 는 넣을 수 없음) | |
x* | 반복 표현, x문자가 0번 혹은 그 이상 반복됨 | |
x+ | 반복 표현, x문자가 한번 이상 반복됨 | |
x? | 존재여부 표현, x문자가 존재하거나 하지않을 수 있음 | |
x|y | or 표현, x또는 y가 존재함을 의미 | |
[ ] | 문자의 집합이나 범위 표현, ^ = not 의미 | [^0-9a-z-_.] : 0-9, a-z, - _ . 이 아니어야 한다. |
( ) | 그룹 표현, 괄호안의 문자를 하나의 문자로 인식 | |
x{n} | 반복 표현, x문자가 n번 반복됨 | |
x{,n} | 반복 표현, x문자가 n번 이상 반복됨 | |
x{n,m} | 반복 표현, x문자가 n번 이상 최대 m번 이하로 반복됨 | |
| | |
| | |
\s | 공백 문자 | |
\S | 공백 문자가 아닌 나머지 문자 | |
\w | 알파벳이나 문자 | |
\W | 알파벳이나 숫자를 제외한 문자 | |
\d | [0-9] 숫자 | |
\D | 숫자를 제외한 모든 문자 | |
(?i) | 대소문자를 구분하지 않습니다. | |
자바 정규 표현식