[백준] - 12891 : DNA 비밀번호 - Java

Chooooo·2024년 2월 1일
0

알고리즘/Java

목록 보기
9/16
post-thumbnail

문제

평소에 문자열을 가지고 노는 것을 좋아하는 민호는 DNA 문자열을 알게 되었다. DNA 문자열은 모든 문자열에 등장하는 문자가 {‘A’, ‘C’, ‘G’, ‘T’} 인 문자열을 말한다. 예를 들어 “ACKA”는 DNA 문자열이 아니지만 “ACCA”는 DNA 문자열이다. 이런 신비한 문자열에 완전히 매료된 민호는 임의의 DNA 문자열을 만들고 만들어진 DNA 문자열의 부분문자열을 비밀번호로 사용하기로 마음먹었다.

하지만 민호는 이러한 방법에는 큰 문제가 있다는 것을 발견했다. 임의의 DNA 문자열의 부분문자열을 뽑았을 때 “AAAA”와 같이 보안에 취약한 비밀번호가 만들어 질 수 있기 때문이다. 그래서 민호는 부분문자열에서 등장하는 문자의 개수가 특정 개수 이상이여야 비밀번호로 사용할 수 있다는 규칙을 만들었다.

임의의 DNA문자열이 “AAACCTGCCAA” 이고 민호가 뽑을 부분문자열의 길이를 4라고 하자. 그리고 부분문자열에 ‘A’ 는 1개 이상, ‘C’는 1개 이상, ‘G’는 1개 이상, ‘T’는 0개 이상이 등장해야 비밀번호로 사용할 수 있다고 하자. 이때 “ACCT” 는 ‘G’ 가 1 개 이상 등장해야 한다는 조건을 만족하지 못해 비밀번호로 사용하지 못한다. 하지만 “GCCA” 은 모든 조건을 만족하기 때문에 비밀번호로 사용할 수 있다.

민호가 만든 임의의 DNA 문자열과 비밀번호로 사용할 부분분자열의 길이, 그리고 {‘A’, ‘C’, ‘G’, ‘T’} 가 각각 몇번 이상 등장해야 비밀번호로 사용할 수 있는지 순서대로 주어졌을 때 민호가 만들 수 있는 비밀번호의 종류의 수를 구하는 프로그램을 작성하자. 단 부분문자열이 등장하는 위치가 다르다면 부분문자열이 같다고 하더라도 다른 문자열로 취급한다.

입력

첫 번째 줄에 민호가 임의로 만든 DNA 문자열 길이 |S|와 비밀번호로 사용할 부분문자열의 길이 |P| 가 주어진다. (1 ≤ |P| ≤ |S| ≤ 1,000,000)

두번 째 줄에는 민호가 임의로 만든 DNA 문자열이 주어진다.

세번 째 줄에는 부분문자열에 포함되어야 할 {‘A’, ‘C’, ‘G’, ‘T’} 의 최소 개수가 공백을 구분으로 주어진다. 각각의 수는 |S| 보다 작거나 같은 음이 아닌 정수이며 총 합은 |S| 보다 작거나 같음이 보장된다.

출력

첫 번째 줄에 민호가 만들 수 있는 비밀번호의 종류의 수를 출력해라.

재귀로 다 파악한 안 좋은 코드

public class 백준_12891_DNA비밀번호 {

    static int n, m;
    static Map<Character, Integer> cnt = new HashMap<>();
    static char[] arr = {'A', 'C', 'G', 'T'};
    static int[] arrCount;
    static char[] res;
    static int count;
    public static void main(String[] args) throws IOException {
        System.setIn(new FileInputStream("input.txt"));
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringTokenizer st;

        st = new StringTokenizer(br.readLine());
        n = Integer.parseInt(st.nextToken());
        m = Integer.parseInt(st.nextToken());
        res = new char[m];
        // m개 선택.
        String data = br.readLine();
        for (char c : data.toCharArray()) {
            cnt.put(c, cnt.getOrDefault(c, 0) + 1);  // 사용 가능 횟수 저장
        }
//        System.out.println(cnt.toString());        // 각 필수 개수 체크
        st = new StringTokenizer(br.readLine());
        arrCount = new int[4];
        for (int i = 0; i < 4; i++) {
            arrCount[i] = Integer.parseInt(st.nextToken());
        }

        DFS(0, new int[4]);
        System.out.println(count);
    }

    public static void DFS(int L, int[] use) {
        if (L == m) {  // 모두 선택. 종료조건,
            // 개수 충족했는지 확인
            for (int i = 0; i < 4; i++) {
                if (arrCount[i] > use[i]) {
                    return;
                }
            }
            count += 1;
        } else {  // 계속 뽑아야함 1. 저장된 cnt에서 뽑아서 진행
            for (int i = 0; i < 4; i++) {
                if (cnt.getOrDefault(arr[i], 0) > 0) {
                    cnt.put(arr[i], cnt.get(arr[i]) - 1);  // 하나 사용
                    res[L] = arr[i];
                    use[i] += 1;
                    DFS(L + 1, use);
                    cnt.put(arr[i], cnt.get(arr[i]) + 1);  // 사용한 것도 원상복구
                    use[i] -= 1;  // 백트랙킹 시 원상 복구
                }
            }

        }
    }
}

길이가 1,000,000 즉 10^6이라서 재귀를 이용해서 부분 문자열을 만드는것은 매우 시간이 많이 걸릴 것이다.
-> 따라서 시작 인덱스와 끝 인덱스를 옮기는 슬라이딩 윈도우를 사용해야 한다.

  • 첫 세팅은 시작되는 부분 문자열 0~p-1까지. 첫 부분 문자열을 세팅한 후, 각 문자 하나하나에 대해 A,C,G,T의 개수를 센다.
  • 만약 부분 문자열의 A,C,G,T의 각 개수가 각 문자의 최소문자를 만족하면 cnt += 1
  • 현재 부분 문자열의 각 문자가 최소 문자 개수를 만족하는지 여부를 리턴

슬라이딩 윈도우로 해결한 코드

public class Main {

    static int n, m;
    static Map<Character, Integer> map = new HashMap<>();
    static Map<Character, Integer> now = new HashMap<>();
    static char[] arr = {'A', 'C', 'G', 'T'};
    static Map<Character, Integer> checkCount = new HashMap<>();
    static int count;
    public static void main(String[] args) throws IOException {
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        StringTokenizer st;

        st = new StringTokenizer(br.readLine());
        n = Integer.parseInt(st.nextToken());  // 총 문자열 길이
        m = Integer.parseInt(st.nextToken());  // 원하는 부분 문자열 길이
        String data = br.readLine();
        st = new StringTokenizer(br.readLine());
        for (int i = 0; i < 4; i++) {
            checkCount.put(arr[i], Integer.parseInt(st.nextToken()));
        }

        // 부분 문자열 생성.
        for (int i = 0; i < m; i++) {
            map.put(data.charAt(i), map.getOrDefault(data.charAt(i), 0) + 1);
        }
        if (isCheck()) {
            count += 1;
        }
        for (int i = 0; i < n - m; i++) {
            char s = data.charAt(i);
            char e = data.charAt(i + m);
            map.put(s, map.get(s) - 1);  // 앞에꺼 제거
            if(map.get(s) == 0) map.remove(s);
            map.put(e, map.getOrDefault(e, 0) + 1);  // 마지막 꺼 추가
            if (isCheck()) {
                count += 1;
            }
        }
        System.out.println(count);

    }

    public static boolean isCheck() {
        for (char c : arr) {
            if (map.getOrDefault(c, 0) < checkCount.get(c)) {
                return false;
            }
        }
        return true;
    }
}
profile
back-end, 지속 성장 가능한 개발자를 향하여

0개의 댓글