백준 2805. 나무 자르기 코드 분석

고봉진·2023년 3월 30일

메모리 최적화 백준 성능최적화 엄밀한 접근 이분 탐색 이진 탐색 재귀함수 코드 분석 코딩테스트 파이썬

TIL/코딩테스트

목록 보기

22/27

[Silver II] 나무 자르기 - 2805

문제 링크

나무의 길이의 범위가 1에서 1_000_000_000까지이고, 리스트의 길이는 최대 1_000_000이므로 매번 전체 리스트를 순회해야한다면 최악의 경우 30_000_000의 단위로 연산이 들어갈 수 있다. 자칫하면 시간 초과가 날 수 있는 문제.

코드 분석

내 코드

n, m, *ls = map(int, open(0).read().split())

def f(ls: list) -> int:
    min_ls = min(ls)
    max_ls = max(ls)
    n = len(ls)
    s = sum(ls)-n*min_ls

    if s <= m:
        return min_ls-(m-s+n-1)//n
    else:
        l,r = min_ls, max_ls
        while l <= r:
            mid = (l+r)//2
            ls_to_pass = []
            cut = 0
            for i, j in enumerate(ls):
                if j-mid > 0:
                    cut += j-mid
                    ls_to_pass.append(j)
            
            if cut > m:
                ls.clear()
                return f(ls_to_pass)
            else:
                r = mid-1


print(f(ls))

메모리: 149680 KB, 시간: 4448 ms

엄밀한 접근을 어떻게 해야 잘 할 수 있을까 고민하고 있었다. 특히 이분 탐색같은 경우 종료 조건과, 출력값이 이해가 잘 되지 않았다. 제일 먼저 생각해 본 것은, '가능한 케이스들을 어떻게 분류할 수 있을까'였다. 어떤 케이스들이 존재할까?

크게 두 가지로 나눠보기로 했다. 최소값을 기준으로 잘랐을 때(s = sum(ls)-n*min_ls), m이 크거나 같은 경우와 그렇지 않은 경우. s가 m보다 작거나 같은 경우는 n개씩 늘려가면서 s가 m보다 커지는 바로 그 순간의 값을 반환하면 된다(min_ls-(m-s+n-1)//n). 그렇지 않은 경우에는 끝쪽 경계 r을 줄여가면서 탐색한다. l는 일반적인 이분 탐색에서 자른 나무들의 합이 m보다 작을 때 조정하는데, 이미 위에서 처리되었기 때문에 건드릴 필요가 없다. 다만 재귀할 때 최소값이 증가함에 따라 자연스럽게 올라가게 된다.

양쪽 경계를 최소, 최대값으로 잡고 이분탐색을 진행한다. 재귀함수에 전달할 ls_to_pass를 초기화하고, ls를 순회하며 각 값에서 l과 r의 중간 mid를 뺀 값이 0보다 크면 자른 합 cut에 추가하고 ls_to_pass에 append한다. 같은 경우는 다음 단계에서 필요 없기 때문에 더 큰 값들만 추가하면 된다. 다음 재귀에서 l이 지금 단계의 mid+1이 된다고 생각하면 이해하기 쉽다. 그리고 자른 값 cut이 구하려는 값 m보다 크다면 mid보다 더 큰 값들에 대해 위 과정을 반복하면 된다. 메모리 관리를 위해 ls.clear() 메서드로 각 단계별 리스트를 비운다. cut이 m보다 작다면 r을 낮춘 뒤 다음 루프로 진행한다. 진행할수록 순회할 리스트의 크기를 줄여 메모리 부하와 소요시간이 줄어들도록 설계했다.

알고리즘 풀이 난이도가 올라감에 따라 점점 더 주먹구구식 접근과 시도가 늘어나고 있다. 엄밀한 접근법에 대해 배우려면 어디부터 손을 대야 하는걸까? 좋은 멘토가 있었으면 좋겠다.

parxism 님의 코드 :

import sys
from collections import Counter
n,m = map(int, sys.stdin.readline().split())
trees = Counter(map(int, sys.stdin.read().split()))

s = 1
e = 1000000000

while s<=e:
    mid = (s+e)//2
    tot = sum((h-mid)*i for h,i in trees.items() if h>mid)

    if tot >= m:
        s = mid+1
    elif tot <m:
        e = mid-1

print(e)

메모리 약 121MB, 시간 396ms

Counter를 사용해 자른 합을 구하는 시간을 줄였다.
자른 합이 m보다 같거나 클 때 s를 늘이고 작을때 e를 줄였기 때문에 e를 출력했다.

이분 탐색의 교본으로 삼을 수 있을 정도로 깔끔한 접근이다.

고봉진

이토록 멋진 휴식!

이전 포스트

백준 2108. 통계학 코드 분석

다음 포스트