N×N개의 수가 N×N 크기의 표에 채워져 있다. (x1, y1)부터 (x2, y2)까지 합을 구하는 프로그램을 작성하시오. (x, y)는 x행 y열을 의미한다.
예를 들어, N = 4이고, 표가 아래와 같이 채워져 있는 경우를 살펴보자.
1 2 3 4
2 3 4 5
3 4 5 6
4 5 6 7
여기서 (2, 2)부터 (3, 4)까지 합을 구하면 3+4+5+4+5+6 = 27이고, (4, 4)부터 (4, 4)까지 합을 구하면 7이다.
표에 채워져 있는 수와 합을 구하는 연산이 주어졌을 때, 이를 처리하는 프로그램을 작성하시오.
첫째 줄에 표의 크기 N과 합을 구해야 하는 횟수 M이 주어진다. (1 ≤ N ≤ 1024, 1 ≤ M ≤ 100,000) 둘째 줄부터 N개의 줄에는 표에 채워져 있는 수가 1행부터 차례대로 주어진다. 다음 M개의 줄에는 네 개의 정수 x1, y1, x2, y2 가 주어지며, (x1, y1)부터 (x2, y2)의 합을 구해 출력해야 한다. 표에 채워져 있는 수는 1,000보다 작거나 같은 자연수이다. (x1 ≤ x2, y1 ≤ y2)
총 M줄에 걸쳐 (x1, y1)부터 (x2, y2)까지 합을 구해 출력한다.
import sys
n, m = list(map(int, sys.stdin.readline().split()))
arr = [[0] * n for _ in range(n)]
for i in range(n):
data = list(map(int, sys.stdin.readline().split()))
for j in range(n):
arr[i][j] = data[j]
dp = [[0] * (n + 1) for _ in range(n + 1)]
# 시간 복잡도 O(N^2)
for i in range(1, n + 1):
for j in range(1, n + 1):
dp[i][j] = dp[i][j - 1] + dp[i-1][j] - dp[i - 1][j - 1] + arr[i - 1][j - 1]
answer = []
for _ in range(m):
x1, y1, x2, y2 = list(map(int, sys.stdin.readline().split()))
# 배열 특성 상 access는 O(1)
answer.append(dp[x2][y2] - dp[x1 - 1][y2] - dp[x2][y1 - 1] + dp[x1 - 1][y1 - 1])
for elem in answer:
print(elem)
브루트 포스를 사용하게 되면, O(m)* O(n^2)이 걸려 시간 초과가 발생한다. 이 문제는 2차원 배열 누적합으로 풀 수 있는 스탠다드 문제라 한다.
초기 세팅은 메모이제이션용 배열을 만드는 것이다. 계산의 편의를 위해 n+1의 크기로 만들고, 바깥쪽 테두리들을 0으로 채운다.
입력을 예로 들면, 다음과 같다.
0 0 0 0 0
0 1 2 3 4
0 2 3 4 5
0 3 4 5 6
0 4 5 6 7
위 dp 기준으로 (2,3)행의 계산을 한다고 해보자. 초기 상태는 다음과 같다.
먼저, 가로 기준으로의 누적합을 얻어낸다. dp(i-1,j)=6
그 다음, 세로 기준으로의 누적합을 얻어낸다. dp(i,j-1)=8
겹치는 부분을 뺀다. dp(i-1,j-1)=3
순수한 (i,j) 부분, 즉 arr(i,j)=4를 더한다.
그러면 dp(i,j) = 6+8-3+4=15가 된다. 이런식으로 누적합 배열을 만들 수 있다.
이 누적합 배열에 대해 dp(x1,y1,x2,y2) = dp(x2,y2)- dp(x1-1,y2) - dp(x2,y1-1) + dp(x1-1,y1-1)
가 성립한다.
여러번 풀어볼 문제. 응용하기 좋은 문제다.