[알고리즘] Shortest Path / Dijkstra

good_da22·2022년 2월 18일

다익스트라 알고리즘

python for coding test

목록 보기

9/10

최단 경로 알고리즘

최단 경로(Shortest Path)란 말 그대로 가장 짧은 경로를 찾는 알고리즘

한 지점에서 다른 특정 지점까지의 최단 경로를 구해야 하는 경우
모든 지점에서 다른 모든 지점까지의 최단 경로를 모두 구해야 하는 경우

최단 경로 문제는 보통 그래프를 이용해 표현
각 지점은 그래프에서 노드로 표현
지점간 연결된 경로는 그래프에서 간선으로 표현

다익스트라 최단 경로 알고리즘

다익스트라(Dijkstra) 최단 경로 알고리즘

그래프에서 여러 개의 노드가 있을 때, 특정한 노드에서 출발하여 다른 노드로 가는 각각의 최단 경로를 구해주는 알고리즘

음의 간선이 없을 때 정상적으로 작동
실제 GPS 소프트웨어의 기본 알고리즘으로 채택되곤 한다.

기본적으로 그리디 알고리즘으로 분류
매번 가장 비용이 적은 노드를 선택해서 임의의 과정을 반복하기 때문

알고리즘의 원리

출발 노드를 설정
최단 거리 테이블을 초기화
방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택
해당 노드를 거쳐 다른 노드로 가는 비용을 계산, 최단 거리 테이블 갱신
모든 노드를 방문할 때 까지 3, 4의 과정을 반복

최단 거리 테이블 : 최단 경로를 구하는 과정에서 각 노드에 대핸 현재까지의 최단 거리 정보를 저장하는 1차원 리스트

방문하지 않은 노드 중에서 가장 최단 거리가 짧은 노드를 선택 하는 과정을 반복
선택된 노드는 최단 거리가 완전히 선택된 노드로 더 이상 알고리즘을 반복해도 최단 거리가 줄어들지 않는다.

한 단계당 하나의 노드에 대한 최단 거리를 확실하게 찾는 것

간단한 다익스트라 알고리즘

처음 각 노드에 대한 최단 거리를 담는 1차원 리스트 선언
이후에, 단계바마 방문하지 않은 노드 중에서 최단 거리가 가장 짧은 노드를 선택하기 위해 매 단계마다 1차원 리스트의 모든 원소를 확인(순차탐색)

시간 복잡도는 O(V^2)
V는 노드(Vertex)의 개수

import sys
input = sys.stdin.readline
INF = int(1e9) #무한을 의미(10억)

n, m = map(int, input().split()) #노드의 개수 n, 간선의 개수 m
start = int(input()) #시작 노드 번호

graph = [[] for _ in range(n+1)] #각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트

visited = [False] * (n+1) #각 노드에 대한 방문 여부
distance = [INF] * (n+1) #최단 거리 테이블, 무한으로 초기화

for _ in range(m):
  a, b, c = map(int, input().split()) #a번 노드에서 b번노드로 가능 비용 c
  graph[a].append((b, c)) #연결 노드에 대한 정보 저장

def get_smallest_node(): #방문하지 않은 노드 중에서, 가장 최단 거리가 짧은 노드의 번호를 반환
  min_value = INF
  index = 0 #가장 최단 거리가 짧은 노드 번호(인덱스)

  for i in range(1, n+1): #최단 거리 테이블을 순차 탐색
    if distance[i] < min_value and not visited[i]: #방문하지 않은 노드 중에서가장 짧은 최단 거리의 노드를 찾는다.
      min_value = distance[i]
      index = i
    return index

def dijkstra(start): #다익스트라 알고리즘
  distance[start] = 0 #시작 노드 초기화
  visited[start] = True #시작 노드 방문처리
  for i in graph[start]: #시작 노드에 연결된 노드들의 거리 입력
    distance[i[0]] = i[1] #i[0] => 노드 번호, i[1] => start와 연결된 노드 거리

  for _ in range(n-1): #시작 노드를 제외한 n-1개의 노드에 대해 반복
    now = get_smallest_node() #현재 최단 거리가 가장 짧은 노드
    visited[now] = True #현재 노드 방문 처리
    for i in graph[now]: #현재 노드와 연결된 노드 확인
      cost = distance[now] + i[1] #현재 노드를 거쳐서 연결 노드로 가능 거리
      if cost < distance[i[0]]: #현재 노드를 거쳐서 가는 거리가 기존 거리보다 짧은 경우
        distance[i[0]] = cost

dijkstra(start)

for i in range(1, n+1): #1번 노드부터 n번 노드까지 start노드에서 각각의 노드로 가기 위한 최단거리
  if distance[i] == INF: #갈 수 없는 경우 무한
    print('INFINITY')
  else:
    print(distance[i])

총 O(V) 번에 걸쳐서 최단 거리가 가장 짧은 노드를 매번 선형 탐색
현재 노드와 연결된 노드를 매번 일일이 확인

전체 노드의 개수가 5,000개를 넘어가는 문제라면 해결하기 어렵다.

개선된 다익스트라 알고리즘

최악의 경우에도 시간 복잡도 O(ElogV) 보장
V는 노드(vertex)의 개수, E는 간선(Edge)의 개수

최단 거리가 가장 짧은 노드를 선형 탐색이 아닌 힙(Heap) 자료구조를 사용
선형 시간이 아닌 로그 시간 소요, 획기적으로 빨라진다.

힙

힙(Heap) 자료구조는 우선순위 큐(Priority Queue)를 구현하기 위해 사용하는 자료구조 중 하나

우선순위 큐(Priority Queue)

우선순위가 가장 높은 데이터를 가장 먼저 삭제

데이터의 개수가 N개일 때, 하나의 데이터를 삽입 및 삭제하는데 시간 복잡도는 O(logN)

파이썬에서 우선순위 큐사용시 PriorityQueue 혹은 heapq 사용
일반적으로 heapq가 빠르게 동작

정수형 자료형의 변수가 사용되며 첫 번째 원소를 기준으로 우선순위를 설정
파이썬 라이브러리는 최소 힙(Min Heap)구조를 이용, 값이 낮은 데이터가 먼저 삭제된다.

개선된 다익스트라 알고리즘에서 현재 가장 가까운 노드를 저장하기 위한 목적으로 우선순위 큐를 추가로 이용
거리가 짧은 원소가 우선순위 큐의 최상위 원소로 위치
해당 노드를 이미 처리한 적이 있다면 무시하고 아직 처리하지 않은 노드에 대해서만 처리

import heapq
import sys

input = sys.stdin.readline
INF = int(1e9) #무한을 의미하는 값

n, m = map(int, input().split()) #n은 노드의 개수, m은 간선의 개수
start = int(input()) #시작 노드 번호

graph = [[] for _ in range(n+1)] #각 노드에 연결되어 있는 노드에 대한 정보를 담는 리스트
distance = [INF] * (n+1) #최단 거리 테이블 모두 무한으로 초기화

for _ in range(m): #모든 간선 정보 입력 받기
  a, b, c = map(int, input().split()) #a번 노드에서 b번 노드로 가는 거리 c
  graph[a].append((b, c))

def dijkstra(start):
  q = [] #우선순위 큐
  heapq.heappush(q, (0, start)) #시작 노드로 가는 최단 거리는 0, 큐에 삽입
  distance[start] = 0 #시작 노드로의 최단 거리는 0

  while q: #큐를 모두 비울때까지 반복
    dist, now = heapq.heappop(q) #가장 최단 거리가 짧은 노드 정보 큐에서 꺼내기

    if distance[now] < dist: #이미 처리되어 현재 노드(now)까지 거리가 큐에 저장된 최단 거리보다 짧은 경우
      continue #처리된 적이 있는 노드는 무시하고 넘어간다
    
    for  i in graph[now]: #현재 노드와 연결된 다른 인접한 노드 확인
      cost = dist + i[1] #현재 노드를 거쳐서 인접 노드로 가는 비용
      if cost < distance[i[0]]: #현재 노드를 거쳐서 인접 노드로 가는 거리가 더 짧은 경우
        distance[i[0]] = cost #해당 노드의 최단 거리 갱신
        heapq.heappush(q, (cost, i[0])) #갱신된 노드의 정보(거리, 번호)를 큐에 삽입

dijkstra(start)

for i in range(1, n+1): #1 ~ n번 까지의 노드
  if distance[i] == INF:
    print('INFINITY') #도달할 수 없는 경우
  else:
    print(distance[i]) #start 노드부터 각각의 노드까지 최단 거리 출력