정렬 알고리즘

Ryu·2021년 9월 2일
0

Python

목록 보기
9/9
post-thumbnail

정렬 알고리즘


선택 정렬

  • 처리되지 않은 데이터중에서 가장 작은 데이터를 선택해 맨 앞에 있는 데이터와 바꾸는 것을 반복한다.
  • array = [7,5,9,0,3,1,6,2,4,8]
    
    for i in range(len(array)):
        min_index = i #가장작은 원소의 인덱스
        for j in range(i+1, len(array)):
            if array[min_index] > array[j]:
                min_index = j 
        array[i], array[min_index] = array[min_index], array[i]
    
    print(array)

    시간 정렬의 시간 복잡도


    전체 연산 횟수는
    N+(N-1)+(N-2)+...+2
    이는 (N^2 + N -2)/2로 표현되고, 빅오 표기법에 따라 O(N^2)의 시간복잡도를 가진다.

    삽입 정렬


  • 처리되지 않은 데이터를 하나씩 골라 적절한 위치에 삽입
  • 선택 정렬에 비해 구현 난이도가 높은 편이지만, 일반적으로 더 빠르게 동작한다.
  • array = [7,5,9,0,3,1,6,2,4,8]
    
    for i in range(len(array)):
        for j in range(i, 0, -1): # 인덱스 i부터 1까지 1씩 감소하며 반복
            if array[j] < array[j-1]: # 한 칸씩 왼쪽으로 이동
                array[j], array[j-1] = array[j-1], array[j]
            else: # 자기보다 작은 데이터를 만나면 그위치에서 멈춤
                break
    
    print(array)

    삽입 정렬의 시간 복잡도


    삽입 정렬의 시간 복잡도는 O(N^2)이며, 선택 정렬과 마찬가지로 반복문이 두번 중첩되어 사용.
    삽입정렬은 현재 리스트의 데이터가 거의 정렬되어 있는 상태라면 매우 빠르게 동작.
    최선의 경우 O(N)의 시간 복잡도를 가진다.

    퀵 정렬


  • 기준 데이터를 설정하고 그 기준보다 큰 데이터와 작은 데이터의 위치를 바꾸는 방법
  • 일반적인 상황에서 가장 많이 사용되는 정렬 알고리즘 중 하나
  • 병합 정렬과 더불어 대부분의 프로그래밍 언어의 정렬 라이브러리의 근간이 되는 알고리즘
  • 가장 기본적인 퀵 정렬은 첫 번째 데이터를 기준 데이터(Pivot)로 설정한다.

  • 퀵 정렬이 빠른 이유

  • 이상적인 경우 분할이 절반씩 일어난다면 전체 연산 횟수로 O(NlogN)를 기대할 수 있다.
  • 너비 X 높이 = N X logN = NlogN

    퀵 정렬의 시간 복잡도


    퀵 정렬은 평균의 경우 O(NlogN)의 시간 복잡도를 가진다.
    최악의 경우 O(N^2)의 시간 복잡도를 가진다.
    array = [5,7,9,0,3,1,6,2,4,8]
    
    def quick_sort(array, start, end):
        if start >= end: # 원소가 1개인 경우 종료
            return
        pivot = start # 피벗은 첫 번째 원소
        left = start + 1
        right = end
        while(left <= right):
            # 피벗보다 큰 데이터를 찾을 때까지 반복
            while(left <= end and array[left] <= array[pivot]):
                left += 1
            # 피벗보다 작은 데이터를 찾을 때까지 반복
            while(right > start and array[right] >= array[pivot]):
                right -= 1
            if(left > right): # 엇갈렸다면 작은 데이터와 피벗을 교체
                array[right], array[pivot] = array[pivot], array[right]
            else: # 엇갈리지 않았다면 작은 데이터와 큰 데이터를 교체
                array[left], array[right] = array[right], array[left]    
        # 분할 이후 왼쪽 부분과 오른쪽 부분에서 각각 정렬 수행
        quick_sort(array, start, right-1)
        quick_sort(array, right+1, end)
    
    quick_sort(array, 0 , len(array) - 1)
    
    print(array)

    일반적인 퀵정렬의 방식은 이런식으로 구현을 하지만 파이썬의 장점을 살린 방식으로도 구현할 수 있다.

    array = [5,7,9,0,3,1,6,2,4,8]
    
    def quick_sort(array):
        # 리스트가 하나 이하의 원소만을 담고 있다면 종료
        if len(array) <= 1:
            return array
        pivot = array[0]
        tail = array[1:]
    
        left_side = [x for x in tail if x <= pivot] # 분할된 왼쪽 부분
        right_side = [x for x in tail if x > pivot] # 분할된 오른쪽 부분
    
        return quick_sort(left_side) + [pivot] + quick_sort(right_side)
    
    print(quick_sort(array))

    계수 정렬


  • 특정한 조건이 부합할 때만 사용할 수 있지만 매우 빠르게 동작하는 정렬 알고리즘
  • 계수 정렬은 데이터의 크기 범위가 제한되어 정수 형태로 표현할 수 있을 때 사용 가능
  • 데이터의 개수가 N, 데이터(양수)중 최댓값이 K일때 최악의 경우에도 수행 시간 O(N+K)를 보장한다.


  • [step 0]가장 작은 데이터부터 가장 큰 데이터까지 범위가 모두 담길 수 있도록 리스트를 생성.
    정렬할 데이터에서 각각의 데이터가 총 몇번 등장했는지 체크한다.
    결과를 확일 할 떄는 리스트의 첫번쨰 데이터부터 하나씩 그 값만큼 반복하여 인덱스를 출력
    # 모든 원소의 값이 0보다 크거나 같다고 가정
    array = [7,5,9,0,3,1,6,2,9,1,4,8,0,5,2]
    # 모든 범위를 포함하는 리스트 선언(모든 값은 0으로 초기화)
    count=[0]*(max(array)+1)
    
    for i in range(len(array)):
        count[array[i]] += 1 # 각 데이터에 해당하는 인덱스의 값 증가
        
    for i in range(len(count)): # 리스트에 기록된 정렬 정보 확인
        for j in range(count[i]):
            print(i, end=' ') # 띄어쓰기를 구분으로 등장한 횟수만큼 인덱스 출력
    

    계수 정렬의 시간 복잡도


    계수 정렬의 시간 복잡도와 공간복잡도는 모두 O(N+K)
    계수 정렬은 때에 따라서 심각한 비효율성을 초래할 수 있다.
    ex)데이터가 0과 99999999 단 2개만 존재하는 경우
    계수 정렬은 동일한 값을 가지는 데이터가 여러개 등장할 때 효과적으로 사용 가능하다.
    ex)성적의 경우 0점부터 100점까지 분포되어 있어서 계수정렬로 정렬하기 좋다.

    두 배열의 원소 교체

    import sys
    sys.setrecursionlimit(int(1e5))
    input = sys.stdin.readline
    
    n, k = map(int, input().split())
    a = list(map(int, input().split()))
    b = list(map(int, input().split()))
    
    a.sort()
    b.sort(reverse=True)
    
    for i in range(k):
        if a[i] < b[i]:
            a[i], b[i] = b[i], a[i]
        else:
            break
    
    print(sum(a))


  • 매번 배열A에서 가장 작은 원소를 골라서, 배열 B에서 가장 큰 원소와 교체한다.
  • 가장 먼저 배열 A와 B가 주어지면 A에 대하여 오름차순 정렬하고, B에 대하여 내림차순 정렬
  • 이후에 두 배열의 원소를 첫번째 인덱스부터 차례대로 확인하면서 A의 원소가 B의 원소보다 작을 때에만 교체를 수행한다.
  • 이 문제에서는 두 배열의 원소가 최대 100000개 까지 입력될 수 있으므로, 최악의 경우 O(NlogN)을 보장하는 정렬 알고리즘을 이요해야 한다.

  • profile
    쓴다.노트.하는동안.공부

    0개의 댓글