[Algorithm] 배열 2

한결·2023년 2월 6일
0

Algorithm

목록 보기
2/23

2차원 배열

2차원 배열의 선언

  • 1차원 리스트를 묶어놓은 리스트
  • 2차원 이상의 다차원 리스트는 차원에 따라 인덱스를 선언
  • 2차원 리스트의 선언 : 행의 개수, 열의 개수를 필요로함
  • 파이썬에서는 데이터 초기화를 통해 변수 선언과 초기화가 가능함

arr = [[1,2,3,4],[5,6,7,8]] (2행, 4열)

N = int(input())
arr = [list(map(int,input().split())) for i in range(N)]

배열 순회

  • n X m 배열의 n*m 개의 모든 원소를 빠짐없이 조사하는 방법

  • 행 우선 순회

# i 행의 좌표
# j 열의 화표
for i in range(n):
    for j in range(m):
        Array[i][j]
  • 열 우선 순회
# i 행의 좌표
# j 열의 화표
for j in range(n):
    for i in range(m):
        Array[i][j]
  • 지그재그 순회
# i 행의 좌표
# j 열의 화표
for i in range(n):
    for j in range(m):
        Array[i][j - (m-1-2*j)*(i%2)]

델타를 이용한 2차 배열 탐색

# 상하좌우 방향 
N = 3

di = [0,1,0,-1]
dj = [1,0,-1,0]

for i in range(N):
    for j in range(N):
        for k in range(4):
            ni,nj = i + di[k], j + dj[k]
            if 0 <= ni < N and 0 <= nj < N:
                print(i,j,ni,nj)      

# 상하좌우 방향 2개씩

전치 행렬

# i 행
# j 열
arr = [[1,2,3],[4,5,6],[7,8,9]]

for i in range(3):
    for j in range(3):
        if i < j:
            arr[i][j], arr[j][i] = arr[j][i], arr[i][j]

비트 연산자

& : 비트 단위로 AND 연산을 한다
| : 비트 단위로 OR 연산을 한다
<< : 피연산자의 비트 열을 왼쪽으로 이동시킨다.
>> : 피연산자의 비트 열을 오른쪽으로 이동시킨다.

  • << 연산자

    • 1 << n : 2^2 즉, 원소가 n개일 경우의 모든 부분집합의 수를 의미한다
  • & 연산자

    • i & (1<<j) : i의 j번째 비트가 1인지 아닌지를 검사한다
  • 부분집합 생성

arr = [3,6,7,1,5,4]

n= len(arr) 

for i in range(1<<n) : # 1<<n : 부분 집합의 개수 
    for j in range(n): # 원소의 수만큼 비트를 비교함
         if i & (1<<j): # i의 j번 비트가 1인 경우 
             print(arr[j], end = ", ") # j번 원소 출력 
    print()
print()

검색

  • 저장되어 있는 자료 중에서 원하는 항목을 찾는 작업

  • 목적하는 탐색키를 가진 항목을 찾는 것

  • 검색의 종류

    • 순차 검색
    • 이진 검색
    • 해쉬

순차 검색

  • 일렬로 되어 있는 자료를 순서대로 검색하는 방법
    • 가장 간단하고 직관적
    • 배열이나 연결 리스트 등 순차 구조로 구현된 자료구조에서 원하는 항목을 찾을 때 유용
    • 알고리즘이 단순하여 구현이 쉽지만, 검색 대상의 수가 많은 경우에는 수행시간이 급격히 증가하여 비효율적
  • 2가지 경우
    • 정렬되어 있지 않은 경우
    • 정렬되어 있는 경우

정렬되어 있지 않은 경우

  • 검색과정
    • 첫 번째 원소부터 순서대로 검색 대상과 키 값이 같은 원소가 있는지 비교하며 찾는다
    • 키 값이 동일한 원소를 찾으면 그 원소의 인덱스를 반환한다.
    • 자료구조의 마지막에 이를 때까지 검색 대상을 찾지 못하면 검색 실패
  • 찾고자 하는 원소의 순서에 따라 비교회수가 결정됨
    • 첫 번째 원소를 찾을 때는 1번 비교, 두 번째 원소를 찾을 때는 2번 비교
    • 정렬되지 않은 자료에서의 순차 검색의 평균 비교 회수
      • = (1/n)*(1 + 2 + 3 +...+ n-1 + n)
        = (n + 1)/2
      • 시간 복잡도 : O(n)
def sequentialsearch(a, n, key):
    i <- 0
    while i < n and a[i]!=key:
        i <- i+1
    if i < n : return i
    else : return -1

정렬되어 있는 경우

  • 검색 과정
    • 자료가 오름차순으로 정렬된 상태에서 검색을 실시한다고 가정하자
    • 자료를 순차적으로 검색하면서 키 값을 비교, 원소의 키 값이 검색 대상의 키 값보다 크면 찾는 원소가 없다는 것이므로 더 이상 검색하지 않고 검색을 종료
  • 찾고자 하는 원소의 순서에 따라 비교회수가 결정됨
    • 정렬이 되어 있으므로, 검색 실패를 반환하는 경우 평균 비교 회수가 반으로 줄어듦
    • 시간복잡도 : O(n)
def sequentualsearch2(a, n, key):
    i <- 0
    while i<n and a[i]<key:
        i <- i+1
    if i<n and a[i]<key :
        return i
    else:
        return -1

이진 검색

  • 자료의 가운데에 있는 항목의 키 값과 비교하여 다음 검색의 위치를 결정하고 검색을 계속 진행하는 방법

    • 목적 키를 찾을 때까지 이진 검색을 순환적으로 반복 수행함으로써 검색 범위를 반으로 줄려가면서 보다 빠르게 검색을 수행
  • 이진 검색을 하기 위해서는 자료가 정렬된 상태여야 한다

  • 검색 과정

    1. 자료의 중앙에 있는 원소를 고른다
    2. 중앙 원소의 값과 찾고자 하는 목표 값을 비교한다.
    3. 목표 값이 중앙 원소의 값보다 작으면 자료의 왼쪽 반에 대해서 새로 검색을 수행하고, 크다면 자료의 오른쪽 반에 대해서 새로 검색을 수행한다
    • 찾고자 하는 값을 찾을 때까지 1~3의 과정 반복
  • 구현

    • 검색 범위의 시작점과 종료점을 이용하여 검색을 반복 수행한다
    • 이진 검색의 경우, 자료에 삽입이나 삭제가 발생했을 때 배열의 상태를 항상 정렬 상태로 유지하는 추가 작업이 필요하다
def binarySearch(a, N, key):
    start = 0
    end = N-1
    while start <= end :
        middle = (start + end) // 2
        if a[middle]  == key : # 검색 성공
            return True
        elif: a[middle] > key:
            end = middle -1
        else:
            start = middle -1 
    return False # 검색 실패 
# 재귀 함수 이용
# 이진 검색은 반복구조가 더 빠르긴 함 
def binarysearch2(a, low ,high, key):
    if low > high : # 검색 실패 
        return False
    else:
        middle = (low + high) // 2
        if key == a[middle] : # 검색 성공
            return True
        elif key < a[middle] :
            return binarysearch2(a, low, middle -1, key)
        elif a[middle] < key:
            return binarysearch2(a, middle+1, high, key)

인덱스

  • 인덱스라는 용어는 database에서 유래 했으며, 테이블에 대한 동작 속도를 높여주는 자료 구조를 일 컫는다. Database 분야가 아닌 곳에서는 Look up table 등의 용어를 사용하기도 한다

  • 인덱스를 저장하는데 필요한 디스크 공간은 보통 테이블을 저장하는데 필요한 디스크 공간보다 작다. 왜냐하면 보통 인덱스는 키- 필드만 갖고 있고, 테이블의 다른 세부 항목들은 갖고 있지 않기 때문

  • 배열을 사용한 인덱스

    • 대량의 데이터를 매번 정렬하면, 프로그램의 반응은 느려질 수 밖에 없다.

    • 이러한 대량 데이터의 성능 저하 문제를 해결하기 위해 배열 인덱스를 사용할 수 있다

    • 원본 데이터에 데이터가 삽입될 경우 상대적으로 크기가 작은 인덱스 배열을 정렬하기 때문에 속도가 빠르다.

선택 정렬

  • 가장 작은 숫자부터 골라서 차례대로 정리
  • 주어진 자료들 중 가장 작은 값의 원소부터 차례대로 선택하여 위치를 교환하는 방식
  • 정렬과정
    • 주어진 리스트 중에서 최소값을 찾는다
    • 그 값을 리스트의 맨 앞에 위치한 값과 교환한다
    • 맨 처음 위치를 제외한 나머지 리스트를 대상으로 위의 과정을 반복한다
  • 시간복잡도
    • O(n2)
  • 알고리즘
def selectionsort(a, n):
    for i in range(n-2):
        min_index = a.index(min(a[i:]))
        if min_index != i:
            a[i], a[min_index] = a[min_index], a[i] 

n_list = [0,2,5,1,9,6,4,7,8,3]
selectionsort(n_list, 10)
print(n_list) # [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

셀렉션 알고리즘

  • 저장되어 있는 자료로 부터 k번째로 큰 혹은 작은 원소를 찾는 방법을 셀렉션 알고리즘이라 한다.
    • 최소값, 최대값 혹은 중간값을 찾는 알고리즘을 의미하기도 한다
  • 선택 과정
    • 셀렉션은 아래와 같은 과정을 통해 이루어진다
      • 정렬 알고리즘을 이용하여 자료 정렬하기
      • 원하는 순서에 있는 원소 가져오기 == 선택정렬 k번만 하고 k-1번 인덱스 값 가져오기
def selectionsortk(a, k):
    for i in range(k): # k번만 선택정렬
        min_index = a.index(min(a[i:]))
        if min_index != i:
            a[i], a[min_index] = a[min_index], a[i] 
    return a[k-1]

n_list = [0,2,5,1,9,6,4,7,8,3]
print(selectionsortk(n_list, 4)) # 3
print(n_list) # [0, 1, 2, 3, 9, 6, 4, 7, 8, 5]

n_list = [0,2,5,1,9,6,4,7,8,3]
print(selectionsortk(n_list, 6)) # 5
print(n_list) # [0, 1, 2, 3, 4, 5, 9, 7, 8, 6]

0개의 댓글