[이코테 2021] 11. 이진 탐색(1/2)

Yewon Kim·2022년 7월 9일
0

CodingTest

목록 보기
14/22
post-thumbnail

🔊본 포스팅은 '(이코테 2021) 이것이 취업을 위한 코딩 테스트다 with 파이썬' 유튜브 강의를 수강하고 정리한 글입니다.

이진 탐색 알고리즘

  • 순차 탐색: 리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 확인하는 방법
    - 보통 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용한다.
    - 리스트 내에 데이터가 아무리 많아도 시간만 충분하다면 항상 원하는 원소(데이터)를 찾을 수 있다는 장점이 있다.
    - 데이터의 개수가 N개일 때 최대 N번의 비교 연산이 필요하므로 순차 탐색의 최악의 경우 시간 복잡도는 O(N)이다.
# 순차 탐색 소스코드 구현
def sequential_search(n, target, array):
	# 각 원소를 하나씩 확인하며
    for i in range(n):
    	# 현재 원소가 찾고자 하는 원소와 동일한 경우
        if array[i] == target:
        	return i+1  # 현재의 위치 반환(인덱스는 0부터 시작하므로 1 더하기)

print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.")
input_data = input().split()
n = int(input_data[0])  # 원소의 개수
target = input_data[1]  # 찾고자 하는 문자열

print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.")
array = input().split()

# 순차 탐색 수행 결과 출력
print(sequential_search(n, target, array))
  • 이진 탐색: 정렬되어 있는 리스트에서 탐색 범위를 절반씩 좁혀가며 데이터를 탐색하는 방법
    이진 탐색은 시작점, 끝점, 중간점을 이용하여 탐색 범위를 설정한다.

이진 탐색 동작 예시

  • 이미 정렬된 10개의 데이터 중에서 값이 4인 원소를 찾는 예시를 살펴봅시다.

[Step 1] 시작점: 0, 끝점: 9, 중간점: 4(소수점 이하 제거)

중간점에 위치하는 값인 '8'과 찾고자 하는 값인 '4'와 비교하여 어떤 값이 더 큰지 비교
만약 찾고자 하는 값보다 중간점의 값이 더 크다면 중간점에서부터 오른쪽에 위치한 값들은 확인할 필요가 없다.

[Step 2] 시작점: 0, 끝점: 3, 중간점: 1(소수점 이하 제거)

중간점에 위치하는 값인 '2'보다 우리가 찾고자 하는 값인 '4'가 더 크기 때문에 중간점을 포함해서 왼쪽에 있는 데이터는 확인할 필요가 없다.

[Step 3] 시작점:2, 끝점: 3, 중간점: 2(소수점 이하 제거)

우리가 찾고자 하는 값인 '4'는 인덱스 2에 위치한다는 것을 확인할 수 있다.

- 전체 데이터의 개수는 10개이지만, 이진 탐색을 이용해 총 3번의 탐색으로 원소를 찾을 수 있다.
- 절반씩 데이터를 줄어들도록 만든다는 점은 앞서 다룬 퀵 정렬과 공통점이 있다.

이진 탐색의 시간 복잡도

  • 단계마다 탐색 범위를 2로 나누는 것과 동일하므로 연산 횟수는 log2Nlog_2N에 비례한다.
  • 다시 말해 이진 탐색은 탐색 범위를 절반씩 줄이며, 시간 복잡도는 O(logN)O(logN)을 보장한다.

예를 들어 초기 데이터 개수가 32개일 때,

1. 이상적으로 1단계를 거치면 16개가량의 데이터만 남는다.
2. 2단계를 거치면 8개가량의 데이터만 남는다.
3. 3단계를 거치면 4개가량의 데이터만 남는다.

이진 탐색 소스코드: 재귀적 구현

# 이진 탐색 소스코드 구현 (재귀 함수)
def binary_search(array, target, start, end):
	if start>end:
    	return None
    mid = (start+end)//2
    # 찾은 경우 중간점 인덱스 반환
    if array[mid] == target:
    	return mid
    # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
    elif array[mid] > target:
		return binary_search(array, target, start, mid-1)
    # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
    else:
    	return binary_search(array, target, mid+1, end)
        
# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# 전체 원소 입력 받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
	print("원소가 존재하지 않습니다.")
else:
	print(result+1)

이진 탐색 소스코드: 반복문 구현

# 이진 탐색 소스코드 구현(반복문)
def binary_search(array, target, start, end):
	while start<=end:
    	mid = (start+end)//2
        # 찾은 경우 중간점 인덱스 반환
        if array[mid] == target:
        	return mid
        elif array[mid] > target:
        	end = mid-1
        else:
        	start = mid+1
    return None
    
# n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기
n, target = list(map(int, input().split()))
# 전체 원소 입력 받기
array = list(map(int, input().split()))

# 이진 탐색 수행 결과 출력
result = binary_search(array, target, 0, n-1)
if result == None:
	print("원소가 존재하지 않습니다.")
else:
	print(result+1)

파이썬 이진 탐색 라이브러리

  • bisect_left(a,x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 왼쪽 인덱스를 반환
  • bisect_right(a,x): 정렬된 순서를 유지하면서 배열 a에 x를 삽입할 가장 오른쪽 인덱스를 반환

from bisect import bisect_left, bisect_right

a = [1,2,4,4,8]
x = 4

print(bisect_left(a,x))
print(bisect_right(a,x))

[실행 결과]

2
4

값이 특정 범위에 속하는 데이터 개수 구하기

from bisect import bisect_left, bisect_right

# 값이 [left_value, right_value]인 데이터의 개수를 반환하는 함수
def count_by_range(a, left_value, right_value):
	right_index = bisect_right(a, right_value)
    left_index = bisect_left(a, left_value)
    return right_index - left_index
    
# 배열 선언
a = [1,2,3,3,3,3,4,4,8,9]

# 값이 4인 데이터 개수 출력
print(count_by_range(a,4,4))

# 값이 [-1,3] 범위에 있는 데이터 개수 출력
print(count_by_range(a,-1,3))

[실행 결과]

2
6
  • 파라메트릭 서치란 최적화 문제를 결정 문제('예' 혹은 '아니오')로 바꾸어 해결하는 기법이다.
    최적화 문제: 문제의 상황을 만족하는 특정 변수의 최소값, 최대값을 구하는 문제
    (예시) 특정한 조건을 만족하는 가장 알맞은 값을 빠르게 찾는 최적화 문제
  • 일반적으로 코딩 테스트에서 파라메트릭 서치 문제는 이진 탐색을 이용하여 해결할 수 있다.

0개의 댓글