[Algorithm] 이진탐색 (Binary Search)

SunYerim·2024년 3월 20일
0

자료구조, 알고리즘

목록 보기
16/16

1. 순차탐색

N개의 데이터가 있을 때, 그 데이터를 차례대로 하나씩 확인하여 어떠한 처리를 해준 경우 → 순차 탐색

리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법

보통, 정렬되지 않은 리스트에서 데이터를 찾아야 할 때 사용함.

2. 이진 탐색: 반으로 쪼개면서 탐색하기

이진탐색은 배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘.

위치를 나타내는 변수 3개를 사용하는데 탐색하고자 하는 범위의 시작점, 끝점, 중간점이다. 찾으려는 데이터의 중간점 위치에 있는 데이터를 반복적으로 비교해서 원하는 데이터를 찾는 게 이진 탐색 과정.

mid = (start + end) // 2 ⇒ 중간점

  • 변수 3개 사용: 탐색하고자 하는 범위의 시작점, 끝점, 중간점
  • 한 번 확인할 때마다 확인하는 원소의 개수가 절반씩 줄어든다는 점에서 시간 복잡도가 O(logN)O(logN)
#재귀 함수로 구현한 이진 탐색 코드
def binary_search(array, target, start, end):
	if start > end:
			return None
	mid = (start + end) // 2
	# 찾은 경우 중간점 인덱스를 반환
	if array[mid] == target:
		return mid;
	# 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
	elif array[mid] > target:
		return binary_search(array, target, start, mid-1)
	# 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
	else:
		return binary_search(array, target, mid+1, end)
		
	#n(원소의 개수)과 target(찾고자하는 문자열) 입력받기
	n, target = list(map(int, input().split()))
	# 전체원소 입력받기
	array = list(map(int, input().split()))
	
	# 이진 탐색 수행 결과 출력
	result = binary_search(array, target, 0, n-1)
	if result == None:
		print("원소가 존재하지 않습니다.")
	else:
		print(result + 1)
#반복문으로 구현한 이진 탐색 코드
def binary_search(array, target, start, end):
	while start <= end:
		mid = (start + end) // 2
		#찾은 경우 중간점 인덱스 반환
		if array[mid] == target:
			return mid
		# 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인
		elif array[mid] > target:
			end = mid-1
		# 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인
		else:
			start = mid + 1
	return None
		
	#n(원소의 개수)과 target(찾고자하는 문자열) 입력받기
	n, target = list(map(int, input().split()))
	# 전체원소 입력받기
	array = list(map(int, input().split()))
	
	# 이진 탐색 수행 결과 출력
	result = binary_search(array, target, 0, n-1)
	if result == None:
		print("원소가 존재하지 않습니다.")
	else:
		print(result + 1)
10 7
1 3 5 7 9 11 13 15 17 19
4
10 7
1 3 5 6 9 11 13 15 17 19
원소가 존재하지 않습니

코딩 테스트에서 이진 탐색

  • 코딩 테스트의 이진 탐색 문제는 탐색 범위가 큰 상황에서의 탐색을 가정하는 경우가 많음
    • 탐색 범위가 2,000만을 넘어가는 경우 이진 탐색으로 문제 접근
  • 처리해야 할 데이터 개수나 값이 1,000만 단위 이상으로 넘어가면 이진 탐색과 같이 O(logN)O(logN)의 속도를 내야 하는 알고리즘을 떠올려야 문제를 풀 수 있는 경우가 많음

트리구조

트리 자료구조는 노드와 노드의 연결로 표현하며 여기에서 노드는 정보의 단위로서 어떠한 정보를 가지고 있는 개체로 이해할 수 있음.

트리 자료구조는 그래프 자료구조의 일종으로 db 시스템이나 파일 시스템과 같은 곳에서 많은 양의 데이터를 관리하기 위한 목적으로 사용함.

  • 트리는 부모 노드와 자식 노드의 관계로 표현됨.
  • 트리의 최상단 노드를 루트 노드라고 함.
  • 트리의 최하단 노드를 단말 노드라고 함.
  • 트리에서 일부를 떼어내도 트리 구조이며 이를 서브 트리라 함.
  • 트리는 파일 시스템과 같이 계층적이고 정렬된 데이터를 다루기에 적합함.

큰 데이터를 처리하는 sw는 대부분 데이터를 트리 잘구조로 저장해서 이진 탐색과 같은 탐색 기법을 이용해 빠르게 탐색이 가능함.

이진 탐색 트리

이진 탐색이 동작할 수 있도록 고안된, 효율적인 탐색이 가능한 자료구조.

  • 이진 트리이면서 각 노드에 하나의 키를 저장
  • 부모 노드보다 왼쪽 자식 노드가 작다.
  • 부모 노드보다 오른쪽 자식 노드가 크다.
  • 왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드
profile
내 안에 있는 힘을 믿어라.

0개의 댓글