[이코테] 이진 탐색

[이코테] 이진 탐색

범위를 반씩 좁혀가는 탐색

순차 탐색

리스트 안에 있는 특정한 데이터를 찾기 위해 앞에서부터 데이터를 하나씩 차례대로 확인하는 방법

리스트에 특정 값의 원소가 있는지 체크할 때 순차탐색을 이용하고, count() 메서드를 이용할 때도 내부에서는 순차탐색을 이용한다.

# 순차 탐색 소스코드 구현 def sequential_search(n, target, array): # 각 원소를 하나씩 확인하며 for i in range(n): # 현재의 원소가 찾고자 하는 원소와 동일한 경우 if array[i] == target: return i + 1 # 현재의 위치 반환 (인덱스는 0부터 시작하므로 1 더하기) return -1 # 원소를 찾지 못한 경우 -1 반환 print("생성할 원소 개수를 입력한 다음 한 칸 띄고 찾을 문자열을 입력하세요.") input_data = input().split() n = int(input_data[0]) # 원소의 개수 target = input_data[1] # 찾고자 하는 문자열 print("앞서 적은 원소 개수만큼 문자열을 입력하세요. 구분은 띄어쓰기 한 칸으로 합니다.") array = input().split() # 순차 탐색 수행 결과 출력 print(sequential_search(n, target, array))

위의 소스코드를 실행하면 이름 문자열이 몇 번째 데이터인지 출력하고,

데이터가 N개일 때 최대 N번의 비교연산이 필요하기 때문에 최악의 경우 시간 복잡도는 O(N)이 된다.

이진 탐색 : 반으로 쪼개면서 탐색하기

배열 내부의 데이터가 정렬되어 있어야만 사용할 수 있는 알고리즘시작점, 끝점, 중간점 세개의 변수를 이용찾으려는 데이터와 중간점 위치에 있는 데이터를 반복적으로 비교해 원하는 데이터를 찾음

이진탐색은 탐색을 할 때마다 확인하는 데이터의 개수가 절반으로 줄어들기 때문에 시간 복잡도가 O(logN)이다.

이진탐색은 재귀 함수를 이용하는 방법과 단순 반복문을 이용하는 방법이 있다.

1) 재귀함수 이용

# 이진 탐색 소스코드 구현 (재귀 함수) def binary_search(array, target, start, end): if start > end: return None mid = (start + end) // 2 # 찾은 경우 중간점 인덱스 반환 if array[mid] == target: return mid # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인 elif array[mid] > target: return binary_search(array, target, start, mid - 1) # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인 else: return binary_search(array, target, mid + 1, end) # n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기 n, target = list(map(int, input().split())) # 전체 원소 입력 받기 array = list(map(int, input().split())) # 이진 탐색 수행 결과 출력 result = binary_search(array, target, 0, n - 1) if result == None: print("원소가 존재하지 않습니다.") else: print(result + 1)

2) 반복문 이용

# 이진 탐색 소스코드 구현 (반복문) def binary_search(array, target, start, end): while start <= end: mid = (start + end) // 2 # 찾은 경우 중간점 인덱스 반환 if array[mid] == target: return mid # 중간점의 값보다 찾고자 하는 값이 작은 경우 왼쪽 확인 elif array[mid] > target: end = mid - 1 # 중간점의 값보다 찾고자 하는 값이 큰 경우 오른쪽 확인 else: start = mid + 1 return None # n(원소의 개수)과 target(찾고자 하는 값)을 입력 받기 n, target = list(map(int, input().split())) # 전체 원소 입력 받기 array = list(map(int, input().split())) # 이진 탐색 수행 결과 출력 result = binary_search(array, target, 0, n - 1) if result == None: print("원소가 존재하지 않습니다.") else: print(result + 1)

코딩 테스트에서의 이진 탐색

이진 탐색 코드는 다른 알고리즘과 함께 사용되는 등 단골로 나오는 문제이기 때문에 외워두는 편이 좋다.

트리 자료구조

이진 탐색은 전제 조건이 데이터 정렬이다.

데이터베이스에서는 내부적으로 트리 자료구조를 이용해 항상 데이터가 정렬되어 있어 이진 탐색을 효과적으로 사용할 수 있다.

트리구조의 특징

트리는 부모 노드와 자식 노드의 관계로 표현

트리의 최상단 노드는 루트 노드, 최하단 노드는 단말 노드

트리에서 일부를 떼어내도 트리구조이며 이를 서브노드라 함

트리는 계층적이고 정렬된 데이터를 다루기에 적합

이진 탐색 트리

이진 탐색 트리의 특징

부모 노드보다 왼쪽 자식 노드가 작음

부모 노드보다 오른쪽 자식 노드가 큼

왼쪽 자식 노드 < 부모 노드 < 오른쪽 자식 노드가 성립해야 이진 탐색 트리를 구현할 수 있다.

빠르게 입력받기

입력 데이터가 1000만개를 넘어가는 경우, sys라이브러리의 readline() 함수를 이용하면 시간 초과를 피할 수 있다.

import sys input_data = sys.stdin.readline().rstrip() print(input_data)

sys라이브러리를 사용할 때는 한 줄 입력 후 rstrip() 함수를 호출해야 입력 후 엔터(공백 문자)를 제거 할 수 있다.

from http://shotory.tistory.com/30 by ccl(A) rewrite - 2021-12-15 00:00:39