Chapter 18. 그래프 기본 탐색 알고리즘: 너비 우선 탐색(BFS)
- TOC {:toc}
이 글은 패스트 캠퍼스 기술면접 완전 정복 올인원 패키지 Online ’Chapter 18. 그래프 기본 탐색 알고리즘: 너비 우선 탐색(BFS)’의 강의내용을 정리하기 위해 강의 자료를 기반으로 작성한 글입니다.
강의 노트는 강의 구매자에게만 제공되는 자료이긴 하지만 잔재미 코딩의 3. 너비 우선 탐색 (Breadth-First Search)에서 동일한 자료를 제공하고 있기 때문에 해당 자료를 기반으로 정리한 글을 작성해서 올립니다. 혹시 문제가 되는 경우 바로 내릴 예정이니 알려주시면 감사하겠습니다.
내용을 이해하기 위한 개인적인 설명이나 해석이 있을 수 있기 때문에 되도록 원문을 참고해주시길 바랍니다. 잘못된 부분이 있다면 댓글이나 그 외 편하신 방법으로 알려주시면 감사하겠습니다.
1. BFS 와 DFS 란?
- 그래프 탐색: 특정 노드를 찾아가는 것이다.
- 대표적인 그래프 탐색 알고리즘
- 너비 우선 탐색 (Breadth First Search): 정점들과 같은 레벨에 있는 노드들 (형제 노드들)을 먼저 탐색하는 방식
- 깊이 우선 탐색 (Depth First Search): 정점의 자식들을 먼저 탐색하는 방식
BFS/DFS 방식 이해를 위한 예제
- BFS 방식: A - B - C - D - G - H - I - E - F - J
- 한 단계씩 내려가면서, 해당 노드와 같은 레벨에 있는 노드들 (형제 노드들)을 먼저 순회함
- DFS 방식: A - B - D - E - F - C - G - H - I - J
- 한 노드의 자식을 타고 끝까지 순회한 후, 다시 돌아와서 다른 형제들의 자식을 타고 내려가며 순화함
2. 파이썬으로 그래프를 표현하는 방법
- 파이썬에서 제공하는 딕셔너리와 리스트 자료 구조를 활용해서 그래프를 표현할 수 있음
그래프 예와 파이썬 표현
- 노드는 딕셔너리의 key로 만든다.
- 해당 노드의 인접 노드들의 리스트를 value로 만든다.
graph = dict()
graph['A'] = ['B', 'C']
graph['B'] = ['A', 'D']
graph['C'] = ['A', 'G', 'H', 'I']
graph['D'] = ['B', 'E', 'F']
graph['E'] = ['D']
graph['F'] = ['D']
graph['G'] = ['C']
graph['H'] = ['C']
graph['I'] = ['C', 'J']
graph['J'] = ['I']
graph
# 출력 결과
# {'A': ['B', 'C'],
# 'B': ['A', 'D'],
# 'C': ['A', 'G', 'H', 'I'],
# 'D': ['B', 'E', 'F'],
# 'E': ['D'],
# 'F': ['D'],
# 'G': ['C'],
# 'H': ['C'],
# 'I': ['C', 'J'],
# 'J': ['I']}
3. BFS 알고리즘 구현
자료구조 큐를 활용함
need_visit
큐와visited
큐, 두 개의 큐를 생성need_visit
큐: 방문해야 하는 노드를 담는 큐visited
큐: 이미 방문한 노드를 담는 큐
큐의 구현은 간단히 파이썬 리스트를 활용
- 딕셔너리에서 첫 key 값(e.g., A)을 꺼내
need_visit
큐에 넣는다. need_visit
큐에서 첫 값을 pop 해visited
큐에 존재하는지 확인한다.- 존재하지 않으면
visited
큐에 넣는다.- 존재하면 아무것도 하지 않고
need_visit
큐의 다음 값으로 넘어간다.
- 존재하면 아무것도 하지 않고
visited
큐에 넣을 때마다 그 값을 key로 갖는 value(e.g., B, C)를need_visit
큐에 넣는다.- 위의 과정을 반복한다.
위 그림의 초반 진행 순서를 나타내면 다음과 같다.
순서 | 대기 | 큐 | ||||||
---|---|---|---|---|---|---|---|---|
0 | visited | |||||||
need_visit | A | |||||||
1 | A | visited | ||||||
need_visit | ||||||||
2 | visited | A | ||||||
need_visit | B | C | ||||||
3 | B | visited | A | |||||
need_visit | C | |||||||
4 | visited | A | B | |||||
need_visit | C | A | D | |||||
5 | C | visited | A | B | ||||
need_visit | A | D | ||||||
6 | visited | A | B | C | ||||
need_visit | A | D | A | G | H | I | ||
7 | A | visited | A | B | C | |||
need_visit | D | A | G | H | I | |||
8 | D | visited | A | B | C | |||
need_visit | A | G | H | I | ||||
… | … | … |
# data 생성
data = [1, 2, 3]
data.extend([4, 5])
data # [1, 2, 3, 4, 5]
# bfs 탐색
# graph: 탐색할 그래프
# start_node: 시작할 노드
def bfs(graph, start_node):
visited = list()
need_visit = list()
need_visit.append(start_node)
# need_visit에 원소가 없으면 모든 데이터를 다 순회했다고 볼 수 있어서
# need_visit가 원소를 갖는지 아닌지를 조건으로 준다.
while need_visit:
# 첫 원소를 pop 한다.
node = need_visit.pop(0)
# node가 visited에 존재하지 않으면
if node not in visited:
# visited에 추가하고
visited.append(node)
# 해당 값을 key로 갖는 value 리스트를 need_visit에 추가한다.
need_visit.extend(graph[node])
# 완성한 visited를 반환한다.
return visited
# 테스트 코드
bfs(graph, 'A') # ['A', 'B', 'C', 'D', 'G', 'H', 'I', 'E', 'F', 'J']
4. 시간 복잡도
일반적인 BFS 시간 복잡도
- 노드 수: V
- 간선 수: E
- 위 코드에서 while need_visit은 V + E 번 만큼 수행함
- 시간 복잡도: O(V + E)
위 코드에 count를 넣어 while 구문의 반복 횟수를 출력해서 확인해보자.
def bfs(graph, start_node):
visited = list()
need_visit = list()
need_visit.append(start_node)
count = 0
while need_visit:
# while 문이 반복될 때마다 count를 증가
count += 1
node = need_visit.pop(0)
if node not in visited:
visited.append(node)
need_visit.extend(graph[node])
# count를 출력
print (count)
return visited
bfs(graph, 'A')
# 19: 노드 10개 + 간선 9개
# ['A', 'B', 'C', 'D', 'G', 'H', 'I', 'E', 'F', 'J']