Chapter 18. 그래프 기본 탐색 알고리즘: 너비 우선 탐색(BFS)

TOC {:toc}

이 글은 패스트 캠퍼스 기술면접 완전 정복 올인원 패키지 Online ’Chapter 18. 그래프 기본 탐색 알고리즘: 너비 우선 탐색(BFS)’의 강의내용을 정리하기 위해 강의 자료를 기반으로 작성한 글입니다.

강의 노트는 강의 구매자에게만 제공되는 자료이긴 하지만 잔재미 코딩의 3. 너비 우선 탐색 (Breadth-First Search)에서 동일한 자료를 제공하고 있기 때문에 해당 자료를 기반으로 정리한 글을 작성해서 올립니다. 혹시 문제가 되는 경우 바로 내릴 예정이니 알려주시면 감사하겠습니다.

내용을 이해하기 위한 개인적인 설명이나 해석이 있을 수 있기 때문에 되도록 원문을 참고해주시길 바랍니다. 잘못된 부분이 있다면 댓글이나 그 외 편하신 방법으로 알려주시면 감사하겠습니다.

1. BFS 와 DFS 란?

그래프 탐색: 특정 노드를 찾아가는 것이다.
대표적인 그래프 탐색 알고리즘
- 너비 우선 탐색 (Breadth First Search): 정점들과 같은 레벨에 있는 노드들 (형제 노드들)을 먼저 탐색하는 방식
- 깊이 우선 탐색 (Depth First Search): 정점의 자식들을 먼저 탐색하는 방식

BFS/DFS 방식 이해를 위한 예제

BFS 방식: A - B - C - D - G - H - I - E - F - J
- 한 단계씩 내려가면서, 해당 노드와 같은 레벨에 있는 노드들 (형제 노드들)을 먼저 순회함
DFS 방식: A - B - D - E - F - C - G - H - I - J
- 한 노드의 자식을 타고 끝까지 순회한 후, 다시 돌아와서 다른 형제들의 자식을 타고 내려가며 순화함

BFS vs DFS

2. 파이썬으로 그래프를 표현하는 방법

파이썬에서 제공하는 딕셔너리와 리스트 자료 구조를 활용해서 그래프를 표현할 수 있음

그래프 예와 파이썬 표현

노드는 딕셔너리의 key로 만든다.
해당 노드의 인접 노드들의 리스트를 value로 만든다.

bfs graph

graph = dict()

graph['A'] = ['B', 'C']
graph['B'] = ['A', 'D']
graph['C'] = ['A', 'G', 'H', 'I']
graph['D'] = ['B', 'E', 'F']
graph['E'] = ['D']
graph['F'] = ['D']
graph['G'] = ['C']
graph['H'] = ['C']
graph['I'] = ['C', 'J']
graph['J'] = ['I']

graph
# 출력 결과
# {'A': ['B', 'C'],
#  'B': ['A', 'D'],
#  'C': ['A', 'G', 'H', 'I'],
#  'D': ['B', 'E', 'F'],
#  'E': ['D'],
#  'F': ['D'],
#  'G': ['C'],
#  'H': ['C'],
#  'I': ['C', 'J'],
#  'J': ['I']}

3. BFS 알고리즘 구현

자료구조 큐를 활용함

need_visit 큐와 visited 큐, 두 개의 큐를 생성
need_visit 큐: 방문해야 하는 노드를 담는 큐
visited 큐: 이미 방문한 노드를 담는 큐

bfs queue

큐의 구현은 간단히 파이썬 리스트를 활용

딕셔너리에서 첫 key 값(e.g., A)을 꺼내 need_visit 큐에 넣는다.
need_visit 큐에서 첫 값을 pop 해 visited 큐에 존재하는지 확인한다.
존재하지 않으면 visited 큐에 넣는다.
- 존재하면 아무것도 하지 않고 need_visit 큐의 다음 값으로 넘어간다.
visited 큐에 넣을 때마다 그 값을 key로 갖는 value(e.g., B, C)를 need_visit 큐에 넣는다.
위의 과정을 반복한다.

위 그림의 초반 진행 순서를 나타내면 다음과 같다.

순서	대기	큐
0		visited
		need_visit	A
1	A	visited
		need_visit
2		visited	A
		need_visit	B	C
3	B	visited	A
		need_visit	C
4		visited	A	B
		need_visit	C	A	D
5	C	visited	A	B
		need_visit	A	D
6		visited	A	B	C
		need_visit	A	D	A	G	H	I
7	A	visited	A	B	C
		need_visit	D	A	G	H	I
8	D	visited	A	B	C
		need_visit	A	G	H	I
…		…	…

# data 생성
data = [1, 2, 3]
data.extend([4, 5])

data # [1, 2, 3, 4, 5]

# bfs 탐색
# graph: 탐색할 그래프
# start_node: 시작할 노드
def bfs(graph, start_node):
    visited = list()
    need_visit = list()

    need_visit.append(start_node)
    
    # need_visit에 원소가 없으면 모든 데이터를 다 순회했다고 볼 수 있어서
    # need_visit가 원소를 갖는지 아닌지를 조건으로 준다.
    while need_visit:
        # 첫 원소를 pop 한다.
        node = need_visit.pop(0)
        # node가 visited에 존재하지 않으면
        if node not in visited:
            # visited에 추가하고
            visited.append(node)
            # 해당 값을 key로 갖는 value 리스트를 need_visit에 추가한다.
            need_visit.extend(graph[node])
    
    # 완성한 visited를 반환한다.
    return visited

# 테스트 코드
bfs(graph, 'A') # ['A', 'B', 'C', 'D', 'G', 'H', 'I', 'E', 'F', 'J']

4. 시간 복잡도

일반적인 BFS 시간 복잡도

노드 수: V
간선 수: E
- 위 코드에서 while need_visit은 V + E 번 만큼 수행함
시간 복잡도: O(V + E)

위 코드에 count를 넣어 while 구문의 반복 횟수를 출력해서 확인해보자.

def bfs(graph, start_node):
    visited = list()
    need_visit = list()

    need_visit.append(start_node)
    count = 0
    while need_visit:
        # while 문이 반복될 때마다 count를 증가
        count += 1
        node = need_visit.pop(0)
        if node not in visited:
            visited.append(node)
            need_visit.extend(graph[node])
    # count를 출력
    print (count)
    return visited

bfs(graph, 'A')
# 19: 노드 10개 + 간선 9개
# ['A', 'B', 'C', 'D', 'G', 'H', 'I', 'E', 'F', 'J']