2.4.1 삽입 정렬 알고리즘 분석

이번에는 삽입 정렬 알고리즘을 분석해 보기로 해요.

삽입 정렬(base:배열의 시작 주소, n: 원소 개수, compare:비교 논리)

반복(i:=1->n)

반복(j:=i->0)

조건(compare(base[j-1], base[j]) > 0)

교환(base[j-1],base[j])

조건이 거짓일 때

내부 반복문 탈출

삽입 정렬 알고리즘을 보면 반복문 내부에 반복문이 있는 구조입니다. 먼저 내부의 반복문에서 하는 일이 무엇인지 알아봅시다.

삽입 정렬 알고리즘의 내부 반복문에서는 j값을 i부터 0까지 점점 감소하며 작업을 수행하죠. 따라서 루프 변성은 j값이 변하는 것이예요. 그리고 배열의 j-1번째 요소와 j번째 요소와 비교하여 j번째 요소가 작으면 위치를 교환하죠. 이처럼 수행하면 배열의 j번째 요소부터 i번째 요소 중에서 제일 작은 값이 있는 위치는 j이죠. 따라서 루프 불변성은 배열의 j번째 요소부터 i번째 요소 중에서 제일 작은 값은 j번째에 있다는 것이예요. 특히 내부 반복문을 수행하기 전에 선행 조건이 i 이전의 요소들은 정렬 상태라는 것이예요. 따라서 내부 반복문을 수행하면 i번째 요소까지 정렬 상태로 변합니다.

이번에는 내부 반복문을 감싸고 있는 외부 반복문을 살펴보아요. i는 1에서 n까지 순차적으로 증가하고 있어요. 내부 반복문을 수행하면 i번째 요소까지 정렬 상태로 변하죠. 따라서 외부 반복문을 수행하면 전체 요소를 정렬할 수 있다는 것을 증명할 수 있어요.

이번에는 삽입 정렬 알고리즘 성능을 분석합시다.

삽입 정렬의 내부 반복문의 수행 시간을 S(i)라고 가정할게요. 내부 반복문은 j가 i에서 0까지 점점 감소하므로 최악일 때 비교를 i번 수행하고 교환도 i번 수행함을 알 수 있어요. 따라서 S(i) = 2n 이죠.

외부 반복문은 i가 1에서 n까지 순차적으로 증가하면서 내부 반복문을 수행합니다. 수행 시간을 T(n)이라 가정하면 T(n) = S(1) + S(2)+ … +S(n) 이죠.

따라서 T(n) = S(1) + S(2)+ … +S(n) = 2(1 + 2 + … + n)

따라서 T(n)= n(n+1) 이고 점근식 표기에서 높은 차수의 항만 남고 상수를 버리므로 O(n^2)라고 할 수 있습니다. 삽입 정렬도 순차 정렬과 거품 정렬, 선택 정렬처럼 O(n^2)이네요.

하지만 앞에서부터 특정 위치까지 정렬 상태에서 삽입 정렬을 사용하면 다른 정렬 방식에 비해 뛰어난 성능을 발휘할 수 있습니다.