역 파일을 생성하는 이유는 수집한 수 많은 웹 페이지 내용과 검색 요청한 내용을 비교하는 비용이 너무 많이 들기 때문입니다.
웹 페이지를 수집하면 수집한 웹 페이지에 몇 개의 형태소가 있는지 DBMS에 저장합니다. 그리고 각 형태소 별로 테이블을 생성하고 테이블에 해당 형태소를 포함하는 웹 페이지 주소를 저장합니다.
이는 검색 요청할 때 역 파일 테이블에 있는 형태소와 비교하여 포함하고 있는 웹 페이지 주소를 빠르게 검색하고 순위화하여 좋은 정보를 제공하기 위한 작업입니다.