본 발명은 태그를 이용한 웹 페이지 간의 유사도 측정 방법에 관한 것으로, 해결하고자 하는 기술적 과제는 하나의 태그가 다른 태그와 같이 사용되었을 때 각각의 추상 클래스에 속할 확률을 계산함으로써, 해당 태그가 어떤 의미로 사용되었는지를 추정할 수 있으며, 이에 따라 웹 페이지 간의 유사도를 더욱 정확하게 측정할 수 있는 태그를 이용한 웹 페이지 간의 유사도 측정 방법을 제공하는데 있다. 이를 위해 본 발명에 따른 태그를 이용한 웹 페이지 간의 유사도 측정 방법은 웹 페이지와 그에 대한 태그들을 동시 발생 데이터로 보고, 주어진 웹 페이지들과 그들에 대한 태그들 및 시스템에 기설정된 추상 클래스로부터 SMM을 구하는 SMM 구축단계 및 상기 SMM 구축단계에 의한 결과 값을 사용하여 비교 대상인 웹 페이지들에 대한 태그들이 상기의 같은 추상 클래스에 포함될 확률을 계산하여 이를 바탕으로 상기 웹 페이지들 간의 유사도를 구하는 유사도 측정단계를 포함하는 것을 특징으로 하는 태그를 이용한 웹 페이지 간의 유사도 측정 방법을 개시한다.