본문 바로가기

[학과공부]/[논문 요약]

유사한 인기도 추세를 갖는 웹 객체들의 클러스터링


k-means알고리즘과 DBSCAN 알고리즘을 가지고 n-차원의 객체벡터를 구한후(객체 클러스터링)에 웹 객체벡터들의 gap차이(인기도)를 구하는 논문임. 결국 gap척도를 구하는데, 원래는 DTW나 유클리드 거리법으로 계산이 가능하지만 계산대상이 늘어남에 따라 시간도 그만큼 늘어나므로 너무 비효율적이다. 물론 웹 벡터로 봤을 때 그 gap척도를 가시적으로 보여주기 위해서 가우스 가중치라는 걸 구하는데 이는 일단 제쳐두구.. 아무튼...
그래서 이 gap척도를 구하는데 있어서 CC(Circular Correlation)를 이용한 CCV(Circular Correlation Vector)를 이용하여 gap척도를 구하면 엄청 빠르다. 이 CCV를 이용한 gap 척도의 효율적인 계산법을 논문에서 제안하였다.
그리고 Google Trends에서 검색어에 대한 통계자료를 이용하여 논문에서는 실험을 하였다고 한다.

관련 ppt를 첨부한다.

앞으로 읽는 논문 족족히 요약해서 여기 블로그에 올려야겠다.
반응형