2004年03月15日
Topic-Sensitive PageRank は Google に導入されているのですか?
Topic-Sensitive PageRank は現時点では Google の検索アルゴリズムには搭載されていないと思われます。それを示す状況が観察できないからです。
■質問
Topic-Sensitive PageRank という、トピックを重視する検索アルゴリズムを Google は採用しているのですか?
■回答
"Topic-Sensitive PageRank: A Context-Sensitive Ranking Algorithm for Web Search" というStanford 大学の大学院生Taher H. Haveliwala氏が書いた論文のことを指していると思われますが、Google は Topic Sensitive PageRank は採用していないと思われます。Google は現在どんな検索アルゴリズムを利用しているか一切明らかにしていないのでわかりませんが、少なくとも現在の Google SERPs では Topic Sensitive PageRank が作用していると思われる状況が確認できないことが理由です。2003年末から2004年初頭にかけての新アルゴリズム導入でも Topic Sensitive PageRank とは異なる検索アルゴリズムが導入されていると考えた方が説明がつくことも理由です。
ちなみに Taher H. Haveliwala 氏は 2003年10月から Google にて働いています。
Taher H. Haveliwala
http://www.stanford.edu/~taherh/
Topic-Sensitive PageRank
http://www.stanford.edu/~taherh/papers/topic-sensitive-pagerank-tkde.pdf
Topic-Sensitive PageRank :: In the original PageRank algorithm for improving the ranking of search-query results, a single PageRank vector is computed, using the link structure of the Web, to capture the relative "importance" of Web pages, independent of any particular search query. To yield more accurate search results, we propose computing a set of PageRank vectors, biased using a set of representative topics, to capture more accurately the notion of importance with respect to a particular topic. By using these (precomputed) biased PageRank vectors to generate query-specific importance scores for pages at query time, we show that we can generate more accurate rankings than with a single, generic PageRank vector. For ordinary keyword search queries, we compute the topic-sensitive PageRank scores for pages satisfying the query using the topic of the query keywords. For searches done in context (e.g., when the search query is performed by highlighting words in a Web page), we compute the topic-sensitive PageRank scores using the topic of the context in which the query appeared.
