Many aspects of the search log (e.g., phrase extraction and query recommendations) have gained much attention from researchers. In this work, we investigate the search log and focus on analyzing user query refinement behaviors. We find that search engine users often specialize and generalize queries in order to get better search results. According to this finding, we further propose the hypothesis that a refinement behavior can be considered a specialized or generalized action of a query term. To verify the hypothesis, we introduce a framework that aims to automatically mine the specialization, generalization, and replacement relationships between terms from the search log. Furthermore, the mining system is built based on a large-scale search log by using the annotations of numerous Web users (i.e., Web users annotate what they want by queries). Our results demonstrate that the semantic relationships between terms can be retrieved by analyzing the searching behaviors of search engine users. We also show the feasibility of systematically creating an ontology using the “wisdom of the crowd.”
近年來,搜尋引擎記錄被廣泛的應用在各個研究領域範疇中,像是關鍵字擷取、查詢詞推薦等等。本研究將針對搜尋引擎記錄進行分析,並把重點放在探討使用者的查詢詞修正行為上。在觀察、研究搜尋引擎記錄的過程中,我們發現許多搜尋引擎的使用者在下查詢詞時,時常使用specialize或是generalize的方式來修正查詢詞,藉著使用更廣義或狹義的查詢詞,希望能獲得更符合其需求的搜尋結果。根據這個觀察結果,我們提出了一個假設:我們認為使用者的查詢詞修正行為,皆能視為是詞彙之間specialize或generalize之語意上的變換。為了進一步對提出的假設進行驗證,我們提出了一個能從搜尋引擎記錄中自動擷取出詞彙之間specialization, generalization, 和replacement等等語意關係的系統。此系統不僅利用資料量龐大的搜尋引擎記錄當作資料來源,並且也彙集了眾多搜尋引擎使用者使用的查詢詞、點擊搜尋結果頁面等等對事物的描述,進而從中擷取出詞彙間的語意關係。我們的研究結果證實了詞彙之間的語意關係,確實能經由分析搜尋引擎使用者的搜尋行為而獲得。同時我們也呈現了一個利用群眾智慧,能系統化自動建立ontology的可行方法。
為了持續優化網站功能與使用者體驗,本網站將Cookies分析技術用於網站營運、分析和個人化服務之目的。
若您繼續瀏覽本網站,即表示您同意本網站使用Cookies。