透過您的圖書館登入
IP:216.73.216.155
  • 學位論文

關鍵詞擷取與焦點新聞偵測

Keyterms Extraction and Hot News Detection

指導教授 : 吳昇
若您是本文的作者,可授權文章由華藝線上圖書館中協助推廣。

摘要


關鍵詞擷取技術對於文章知識的重點擷取扮演非常重要的角色。在資訊檢索領域中,對於資訊重點進行擷取也有助於提昇檢索結果的準確度。如何提昇關鍵詞擷取的準確度及關鍵詞擷取的應用也是我們相當有興趣的範圍。 本論文實作了一個關鍵詞擷取的方法,使用TF-IDF演算法計算關鍵詞的權重,並利用引號區塊詞彙擷取及詞彙擴張法產生新詞提昇關鍵詞擷取的準確度,最後將關鍵詞擷取技術應用在焦點新聞偵測的方法。

並列摘要


Keyterm extraction is an important technology of Information Retrieval. For search engine, it could enhance search results’ precision by extracting keyterms of information. We are interested in how to enhance the precision of keyterm extraction, and applications of keyterm extraction. In this thesis, we implemented a method of keyterm extraction. We use the TF-IDF algorithm to evaluate the weight of keyterms, and then improved the precision of keyterm extraction by quotes block extraction and term expansion. Finally, we apply the keyterm extraction method to detect hot news in daily news pool.

並列關鍵字

Hot News Detection TF-IDF Keyterm Extraction

參考文獻


[11] Christopher D. Manning; Prabhakar Raghavan; Hinrich Schütze (2008). Introduction to Information Retrieval. Cambridge University Press. p. 118.
[1] N-gram, http://en.wikipedia.org/wiki/N-gram
[2] UTF-8, https://en.wikipedia.org/wiki/UTF-8
[3] libcurl - the multiprotocol file transfer library, http://curl.haxx.se/libcurl/
[4] WordNet, http://wordnet.princeton.edu/

被引用紀錄


謝育慈(2016)。醫學博碩士論文關鍵詞與MeSH詞彙之對應研究-以臺北醫學大學為例〔碩士論文,淡江大學〕。華藝線上圖書館。https://doi.org/10.6846/TKU.2016.00730
張珮慈(2015)。以專利分析探討積層製造技術發展趨勢〔碩士論文,逢甲大學〕。華藝線上圖書館。https://doi.org/10.6341/fcu.M0263014
劉義民(2014)。NUPedia - 一個新的百科知識編輯系統〔碩士論文,國立中正大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0033-2110201613591432
潘家君(2015)。新聞推薦系統之設計與實作〔碩士論文,國立中正大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0033-2110201614033699

延伸閱讀