透過您的圖書館登入
IP:18.218.127.141
  • 學位論文

資訊檢索結合文字探勘之應用-以中醫婦科專題文獻 資料庫為例

Information Retrieval and Text Mining: A Case Study of the Chinese Medicine Gynecology Monographic Database

指導教授 : 歐陽崇榮

摘要


本研究將資訊檢索與文字探勘技術相結合並應用於『中醫藥專題文獻資料庫』中,建立中醫婦科知識主題並利用機器學習的實例學習方式進行肯定(正例)與否定(反例)評價訓練,使中醫藥從業人員能快速檢索到最相關之文獻並促進中醫實證醫學之發展。研究者首先要找出一套穩定的知識主題訓練策略來進行訓練,再以此訓練模式作為範例,供其他使用者參考利用,且可依其需求作適當地調整;主要是透過訓練完成的知識主題分享給他人取用,達到知識交流與分享之目的。 本研究採用文獻分析與系統實證方式,對資訊檢索、文字探勘與中醫藥相關文獻進行探討分析,再實際進行系統實證部份,敘述整體實證過程、舉例並分析其結果;最後歸納出以下結論: (一)建立中醫藥相關詞彙至系統詞庫內為首要之步驟,可提高斷詞與檢索比對結果。 (二)知識主題訓練策略為先收集再過濾,因此要先進行肯定評價訓練(收集相關資料),再進行否定評價訓練(刪除不相關資料)。 (三)訓練文件的選擇要謹慎,對訓練結果影響甚鉅。 (四)知識主題檢索與一般關鍵詞檢索結果相比,精確率確實有所提高;最高可達到100%,其平均值有74%。 (五)中醫藥文獻目前持續成長中,推動中醫實證醫學之發展。 (六)促進中醫藥從業人員間的知識交流,達到知識分享之目的。

並列摘要


This study combines information retrieval with text mining and applies to Chinese Medicine Gynecology Monographic Database. Researcher should find out a set of steady strategy to train first, and then regard this training way as the example, utilize for other users' reference, and can adjust properly in accordance with its demand. This research adopts the literature review and information system attestation methods. Induct the following conclusion: 1.The first step is to build the relevant vocabularies of Chinese Medicine. 2.Secondly the search strategy is established by knowledge title collecting and filtering. 3.The choice of the trained document is prudent. 4.To compare the result of knowledge title retrieval with general keyword retrieval, the precision rate really improves to some extent. It can be up to 100% and its average has 74%. 5.Chinese Medicine literatures grow up continuously as well as promote the development of Evidence-Based Chinese Medicine. 6.To facilitate information exchange among staff members of Chinese Medicine can achieve knowledge sharing.

參考文獻


蕭淑玲、周世俊,「運用文件探勘於語料庫之辦公室服務代理人」,電子商務學報5卷,2期(2003年9月):61-86。
汪正洋,「從社會資本觀點探討組織內部的知識分享」,地方通訊59卷,3期(2006):30-45。
許中川、陳景揆,「探勘中文新聞文件」,資訊管理學報2期(2001年1月):103-122。
林愉珊,「實證醫學相關資料庫檢索策略之探討」,台灣醫學7卷,4期(2003):568-574。
石富元,「實證醫學常用的資源及檢索策略」,台灣醫學7卷,4期(2003):560-567。

被引用紀錄


林莉穎(2009)。藉由專家社群之推動以建立中醫常見病症知識庫〔碩士論文,淡江大學〕。華藝線上圖書館。https://doi.org/10.6846/TKU.2009.00146
蘇珍琦(2013)。應用情感分析技術於臺灣股票加權指數預測之研究〔碩士論文,元智大學〕。華藝線上圖書館。https://doi.org/10.6838/YZU.2013.00114
張嘉倩(2016)。應用文字探勘於物流服務客訴事件之評價 ─ 以全球商務公司為例〔碩士論文,國立臺中科技大學〕。華藝線上圖書館。https://www.airitilibrary.com/Article/Detail?DocID=U0061-2207201615135000

延伸閱讀