透過您的圖書館登入
IP:18.226.169.94
  • 學位論文

電子病歷資訊檢索與擷取技術研究

Medical Record Retrieval and Extraction for Professional Information Access

指導教授 : 陳信希

摘要


本研究以台大醫院病歷為資料集,目的在設計一套病歷檢索系統,幫助醫師 檢索相關病歷或提供治療方法給醫師參考。首先分析病歷的語言現象,包含病歷 平均長度、詞彙量、資訊熵。依據病人掛號科別,病歷可以分為14 類,每個科別 的語言現象也會分別呈現。 第一階段實驗使用五種檢索模型與六種索引策略,第二階段實驗則加入排序 學習技術與三種索引策略。效能評估則分為病歷檢索層次與治療檢索層次,在病 歷檢索層次,主訴視為查詢文字,在治療檢索層次,主訴與簡短病史視為查詢文 字。 第一階段實驗的病歷檢索效能評估中,okapi 模型效能最佳。資訊熵較低的科 別,其效能也比較好。與身體多重器官或人體系統相關的科別,如腫瘤科、神經 科,則低於平均效能。治療檢索效能評估,則沒有一個模型特別優異。 第二階段實驗的病歷檢索效能評估中,tf-idf 模型效能最好。結合多種檢索模 型的檢索分數,反而使得效能下降。運用排序學習技術,能夠顯著優於第一階段 的實驗結果,大部份科別的效能皆有提升。治療檢索效能評估,則五種模型差別 不大。

參考文獻


[2] G. Goth, "Analyzing medical data". Communications of the ACM, 2012. 55(6): p.
[4] D. A. Hanauer. "EMERSE: the electronic medical record search engine". AMIA
[6] K. Zheng, Q. Mei, and D. A. Hanauer, "Collaborative search in electronic health
records". Journal of the American Medical Informatics Association, 2011. 18(3): p.
[9] S. Kullback and R. A. Leibler, "On information and sufficiency". The Annals of

延伸閱讀