在從事生物醫學相關研究的草創階段中,找尋相關科學文獻並且將研究人員過去所私有的生物醫學實驗資料對應到科學文獻對於研究者是一件重要的工作。本研究提出一搜尋系統,主要探討在大量的生物醫學文獻中進行快速檢索,其中採用的公開科學文獻資料庫為美國國家圖書館所建立的平台—PubMed,並且採用字詞探勘技術—名稱辨識進行蛋白質名稱的字詞抽取;再以本研究所提出的規則法對蛋白質名稱進行正規化取得識別碼,並以此識別碼連接至實驗數據資料庫。其目的為讓使用者在短時間之內能夠以圖形化的方式呈現私有的實驗數據與相關科學文獻等資訊,藉此得知實驗數據在其檢索出的相關文件中所佔有的重要性與關聯性,進一步發現可研究的議題或更有價值的資訊。
In the beginning of biomedical research works, mapping researchers’ proprietary experiment data to public research literatures is an important work. In this paper, a search engine is proposed to retrieve large scale biomedical literatures which are collected from PubMed in an efficient way. Moreover, we apply a name entity recognition tool which is a kind of text-mining technique to extract protein names from the biomedical literatures. Afterward, the protein names are normalized to IDs which can be linked to the researchers’ proprietary experiment databases and using web techniques automatically plot the charts for the relevant proprietary data; through these processes, the researchers can efficiently get the relevance between their proprietary data and the public papers also can help them to find more available research works.
為了持續優化網站功能與使用者體驗,本網站將Cookies分析技術用於網站營運、分析和個人化服務之目的。
若您繼續瀏覽本網站,即表示您同意本網站使用Cookies。