元智大學資訊管理學系學位論文｜Airiti Library 華藝線上圖書館

學位論文

使用基因演算法推估Google搜尋引擎的網頁排名因素及其權重

廖良珩(Liang-Heng Liao)

元智大學資訊管理學系學位論文 (2011) 碩士

本研究旨在以機器學習方法來找出逼近Google搜尋引擎排名的可操作性排序因素以及其權重。所謂可操作性，指的是網站擁有者或者網路行銷業者可以據以來做搜尋引擎最佳化 (Search Engine Optimization, SEO)，亦即適度調整網頁的內部或外部品質，以便在特定關鍵字的搜尋結果中獲得排名的提昇。我們關心的是那些可以從搜尋引擎提供的管理者工具或者客觀的第三方取得公開數據的排序因素，而非所有可能的排序因素。本研究以四類工業產品的關鍵詞 (query) ，蒐集 Google 搜尋結果前20筆網頁，且以不同排序因素分成三個階段進行實驗： (1) 外部連結與PageRank之間的關聯、 (2) Authority與PageRank之間的關聯、 (3) 綜合實驗。本研究實驗結果顯示在不同關鍵詞與多種因素組合下計算出的權重值，一致地呈現 PageRank 的權重值遠比其他因素來得高，增加外部連結或Authority等因素對排名預測結果的影響很少。

全文下載

學位論文

運用潛在語意分析來分析Google搜尋結果的排名

卡珍貝(ChitsanzoW. Kazembe)

元智大學資訊管理學系學位論文 (2011) 碩士

本研究提出了一個以潛在語意分析(Latent Semantic Analysis)為基礎的方法來推估Google搜尋引擎的排名。我們對關鍵字查詢結果的網頁進行潛在語意分析，來評估語意相關詞會對排名造成的影響。我們對搜尋結果網頁進行啟發式n-gram斷詞以擷取出n-grams，並建立詞文矩陣(term-document matrix)，來找出文章與詞之間隱含的語意關係。我們使用聚合式分群技術建立概念群組並使用泡泡圖(bubble graph)來呈現。我們由文章與查詢虛擬詞文章的文章-文章相關矩陣來評估文章與查詢詞的相關度。實驗結果顯示使用啟發式n-gram斷詞系統來推估排名，效果比僅使用uni-gram更為出色，而且R-Precision平均值可以達到70%。

全文下載

學位論文

應用種子詞彙延伸方式於BBS電影評論之口碑分析

林偉揚(Wei-Yang Lin)

元智大學資訊管理學系學位論文 (2011) 碩士

為了找到電影領域的評論文章的評價資訊，本研究實作一意見探勘系統。首先從台大批踢踢BBS電影版擷取到評論文章，藉由斷句、斷詞、詞庫比對的方式得到意見單元。利用種子詞彙延伸的方法去延伸正、負向情緒字詞的詞庫；除了種子詞彙延伸所得到的意見傾向，另外加上成語傾向判斷以及句子語法規則傾向判斷，得到最後具有意見傾向的意見單元。　　本系統在正、負傾向的判斷功能在F1 measure下可達71.74%與66.42%。研究中使用的種子詞彙延伸方法產生的情緒詞詞庫與台大情緒詞庫(NTUSD)，進行意見單元傾向判斷的實驗比較，發現本研究的情緒詞詞庫以較少的詞彙，得到較高的精準度與召回率。

全文下載

學位論文

影響In-House系統開發專案成功之風險研究

楊秉謙(Ping-chien Yang)

元智大學資訊管理學系學位論文 (2011) 碩士

對許多組織而言，軟體開發專案帶來的風險具多樣化且是一項艱鉅的任務，由於企業對於內製資訊系統開發專案風險管控意識不高，因此，若有一套軟體開發專案風險分類可供參考，將可降低投注於專案相關資源上的浪費。本研究的目的將探討內製資訊系統開發專案10大風險因子及影響內製資訊系統開發專案成功因子。本研究分別依據Schmidt等人於2001年、Wallace等人於2004年及Verner等人於2005年所提出的風險列表及專案成功因子為基礎，運用問卷法以收集內製資訊系統風險因子及專案成功因子，最後對風險因子進行曝險值排序，及對專案成功因子進行影響值排序，專案管理者可由此研究，對內製資訊系統開發專案會面臨之風險，及影響專案成功之因子有更全面的了解，並作為相關專案規劃執行策略之參考。

全文下載

學位論文

文字探勘應用於原油價格走勢之預測

李瑋孝(Wei-Hsiao Lee)

元智大學資訊管理學系學位論文 (2011) 碩士

原油因其價值高昂又名黑金，主要被用來作為燃料油和汽油，是目前世界上最重要的能源之一。原油也是許多化學工業產品如溶液、化肥、殺蟲劑和塑料等的原料。今天88%開採的石油被用作燃料，其它的12%作為化學工業的原料。由於原油是一種不可再生原料，許多人擔心石油用盡會對人類帶來嚴重的後果。各種潛在的因素交互影響著石油價格，每次原油價格的劇烈波動，都會對世界經濟造成了巨大的衝擊，因此，原油價格的預測在實務界與學術界都受到高度的重視。原油價格預測多採基本分析法或技術分析法來進行，考慮的因素主要為一些常態性的結構化變數，例如，OPEC供給量、全球原油需求、美國戰備儲油等。這類變數的取得容易，且對原油價格預測確實有部分的幫助。然而，仍有許多非常態性的非結構化變數，例如，石油輸出國組織原油禁運、相關自然災害、產油國家戰爭、恐怖分子攻擊等因素，都對原油價格的走勢有著顯著的影響。這些非常態性的非結構化變數取得相對不易，因此，本研究利用文字探勘技術，發展一個能夠自動收集這些變數的方法，並實際驗證該方法對原油價格預測的影響。根據我們的驗證結果，同時考慮傳統結構化變數與本研究利用文字探勘技術找出的變數，確實可以改善原油價格預測的正確性。

全文下載

學位論文

探討專案風險察覺之前置因子

徐維澤(Wei-Tse Hsu)

元智大學資訊管理學系學位論文 (2011) 碩士

風險察覺在軟體專案中是一個重要的概念，因為對於專案經理而言，能有準確風險察覺能力，可避免持續一些很可能會失敗的專案。本文想要探討專案複雜度與任務的專業程度對於風險察覺的影響，並提供一個更為準確的方法，來探討專案經理的風險察覺能力與專案績效之間的關係。先前文獻指出專案複雜度對專案績效有負面影響的，並證實風險察覺影響會專案績效，但根據本研究結果卻發現，專案複雜度不會影響風險察覺，任務性的專業程度會顯著影響風險察覺與專案績效的產品績效，卻不影響專案的流程績效。此發現非常有趣，因為這意味專案的流程績效不直接受專案經理之任務性專業程度高低影響，而是取決於專案經理的風險察覺能力。

全文下載

學位論文

運用語意相關詞來推估Google搜尋引擎的排名

李淳如(Chun-Ju Li)

元智大學資訊管理學系學位論文 (2011) 碩士

本研究旨在利用和關鍵詞的語意相關詞的線性組合是否逼近Google搜尋引擎排名。本研究著重的重點為網頁的隱含語意，以及關鍵字在網頁標題、網頁片段以及網址所出現的方式，而非所有的排名因素。我們將Google的搜尋結果網頁擷取出網頁標題、網頁片段以及網址，並進行n-gram斷詞，然後使用潛在語意分析 (Latent Semantic Analysis) 與Latent Dirichlet Allocation兩種方法來找出網頁中與查詢關鍵詞有語意相關的詞，並且計算關鍵字在搜尋結果網頁標題、網頁片段以及網址的權重，並將這三種線性組合成一個搜尋結果網頁的分數。我們以語意相關詞數量、網頁文件數量、uni-gram與n-gram語意相關詞以及一個主題與兩個主題的語意相關詞所組成的八組參數組合來進行實驗。實驗結果顯示，語意相關詞的數量為20個以及網頁文件數量為20筆的排序結果最好，在所有參數組合中結果最好的R-Precision可以到達0.8，顯示本研究的方法產生的新排序結果相當接近Google的原始排序結果。

全文下載

學位論文

機敏軟體開發風險要素分析

楊富謀(Fu-Mou Yang)

元智大學資訊管理學系學位論文 (2011) 碩士

現今經濟的環境，各行各業對於軟體需求的增加，市場狀況快速變化，軟體開發也需應付變化的潮流。軟體開發是需要經過需求訪談、需求分析、設計、撰寫程式、測試、版本控制等一連串的開發流程。在開發流程之中，也需要考慮到溝通、合作、時程、成本等風險。目前文獻中大多都是在討論軟體開發的風險，本研究透過機敏開發流程的角度來比較在開發實務流程中所需遇到的風險之重要性與影響性。本研究根據回收的116份問卷，利用SPSS軟體進行平均數、標凖差、偏態、峰度等統計方法。此分析不僅針對風險因子對於機敏開的影響，也分別對專案經理及專案工程師的看法做分析，發現需求風險及團隊風險對機敏軟體開發有較大的影響性。此結果可作為未來使用機敏軟體專案管理者風險規劃之參考。

若您是本文的作者，可授權文章由華藝線上圖書館中協助推廣。

查找全文

學位論文

應用決策樹演算法與邏輯式迴歸模式探討傷害就醫之相關因子

俞依良(I-Liang Yu)

元智大學資訊管理學系學位論文 (2011) 碩士

傷害對個人、家庭和社會，都可能造成某種程度的負擔或損失。本研究旨在利用量化方法，了解因傷害而就醫的族群其人口學特質、個人健康狀態及健康相關行為等特性，並分析其相關危險因子，希望能對傷害防治策略提供有價值的資訊。本研究是以民國91年1月16日戶籍資料在台灣地區之12歲以上個人為抽樣母群體之次級資料研究，並回溯接結2001年(民國90年)台灣國民健康問卷調查之家戶問卷及12歲以上個人問卷內容，加以分類整理後以其人口學特性、個人健康狀態、個人健康行為、自覺健康狀態、醫療資源利用等5大類內容為自變項，另以該抽樣族群當年(民國91年)之全民健康保險資料庫就醫記錄為依變項，藉由傳統生物醫學統計之多變項邏輯式迴歸模式及資料探勘之決策樹演算法加以分析，並比較兩種分析模式異同與優劣點。使用「多變項邏輯式迴歸模式」顯示：學歷高低、身體質量指數、生理健康指數、過去一年神經肌肉功能、過去一年循環功能、過去一年醫療資源利用與否等六項變項為影響「是否因傷害而就醫」之相關因子。而利用決策樹演算法分析，所得到之規則顯示在過去一年中，其生理健康指數分數越低者、年齡低者、男性、身體質量指數越高者、學歷低者等，容易造成因傷害而就醫。重要性排名以醫療資源利用為最重要，其次為身體質量指數，再其次為年齡。綜合多變項邏輯式迴歸及決策樹演算法2種分析得知：在過去一年中，身體質量指數越高、生理健康指數分數越低、年齡輕及學歷低者、以及男性，在未來一年容易造成因傷害而就醫。政府衛政部門可應用本研究找出之易受傷害而就醫之危險因子，提供一般民眾適當的衛教建議，並擴大運用於職場之傷害防治策略。

全文下載

學位論文

多語夾雜環境下未知詞擷取之研究

吳依倫(Yi-Lun Wu)

元智大學資訊管理學系學位論文 (2011) 碩士

未知詞之擷取在中文的語意分析上，扮演相當重要的角色言，而目前多語夾雜語料庫中夾雜的短語有些並未出現在目前的字典中，因此可能無法正確的斷詞，因此本研究希望從多語夾雜語料庫中找出未知詞，尤其是夾雜短語的部分。我們將會提出數個方式做比較和測試結果。我們主要使用點式交互資訊(Pointwise Mutual Information, PMI)來衡量兩詞的內力，並以閥值(threshold)篩選有較大PMI值的相鄰詞為候選新詞。由於PMI只考慮兩個詞是否經常相鄰出現，但經常相鄰出現的字合併後未必是新詞，有鑑於此，我們除了使用PMI之外，亦將使用前後文脈之entropy來過濾無關的新詞以提升精確度。

全文下載

主題瀏覽