透過您的圖書館登入
IP:18.216.131.214
  • 期刊
  • OpenAccess

運用R 建立文字探勘平台應用於電視收視率預測

Predicting TV Ratings under the R to build the Text Mining Platform

摘要


目前全球進入了大數據(Big Data)的時代,也是從資訊科技(IT)時代走向資料科技(DT)時代之際,各式各樣的儀器與技術使得人們更容易地進行資料的蒐集與累積。在大量資料中存在著結構化資料與非結構資料,一般常用來分析的都是結構化資料,然而更多的是非結構化資料,如微博、LINE、臉書、Twitte 推特、網誌、部落格等,所獲得的資料都是文字的資料。透過文字採礦技術從大量的文本中擷取傳統方法無法取得的隱含知識,以簡要的格式呈現資訊給使用者。本研究利用R 建構社群媒體服務平台。爬取社群網路的資料,予以匯入平台中,設計動態的互動式介面可以對資料進行篩選讓使用者快速得到想要了解的資訊,並使用社群媒體與收視率資料,結合傳統的統計方法以及文字探勘技術,形成新的收視率測量方法,並整合爬文、文字探勘、社群媒體討論熱度、收視率預測等功能,成為一套收視率分析系統,提供「即時性的收視率預測」。

並列摘要


This research use R to build social media service platform. Crawl data of community networks into the platform. Design of a dynamic interactive interface can be filtered for data information for the users to quickly get to know. Use social media and TV ratings data, combined with the traditional statistical methods and text mining technique form new TV ratings measuring method. Integrated crawl, text mining, social media discussion, TV ratings prediction, become a TV ratings analysis system.

並列關鍵字

Text Mining Big Data Semantic analysis TV Ratings Data Mining

參考文獻


李政道(2013)。在Twitte上使用文字探勘技術尋找具有影響力的使用者(碩士論文)。成功大學醫學資訊研究所。
周容萱(2013)。社群網路中資訊傳播預測之探討:以Twitter為例(碩士論文)。臺灣大學資訊管理學研究所。
施百俊()。,未出版。
黃純敏、詹雅筑()。
張良杰(2013)。巨量資料環境下之新聞主題暨輿情與股價關係之研究(碩士論文)。國立政治大學資訊管理研究所。

被引用紀錄


張益誠、張育傑、余泰毅(2021)。探討環境教育論文的文件自動分類技術-以2013-2018年環境教育研討會摘要為例環境教育研究17(1),85-128。https://doi.org/10.6555/JEER.17.1.085

延伸閱讀