目前全球進入了大數據(Big Data)的時代,也是從資訊科技(IT)時代走向資料科技(DT)時代之際,各式各樣的儀器與技術使得人們更容易地進行資料的蒐集與累積。在大量資料中存在著結構化資料與非結構資料,一般常用來分析的都是結構化資料,然而更多的是非結構化資料,如微博、LINE、臉書、Twitte 推特、網誌、部落格等,所獲得的資料都是文字的資料。透過文字採礦技術從大量的文本中擷取傳統方法無法取得的隱含知識,以簡要的格式呈現資訊給使用者。本研究利用R 建構社群媒體服務平台。爬取社群網路的資料,予以匯入平台中,設計動態的互動式介面可以對資料進行篩選讓使用者快速得到想要了解的資訊,並使用社群媒體與收視率資料,結合傳統的統計方法以及文字探勘技術,形成新的收視率測量方法,並整合爬文、文字探勘、社群媒體討論熱度、收視率預測等功能,成為一套收視率分析系統,提供「即時性的收視率預測」。
This research use R to build social media service platform. Crawl data of community networks into the platform. Design of a dynamic interactive interface can be filtered for data information for the users to quickly get to know. Use social media and TV ratings data, combined with the traditional statistical methods and text mining technique form new TV ratings measuring method. Integrated crawl, text mining, social media discussion, TV ratings prediction, become a TV ratings analysis system.