大數據與文學分析研討會
日期:110年09月10日 10:00 ~ 12:00
地點:濟世大樓CS915
議程:
時間 |
活動安排 |
講師 |
10:00 ~ 10:10 |
報到 |
|
10:10 ~ 11:30 |
題目:大數據與文學分析 |
國立政治大學統計學系 余清祥教授
|
11:30 ~ 12:00 |
Q&A時間 |
活動說明:
大數據(Big Data,或譯為巨量資料、海量資料)是二十一世紀主要發展趨勢之一,由於資料儲存及交換方式的演進,知識觀念的累積及交流更為多元快速,可預期人類文明將進入另一境界。伴隨知識的數量化,如何從龐雜資料中萃取重要資訊(亦即「解讀資訊」),變成現代人必須具備的能力,這方面的研究可稱為資料探勘(Data Mining,或譯為資料採礦)。文學與藝術,傳統多以質性方式分析,結合研究者的專業知識、觀察、觀念跳躍以獲取新知,大數據相關方法提供了另一種可能,藉由統計等數量化分析釐出頭緒,歸納出蘊含於數據中的關鍵資訊。
本次介紹大數據時代下的文學量化研究,以清代著名的章回小說─《紅樓夢》為例,說明統計分析的步驟及想法,包括根據文本特性、文學想法等定義整體研究目標。《紅樓夢》為近代文學的一大鉅著,堪稱古典小說的代表作品,然而作者是誰始終是未解的謎。在一般的認知中,紅樓夢是曹雪芹所作及高鶚編纂,但專家對於本書之前八十回與後四十回是否為同一位作者仍無定論。本研究以結合領域知識與分析理論的角度出發,挖掘《紅樓夢》中反映作者文字特徵的重要資訊,以此作為比較判斷《紅樓夢》寫作風格的依據。