繪入源氏物語

絵入源氏物語


本文由邱郁婷編輯

本文摘自同志社大學研究開發推進機構的〈繪入源氏物語〉,由邱郁婷統整後撰文。


網頁簡介

《繪入源氏物語》於江戶時代出版,是為了使一般民眾得以閱讀紫式部所著之《源氏物語》而出版之版本,其相較於原文更容易理解,且附有插畫輔助。

〈繪入源氏物語〉是一針對《繪入源氏物語》進行統計式文本分析的網頁應用程式,由同志社大學研究開發推進機構之研究員──土山玄 所製作。此網頁應用程式使用了國文學研究資料館所公開之數據,並運用R語言進行統計處理。

網頁功能介紹

網頁中共有4種功能,分別為「詞類比率」、「單字出現率」、「相關矩陣(Correlation Matrix)的視覺化」以及「主成分分析」,以下將針對每項功能進行詳細說明:

一、 詞類比率

此功能將《繪入源氏物語》各卷目中所含詞類之比率視覺化,並以長條圖呈現。使用者可於「選擇卷目(卷の選択)」中選取欲查看之卷目,選取完畢後畫面即會顯示出該卷目中所含名詞、代名詞、動詞、形容詞及副詞等所佔之比率。

除了可查看單一卷目之詞類比率外,按下下方「增加卷目進行比較(比較する卷を追加)」之按鍵,即可選取其他卷目進行對比,最多可顯示2卷不同卷目間之比較。

二、 單字出現率

此功能將《繪入源氏物語》所有卷目中任意單字的出現率視覺化,並以折現圖呈現。使用者可於「關鍵字搜尋(検索キーワード)」中自行輸入欲查詢之單字,隨後便可看見該單字於不同卷目的出現比率高低。

此功能與前述「詞類比率」功能相同,除去單一關鍵字的查詢,亦可透過「增加關鍵字進行比較(比較するキーワードを追加)」之按鍵,再追加其他單字進行比較,最多可顯示2個單字間之對比。

三、 相關矩陣的視覺化

此功能藉由各卷目之單字出現率,將《繪入源氏物語》所有卷目之間的關聯性視覺化,並以相關矩陣圖呈現。使用者於「選擇詞類(品詞の選択)」中選取詞類,如名詞、動詞及形容詞等,再於下方「使用單字數量(用いる単語数)」中輸入單字數量後,即會出現該詞類單字的相關矩陣圖。值得注意的是相關矩陣顯示之單字將依其單字出現頻率之高低順依序排列,舉例來說,若是選取名詞,單字數量為5,則僅會以名詞中使用頻率最高的前5個單字形成相關矩陣圖。

若是再點選最下方「查看卷目之相關性(卷の相関を見る)」之按鍵,將轉而呈現出《繪入源氏物語》所有卷目的相關矩陣。假設將詞類設定為副詞,單字數量為20,並點選「查看卷目之相關性」,則會以出現頻率最高的前20個副詞為基準,顯示出卷目之間的相關性。

四、 主成分分析

此功能藉由各卷目之單字出現率,針對《繪入源氏物語》所有卷目進行主成分分析(Principal components analysis, PCA)。切換至此功能頁面後,於「選擇詞類(品詞の選択)」中選取詞類,並於下方「分析單字數量(分析に用いる単語数)」輸入用以分析之單字數量,其後便會以分散圖呈現出各卷目的第一、第二主成分之得分,圖中橫軸為第一主成分(PC1),縱軸則為第二主成分(PC2)。以功能頁面中預設的數值為例,詞類為名詞,單字數量為5,則系統將運用名詞中出現頻率最高的前5個名詞進行主成分分析,並將最終的分析結果呈現於畫面中,使用者即可透過分散圖看出各卷目間的差異。