Concord 工具介紹文


本文由李衣絨編

本工具〈Concord〉介紹文由李衣絨撰文。


簡易介紹:

Concord為一套免費的詞彙檢索工具,能夠列出文本中所有單詞,包括單詞的位置及對應之上下文。Concord以EXE跨平台網頁設計軟體顯示,並常用於Python及wxPython中。

下載軟體與檔案匯入:

下載Concord時,沒有繁瑣的下載程序,也無須註冊帳號密碼。因此,只需到官網 並找到下載連結,即可進行下載及安裝。

圖一 Concord官方下載頁面

Concord P1

安裝完成Concord後,進入的畫面如圖二所示。區塊1用於顯示匯入文本的內容,目前僅支援輸入txt檔。區塊2為文本索引分析區,只要新增KWIC(上下文的關鍵字),或任何詞彙後,將顯示於區塊2中。

圖二 Concord初始介面

Concord P2

接著,如圖三所示,以下將介紹四項Concord的基本功能:(1)檔案匯入及匯出功能(區塊3)、(2)新增關鍵字詞彙(區塊4)、(3)結果顯示設定:可以依據自己的需求顯示需要的資料(區塊5)、以及使用教學區(區塊6)。接下來將詳細介紹Concord各項功能。

圖三 Concord的基本功能

Concord P3

首先介紹檔案匯入及匯出功能。在圖四中,Open text為匯入資料,而Save concordance可以儲存文本分析結果。

圖四 Concord的File設定

Concord P4

接著,介紹新增關鍵字詞彙功能。透過Add Key,可以新增需要的關鍵字詞彙,而Delete Key則用來刪除不需要的關鍵字(圖五之一)。在Sort Keys的選項中,可以選擇「by Frequency」或「Alphabetically」以依照關鍵詞頻率高低或字母順序以進行升降冪排序(圖五之二)。在Sort Lines的選項裡面,可分為四種排序功能(圖五之三),以「by Line-number」為例,可在下方的文本索引分析區的左方將依據文本行號的順序排列。

圖五 Concord的Concordance設定

Concord P5

接下來介紹第三個功能:結果顯示設定。在Options的選項中,選擇「Headers-only display」,僅會顯示文本中出現該關鍵字的總次數;「Show line numbers」會顯示每筆出現該關鍵字的文本行號;「Search on whole words」輸入時,需為完整單字,例如,若搜尋「pur」,將搜尋不到資料,因為pur不是一個完整單字;「Case-sensitive search」為將單字大小寫區分的搜尋方式,能更準確地搜尋因單字大小寫而造成不同意思的情況。例如,搜尋「Turkey」時,將搜尋出跟「土耳其」有關的,而非與「火雞」相關的結果,反之,搜尋「turkey」可得相反結果。

圖六 Concord的Options設定

Concord P6

最後,在使用教學區中,有六項功能(圖七),點擊每一個選項都可以看到如何操作Concord工具的介紹。例如,點擊「on Texts」,將顯示訊息提示框以說明匯入文檔的格式、操作和提醒(圖七之二)。

圖七 Concord的Help設定

Concord P7

以下以美國作家約翰•艾希伯里的詩歌集《凸鏡中的自畫像》文本檔為例,圖八為分析結果。首先,匯入文本檔後,匯入之文本內容會呈現於紅色區塊中。之後,可於橘色區塊觀察到使用者新增關鍵字詞之數量統計結果。在文本詞彙分析區中,選擇「Headers-only display」,將只顯示橘色區塊之資訊。此外,黃色區塊為文本分析數量統計結果中,每筆結果之文本行號。最後,綠色區塊為以使用者新增之關鍵字詞為主軸而顯示的詞彙索引分析結果之前後文。

圖八 《凸鏡中的自畫像》之詞彙檢索結果

Concord P8

總結:

Concord為個人處理文本時方便進行詞彙索引分析之工具,操作簡單易懂。透過Concord新增關鍵字詞,便能夠輕易地呈現文本中以該關鍵字為索引之上下文的分析結果,對於日後文學、語用學、及翻譯學之文本分析,將會是一大助力。