- 相關推薦
《熱愛生命》的語料庫檢索分析論文
自20世紀80年代以來,語料庫語言學獲得了蓬勃的發 展。它為語言學研究提供了一套全新的研究思路和方法,被 廣泛應用于語言研究的各個層面。伴隨著計算機技術和網 絡的普及、發展,學者們開始利用各類語料庫索引軟件作詞 匯搭配、翻譯以及中介語的描述和分析。Wordsmith Tools作 為一種常用的語料庫檢索工具,其軟件內部主要包含語境 共現檢索工具(Concord)、詞頻列表檢索工具(WordList)、關 鍵詞檢索工具(Key Word)、分割工具(Splitter)、替換工具 (Text Converter)、瀏覽工具(Viewer)六種工具。本文主要利 用前三種常用的文本檢索工具對文本進行分析。
1.總體特征的統計分析
首先,我們對文本進行要進行定量研究,即進行文本的 檢索和數據的統計。我們把《熱愛生命》的英文文本用 Wordsmith Tools軟件的詞頻列表檢索工具進行統計,可以得 到一些相關的統計數字,如字節數(bytes)、形符數(tokens, 指文本一共有多少個詞)、類符數(types,指文本一共有多少 個不同的詞形)、類符形符比(type/token ratio,指形符與類符 的比率,即用詞的變化性)、標準化類符形符比(Standardised Type^Token)、平均詞長、句子數等(如圖所示)。
文本屬于難度水平較低、句子稍長、篇幅較短的小說。
2.表達方式的檢索分析
我們主要利用WordSmithTools語料庫檢索軟件中的詞 頻列表檢索工具對小說文本的言語表達進行統計分析。首 先,通過對文本的統計,我們可以得到一個主題詞表(如圖 所示,只截取了前30位)。然后,根據觀察詞表中詞的頻率排 序規律,我們可以分析該小說在人稱使用、敘事方式、主題 表達以及否定詞使用這四個方面的特色。
2.1人稱使用
根據觀察主題詞表,我們發現了一個異常的現象-- 人物名稱并不在主題詞表的前30位。按照小說三要素的一 般規律,人物名稱出現的頻率應該是比較高的。但我們發現 “he”、“his”、“him”這三個詞出現的頻率非常高,分別排在第2 位、第4位和第12位。而文本中唯一出現的人名“Bill”排在了 第48位,僅出現了20次。這中現象有兩種可能的解釋:一是只有“Bill”一個人,且人稱的使用過分頻繁,二是“he”和“Bill” 是兩個人,且主角不是“Bill”而是“he”。第二種解釋更符合小 說情節設置的一般規律,而閱讀小說內容之后我們可以得 到印證。該小說的主人公并沒有名字,通篇都用第三人稱 “he”來指代主人公,而“Bill”在小說中只是作為配角出現。因 此,我們發現不賦予主人公名字,而用第三人稱來指代成為 小說的特色之一。
2.2敘事方式
詞表中的最高頻的動詞為“was”,后面依次是“had”、 “were”、“did”等動詞過去式,這表明小說以過去時來敘述故 事情節。另外,通過觀察詞表,我們可以發現類似“before”、 “after”、“then”這樣的詞出現也比較頻繁。這表明小說充分利 用時間先后變化來描寫故事。這樣的敘事方式不僅使整部 小說的情節緊緊相扣,還為讀者迫切了解后續情節的提供 了動力。
2.3主題表達
根據小說的標題,我們可以推測小說的主題與生命相 關。通過觀察主題詞表我們發現“life”、“die”出現的頻率也很 高。通過閱讀小說內容,我們發現這兩個詞緊扣住小說的主 題,小說主要以主人公在荒野中跟死亡的抗爭來表現生命 的頑強與可貴。在惡劣環境中,主人公與寒冷、饑餓、傷病和 野獸抗爭。面對生與死的抉擇,他表現了人對生命的珍愛以 及生命的堅鋪品質。
2.4否定詞使用
在主題詞表中,我們觀察到“not”出現了77次,“no”出現 了35次,即否定詞的出現頻率非常高。文章沒有直接敘述主 人公在前進,而是以“沒有停下”作為表達的方式。這樣的否 定讓讀者能感覺到主人公每走出一步都要有巨大的毅力, 和的前進十分艱難。此外,小說中常常出現對負面情況否定 的表達,比如主人公對自己疲憊狀態的否定或對被隊友拋 棄的殘忍事實的否定。主人公以類似這樣的心理暗示給自 己一些生的希望,以支撐自己走出困境。
3.主要情節的檢索分析
我們利用WordSmith Tools軟件的語境共現檢索工具, 檢索出與所有角色共現的句子,以此來發現于主要角色的 細節描寫。這對研究人物性格以及把握主要情節非常關鍵。 接下來,我們將結合Wordsmith Tools語料庫軟件的統計結 果,對小說中的主要角色進行詳細分析。通過上述主題詞表 的統計,我們篩選出的主要角色包括:主人公“he”、配角Bill 和狼。
首先,對主人公“he”進行分析。我們利用語境共現檢索 工具’統計出“he”在整個文本共出現409次,并得到其情節表 格(如圖所示)。
我們發現,在與“he”共現的文本中,開頭部分多出現類 似痛苦、疲倦、受傷這樣的詞匯,這表明小說首先被定下了 生死較量的壓抑的基調。結合小說內容,我們發現作者直接 把主人公放置在了一個險惡的環境之中,但文本中沒有任 何的說明他為何會在這樣的荒野之中。另外,在與“he”的共 現的文本中,我們發現很多句子中多次出現恐懼、糟糕、饑 餓等詞匯。這表明主人公的生理狀態極差。但結合小說內 容,我們發現盡管主人公的狀態很糟糕,他還是一直和困難 抗爭,頑強地維系生命。例如類似這樣的描述:“He fought with his fear again,overcame it,hitched the pack still farther over on his left shoulder,and lurched on down the slope.The bottom of the valley was soggy with water,which the thick moss held,spongelike,close to the surface.”在共現文本的后半 段,主人公幾乎失去意識,但他也在不斷的進行心理暗示。
然后,我們對文中人名Bill進行檢索分析。通過利用語 境共現檢索工具統計,我們發現Bill在整個文本中共出現20 次,并得到其情節表格(如圖所示)。
通過以上的統計數據,我們可以根據字節數、形符數和 句子數可以推斷出這是一個較短的文本。該文本的類符形 符比為22.29。雖然單純的形符數和類符數不能反映語篇的 本質特征,但按一定的長度分批計算文本的類符形符比求 平均值就可以得出標準類符形符比。它在一定程度上反映 了語篇的某種本質特征,即用詞的變化性。該文本的標準類 符形符比數41.63,由此可以認為此文本的詞匯變化量為較 低程度。整個文章的句子有530,句長為15.52,與平均句長 9.25相比,這表明該文本又比一些簡易文本的句子要長。另 外,該文本的平均詞長為4.19,其中三個字母的的詞最多,有 2228個。通過計算,四個字母以內的詞數有5387個,占形符 數65.47%?偠灾,通過上述統計分析,我們可以推斷該pm itftmon0.4951 HI | HI
關于Bill的情節并不多,通過觀察和總結,我們可以把 Bill的出場可分為三個階段。第一階段是在小說開頭,主人公 與Bill在荒野中同行然后被Bill拋棄;第二階段是主人公通過 想象Bill并沒有拋棄自己,猜測他在某個地方等待他;第三階 段是他看到了Bill的尸體。雖然Bill在小說中出場很少,卻也 發揮了配角的作用。他的形象鮮明,與主人公形成強烈對 比。例如文本中這樣的表述:“Well,Bill had deserted him;but he would not take the gold,nor would he suck Bill’s bones.Bill would have,though,had it been the other way around,he mused as he staggered on.”[2]盡管Bill沒有同現出任何貶義的 詞語,我們還是可以發現他的自私、貪婪、懦弱。出11充分地反 襯出主人公意志堅強、不畏艱險、淳樸善良的人物特征。
最后,我們對狼進行分析。通過利用語境共現檢索工 具,我們統計出“wolf’在整個文本中共出現20次,并得到其情節表格(如圖所示)的分析,我們發現該小說屬于難度水平較低、句子稍長、篇 幅較短的小說。通過對其表達方式的分析,我們發現該小說 中的主人公沒有被設定人物名稱,小說主要以時間先后作 為敘事方式,且利用生命和死亡這兩個詞緊扣小說主題,并 利用否定詞從側面表達人物環境的艱險和主人公不屈不撓 的性格。通過對其主要情節分析,我們發現雖然主人公生理 狀態極差但是在面對生死抉擇時表現出頑強的毅力,配角 Bill出場較少以虛偽自私的形象卻反襯出主人公人格的偉 大,病狼在小說的后半段出現,它與主人公的激烈搏斗把小 說推向了高潮,襯托出人類生命的強大。總之,通過利用語 料庫檢索軟件Wordsmith Tools,我們對英文小說<熱愛生命》 進行分析。我們主要以列表、統計等量化的方法對小說的總 體特征、表達方式、主要情節等方面進行統計分析,使對其 藝術特征的詮釋更加理性。
【《熱愛生命》的語料庫檢索分析論文】相關文章:
分析魏晉文人的生命的價值分析論文11-16
生命周期廣告策略的分析論文02-13
學術論文寫作與文獻的閱讀檢索11-17
談論文寫作中文獻資料的檢索03-21
語料庫語言學與英語教學論文05-24
分析魏晉文人的生命的價值分析03-18
醫學論文參考文獻快速檢索的訣竅03-14
讓生命起舞論文11-20
《信息檢索與畢業論文寫作》課程教學大綱03-02