有這樣一個神奇的網站
不是58同城 不要瞎猜
它叫做 COCA美國現代英文語料庫
Corpus of Contemporary American English
之前有報道稱,目前英文單詞已經超過了 100 萬個,這是個嚇人數量,我相信沒有人能全部記憶。而 SUBTLEXus 根據所有交談中的單詞出現頻率,最終得出了我們應該需要記住的單詞數量,並以圖表的形式直觀的表現了出來。
▼
You, I , the , to 這 4 個單詞用的是最多的,在所有交談中約佔 13%
‘s ,a , it … 等 16 個單詞,在所有交談中約佔 30%
this, he ,on … 等 57 個單詞,在所有交談中約佔 50%
360 個常用單詞,在所有交談中約佔 75%
2700 個常用單詞,在所有交談中約佔 90%
60000 個常用單詞,在所有交談中約佔 97%
▶COCA的神奇之處:
1. 來自專業正式文本的美國當代英語語料庫
「COCA 美國現代英文語料庫」是由美國楊百翰大學 Mark Davies 教授所開發的一個免費的語言資料線上搜尋引擎,他自稱是當今世界上最大的語言資料庫,而且他的語料來自於美國英語使用情境下的這些文本:
· 口語演講
· 小說書籍
· 雜誌報紙
· 學術期刊
也就是說比起搜尋網絡用語素材,「COCA 美國現代英文語料庫」的語料來自於有更多嚴謹檢查與使用的專業或正式文件,所以相對起來更能避開有爭議的方法,而更接近正式的語法。
這對有「英文文稿翻譯」、「英文正式報告」、「英文職場書信」需求的使用者來說,提供了更專業正確的查詢管道,並且查詢時可以找到各種詞彙在這些文件裡的使用方法參考。
2. 持續更新,搜尋快速,包含去年最新語料
值得一提的是,「COCA 美國現代英文語料庫」從 1999 年創立至今依然持續更新,每年都要更新大約 2000 萬的詞彙數量,目前到 2015 年年底為止已經擁有 5 億 2000 萬的龐大詞彙語料。
即使有這麼龐大的語料庫,但「COCA 美國現代英文語料庫」搜尋的速度依然很快,瞬間就可以找到結果。
在不需登入的情況下,每個用戶每天可以使用 10 到 15 次的搜尋,或者你可以註冊免費帳戶,可以無限制的使用搜尋功能。
3. 如何開始利用「COCA 美國現代英文語料庫」搜尋?
基本的使用非常簡單,進入「COCA 美國現代英文語料庫」網站後,只要找到左方的搜尋欄位,在「Words」中輸入你要查詢的英文單字或詞彙或句子,就可以找到相關的語言資料。
你可以在來自小說、演講、期刊等資料中,看到一個詞彙或一段用語被如何使用的方式,找到更正式或更正確的變化。
4. 如何搜尋一個字可以搭配哪些詞彙用法?
更進一步,很多時候我們要寫報告、寫書信時,需要的是找到一個還不確定的英文詞彙的使用方式,例如在一個特殊名詞之前應該接什麼動詞?應該使用什麼語法來描述一個事件?這時候要怎麼利用「COCA 美國現代英文語料庫」查詢呢? 這時候就要用到「Collocates」上下文查詢的功能。
在「Words」裡輸入我的核心單字,例如「beach」(海灘),我想查詢要如何用正確與文雅的句子來描繪前往海灘的英文語法。
接著在「Collocates 」裡輸入上下文我想查詢的相關詞彙詞性,例如下圖中代表的意思是我想查詢「前文」的「一個字範圍內」可以接什麼「動詞」在海灘這個單字的前面。
如果我在 Collocates 欄位改成輸入「V*」「4」「4」,那就會變成查詢在「beach」這個單字的前文四個字內、後文四個字內如果要使用動詞,可以使用哪些動詞變化。
你可能會說,還要自己輸入詞性嗎?其實也不用,因為你可以利用下方的「pos list」清單,找到你需要的詞性,直接點選,就能輸入在前方欄位中。
透過這樣的查詢,我們就可以去找出在一個單字的前後文裡,可以使用哪些動詞或名詞或形容詞,來構成一個正確的句子語法。
而點選一個你感興趣的結果,右下方就會顯示他的各種例句。
5. 如何搜尋一個詞彙的所有變化型態?
如果不是要查詢語句的用法,而是要找某一個單字的各種變化型態,這時候我們可以用 [eat] 這樣的語法,去找到這個單字的所有變化型。
6. 如何查詢同義字?
而要找到這個單字的其他同義字,以及相關同義字在各種文本上的使用方式時,我們把搜尋語法改成: [=speak] 就可以找到一個單字的各種同義但或許更專業的用法。
透過上述簡單的方法,我們就能好好利用「COCA 美國現代英文語料庫」龐大的五億語料庫,從這個美國現代文本資料裡,找到當代英語更準確的使用方法,推薦有需要的朋友試試看。