漢字的數量
漢字的數量并沒有準確數字,日常所使用的漢字約為幾千字。據統計,1000個常用字能覆蓋約92%的書面資料,2000字可覆蓋98%以上,簡體與繁體的統計結果相差不大。
歷史上出現過的漢字總數有8萬多(也有6萬多的說法),其中多數為異體字和罕用字。絕大多數異體字和罕用字已自然消亡或被規范掉,除古文之外一般只在人名、地名中偶爾出現。此外,繼第一批簡化字后,還有一批“二簡字”,已被廢除,但仍有少數字在社會上流行。
漢字數量的首次統計是漢朝許慎在《說文解字》中進行的,共收錄9353字。其后,南朝時顧野王所撰的《玉篇》據記載共收16917字,在此基礎上修訂的《大廣益會玉篇》則據說有22726字。此后收字較多的是宋朝官修的《類篇》,收字31319個;另一部宋朝官修的《集韻》中收字53525個,曾經是收字最多的一部書。
另外有些字典收字也較多,如清朝的《康熙字典》收字47035個;日本的《大漢和字典》收字48902個,另有附錄1062個;臺灣的《中文大字典》收字49905個;《漢語大字典》收字54678個。20世紀已出版的字數最多的是《中華字海》,收字85000個。
在漢字計算機編碼標準中,GB2312收錄簡體漢字6763個,GBK收錄簡體、繁體及日語、韓語漢字20912個,Big5收錄繁體漢字13053個,而Unicode的中日朝統一漢字基本字集則收錄漢字20902個,另有兩個擴展區,總數高達七萬字。
漢字的影響
對其他文字的影響
漢字書寫體系也是世界上最主要的源文字之一,在漢字的影響下,還產生過:
契丹文
女真文
西夏文
古壯字(方塊壯字)
古白字(方塊白字)
古布依字(方塊布依字)
字喃
但它們都因各種原因而消亡,漢語中的女書,如今也無幾人能識。日語的假名(仮名)、以及朝鮮語的諺文(한글)在創制時也都很大程度上受到漢字字形的影響。
此外如蒙古文、滿文、錫伯文等也是在漢字書寫方式和書寫工具的影響下,將從右向左書寫的源自阿拉米文字的書寫方式改為從上到下書寫,文字的結構也隨之有所變化。
現在或曾經使用漢字但非使用漢語的地區與國家
由于漢字和發聲的聯系不是非常密切,很容易被其他民族所借用,如日本,朝鮮和越南都曾經有過不會說漢語,單純用漢字書寫的歷史階段。漢字的這個特點對于維系一個統一的漢族——一個充滿各種互相不能交流的方言群體的民族——起了主要的作用。
漢字對周邊國家的文化產生過巨大的影響,形成了一個共同使用漢字的漢字文化圈,在日本和朝鮮半島,漢字被融合成它們語言的文字“漢字(かんじ)”和“漢字(한자)”。直到現在,日語中仍然把漢字認為是它們書寫體系的一部分。在朝鮮,已經根本不使用漢字了;在韓國,漢字的使用有可能減少的趨勢。但是由于朝鮮語中使用了大量的漢字詞匯,并且重音現象嚴重,所以在需要嚴謹表達的場合時仍然會使用漢字。大多數的人名、公司機構名稱也使用漢字。
注音
最早的注音方法是讀若法和直注法。讀若法就是用音近的字來注音,許慎的說文解字就采用這種注音方法,如“埻,射臬也,讀若準”。 直注法就是用另一個漢字來表明這個漢字的讀音,如“女為說己者容”中,使用“說者曰悅”來進行注音。
以上兩種方法都有先天上不完善的地方,有些字沒有同音字或是同音字過於冷僻,這就難以起到注音的作用,例如“襪音韈”等。
魏晉時期發展出了反切法,據傳是受使用拼音文字的梵文影響。漢字的發音可以通過反切法進行標注,即用第一個字的聲母和第二個字的韻母和聲調合拼來注音,使得所有漢字發音都有可能組合出來。如“練,朗甸切”,即“練”的發音是“朗”的聲母與“甸”的韻母及聲調所拼成。
近代以來,又發展出了漢字形式的注音符號(俗稱ㄅㄆㄇㄈ)以及很多拉丁字母注音方法。注音符號仍是臺灣教學的一部分,而目前中國最為廣泛使用的是漢語拼音。
由於漢字以本身表義為主,注音方面較為薄弱。這個特性使得上下千年的文獻,不至於產生如同使用拼音文字的西方世界一樣,用字措辭太懸殊的差距,但也造成推斷古代聲韻的難度。例如“龐”從“龍”而得聲,但今日北京話前者讀“pang”,後者為“long”。如何解釋這樣的差異,就是音韻學所探討的課題。
漢字與詞語
漢字是漢語表形的最小單位,類似於英語的“字母”。但是,和“字母”不同,漢字同時也有表意成分,因此類似於“英語詞組”中的單個“單詞”。因此漢字是介於英語中“字母”和“單詞”間的一個成分,對於這一點,從數量上也可以得出。
詞語是漢語表意的最小單位,類比於英語的“詞匯”和“詞組”的總稱。絕大多數漢字可以獨立構成詞語,比如“我”,類比於英語中的單一字母構成的詞匯,比如“I”。大多數詞語都是由兩個以上的漢字構成的,不過,和英語中“詞匯”和“字母”的關系不同,詞語的意思往往和其中各個漢字獨立構成詞語時的意思有相關性,因此相當程度上簡化了記憶。
漢字的高效率,體現在幾千個常用字,可以輕松組合出數十萬詞語,不過,從另一方面來說,準確掌握這數十萬詞語的搭配形式和用法也成了一種負擔。漢語常用詞匯約為幾萬條,總詞匯量約有百萬條,雖然從數量上來說顯得有些令人望而卻步(英語四級不過4000個詞匯),但由于大多數漢字構詞法的表意性,要基本掌握并非遙不可及。因此,僅就詞匯而言,其學習難度并不高;相比之下,掌握同樣數量外文詞匯的記憶強度則要大得多。
這種組詞的高效率保證了漢字系統的穩定性,即詞匯增加、語言發展而基礎漢字基本不變。