漢字信息量是最大的。
研究表明:漢字作為一個復雜的文字符號系統,其信息熵很高。研究的基本方法是:逐漸擴大漢字容量,隨著漢字容量增大,信息熵的增加趨緩;漢字增加到12370以后,不再使信息熵有明顯的增加。我國科學家指出:漢字的容量極限是12366個漢字,漢字靜態平均信息熵的值(平均信息量)是9.65比特。通過數理語言學中著名的齊普夫定律(ZIPF’SLAW)核算,這是當今世界上信息量最大的文字符號系統。聯合國五種工作語言文字的信息熵的比較如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差別不大。漢字的信息量最大。
漢字對拼音文字的這種信息熵優勢是什么概念?簡單的比喻就是十進制數與二進制數的差別。十進制數字系統需要人記憶0-9,10個符號,二進制只需要記憶0和1兩個符號。十進制乘除要記憶9X9表,二進制只需要學會與、或、非的簡單邏輯。但是,人類在日常生活中為什么不使用二進制數字系統呢?因為那樣很浪費,一個數字“7”表示成二進制就成了“111”,記個大數不把人累死?反過來,人類為什么不用十六進制,或更高的進制呢?一方面是人腦智力的限制,另一方面,十六進制也未必能大幅度提高信息熵。這種信息熵反映在文字上,就是聯合國文件中,中文版本一定是最薄的。這就是漢字字符集信息熵高的優勢。
漢字的以上五個方面的特點,無疑會使其在閱讀心理方面較拼音文字具有相當大的優勢,使漢字的書面語在感知、理解的各個方面都有較高的速度和效率,能夠實現閱讀速度、理解速度、記憶速度的協調發展,快速閱讀,也是中國為何能崛起的天然因素,漢語不失,華夏永存。
詩詞
拜新月 (唐)李端
開簾見新月,便即下階拜。
細語人不聞,北風吹裙帶。
問劉十九 (唐)白居易
綠蟻新醅酒,紅泥小火爐。
晚來天欲雪,能飲一杯無。
瀑布 (唐)施肩吾
豁開青冥顛,瀉出萬丈泉。
如裁一條素,白日懸中天。
題西施石 (唐)王軒
嶺上千峰秀,江邊細草春。
今逢浣紗石,不見浣紗人。
劍客 (唐)賈島
十年磨一劍,霜刃未曾試。
今日把示君,誰有不平事?