位置︰ > 主頁 > 雜文區 > 語文中的資訊量

語文中的資訊量

前一陣子,TG 到新竹馬偕醫院候診。讀到牆壁上掛著幾幅寫著中、英、日三國語文的《基督教聖經》摘言時,發現到同樣的一句話,這三種語文的「文字長度」明顯不同。TG 立刻參悟到一個有趣的現象︰日文所攜帶的資訊量,是相對地「稀薄」的。

就個人實際的經驗,TG 利用在每天下班之後到就寢之前的零碎時間,交錯著閱讀兩部小說。「遠流文庫版」山岡莊八的歷史小說《德川家康》,TG 一天可以讀三本;而書的尺寸大小、頁數完全相仿的二月的小說《康熙大帝》(巴比倫出版社),則是三天才能讀完一本……為什麼我們看日本翻譯小說的閱讀速度,通常都會比較快?TG 認為,這一定是日文、日語的基本特性所造成的現象。

先舉個例子,如果我們要表達一個簡單的意念「我愛你」,並要求完整地將它造句出來,那麼日文的構句將會是「私は、あなたを愛している。」我們分析一下這個句子——「Wa-ta-shi wa,A-na-ta o,Ai-shi-te-i-ru」共有十三個音節。比起中文、或者英文的同意構句—— I love you ——三音節,日文顯得實在「太冗長」了些。以日語講出一句話的時間,換用漢語或英語,就可以一口氣講出四句話。

當然,一定有人會提出質疑︰「正常的」日本人絕對不會這樣「說話」,他們有更簡便的講法。TG 完全同意。不過這篇文章中想要討論的,是「語言資訊量」的「比較」問題;也就是表達出所有意念的情況下,完整的「文字書寫」在不同語言間表現方式。TG 當然知道,像上一句話「我愛你」,日本人在真實生活的使用上,允許將「主格」與「受格」(或稱「主語」和「述語」)省略——也就是省去了「我」、「你」兩個字,簡簡單單地說出動詞(客語)的部分︰「愛している」(Ai-Shi-Te-I-Ru,五個音節),或甚至更簡單地講「好」(Su-Ki,兩個音節)就可以了;絕對不會有前述「十三音節」的構句。

不過,這並不是我們要討論的前題——包含完整的資訊量,TG 就暫時不予理會,純粹就「文章體裁」的理論性、而非日常口說的日語來看。

TG 手邊有一本《科技日文》(林榮南編著、致良出版社),裡頭主要是教導科技文體方面的書寫,剛好符合我們的前題。TG 從書中任意摘出幾句範例來看看︰

語言

文字

音節數目

日文

ここで、コデンサを、用ちない。
KoKoDe,KonDenSaO、MoChiNaI

11

中文

這裡不用電容。

7

英文

Here we don't use condensers.

8


日文

水は、冷たくない。
MiZuWa,TsuMeTaKuNaI

9

中文

水不冷。

3

英文

The water is not cold.

6


日文

回轉が急速だから、入力電流か大きい。
KaiTenGaKyuSoKuDaKaRa,NyuuRyoKuDenRyuuKaOuKiI

18

中文

因為轉動速度快,所以輸入電流大。

12

英文

The rotation is fast, so the input current is large.

14


我們可以注意到,日文在以上這三句範例構句當中,總是「音節數目」最高的語言。在此我們可以得到一個印象︰相較之下,日文在發音過程中,的確是效率比較低的語文。也就是說,要講出很多個音,才能表達出相同的完整意念。為什麼呢?

語言和文字會互相影響,我們先來看看發音元素的比較。學習過日語的人都知道,日語是一種「音節文字」,它有所謂的「五十音」。也就是說,講出日語任何一個單詞,都只有五十種的發音而已。如果我們將拗音、鼻音、促音也當成「可以分辨」的不同音素的話,那麼日語發音的元素,合計起來差不多有四百種。

漢語普通話雖然是一字一音,基本的發音元素並不多(約四百個)。但漢語一個鮮明的特點︰音調,即普通話裡的「四聲」。因此對於任何普通話的使用者而言,「通」、「痛」兩個音,絕對是「可以分辨」的不同發音;同音不同調,對中文使用者而言是不同的發音。這麼計算下來,普通話的發音元素數量立刻「膨脹」,共可達到一千三百種不同的發音元素。

英文與其它拉丁語系都是「拼音文字」,也就是說它發音被拆成更細的元素︰「母音」和「子音」(或稱為「元音」和「輔音」),然後可以再重新組合而成不同的發音。TG 從英語使用到的「母音」和「子音」,試著重新組合與計算,並且省略掉「長短音」、「前後元音」等極少差異的音素(像「cop」和「cup」,就只算同一種發音),這樣子粗估下來,英語至少還可以有四千種的「可以明顯分辨」的不同發音元素。

我們先岔個題,考慮另一個明顯的例子,來討論「元素數目」對「表像」的影響。在計算機理論中,能夠使用的數字愈多,則它表現的空間就可以愈少。在二進位的數字表示方法中,數字只有「0」和「1」兩種;因此十進位的一個數字「15」(佔兩個「格子」——「十位數」與「個位數」),在二進位中就得寫成「1111」,佔了四個「格子」。如果我們再試著用「十六進位」來表示,「15」這個數字寫成了「F」,只佔了一個空間。

於是,十六進位的表示數字「F」,十進位表示為「15」,二進位表示則為「1111」。構成元素愈少,所佔空間愈多。

因此,基本元素愈多,用來表示等價的同一件事情,使用的表像空間愈少;反過來說,當基本元表愈少,則表示一個觀念所要重覆的次數就會愈多。TG 相信,在這三種語言相較之下,日文正是這樣的情況︰基本元素少,使得日本的表達必需要套用許多元素,才能構成一完整的意念。

文字和語言是相互影響的。由於日語只有四百個發音元素,使得用它來表示一句話時,只能從這四百個音去拼湊出一個概念,然後有相對應的文字將這一句話記載下來。相較於中文普通話的一千三百個發音元素,以及英語的四千元素,日文構句當然會顯得冗長許多了。

字音構成文字,文字構成句子,句子組成文章。在經過這一連串的程序,最後完成的一篇日文文章,其實它的內容資訊量,對於習慣使用漢語、英語的讀者而言,絕對是「相對地」稀薄的。為了完整攜帶某一個意念,於是日文就必需得「加長篇幅」來達到同樣的功能。

因此 TG 認為,對於文學中的「小說」、「論文」而言,日文的確「效率不佳」。這也是為何我們閱讀日文小說時,「翻頁速度」特別快的原因,尤其對某些作者,書寫風格很少「一行到底」的作品,則一分鐘翻個十頁是不成問題的(如前述中的《德川家康》小說)。

當然,只有過於自大與淺薄的人,才會以一種語言來批評另一種語言。換個方向想,日文含有一種「不同情緒、不同身份」時候,要「講不同話」的重要特性,這是漢文與英文中所缺少(或不明顯)的元素;而日文當中,這卻帶有嚴肅的「禮儀」問題。對於沒有禮俗問題的論述文體,我們當然看出它的「無效率」。但只要一涉及「禮」,日文的相對「優越性」就顯現出來了。

更何況,文學還有其它的類別,比如像散文、詩歌等;它們原本就不是訴求「以文字精確表達意念」的文體。這時候,各種語言就有它自己的特色,無論用哪種觀點來比較,都沒有所謂的高下或好壞可見。它們純然是該文化的產品,無法(也不應該)以數字來分析。

TG 對和歌與日本文學並沒有太多的研究,所以這個話題就不再繼續討論下去了。僅僅是因為閱讀過許多部日本小說之後,出於好奇心,來將日文所含有的「單位資料量」,來做一簡單的「數字化」比較,並記錄下這個有趣的對比。


(發表於2004.10.14.)


回雜文目錄