Next Previous Contents

4. 讀音

4.1 前言

從中文微電腦推廣基金會 (CMEX) 所提供的屬性表中統計得到, Big5 碼中所包含的中文字共有 1302 個不同的讀音。 而每個讀音是由注音符號加聲調符號所組成, 所以我們就用注音編碼來組成讀音的編碼,方便轉換。 又,為了與傳統的使用慣例結合,當該讀音是第一聲時,我們並不使用該聲調符號。

比方說,"ㄓㄨㄥ" 這個讀音就是 ((((15*43)+23)*43+36)*43)+0)*43。 15、23、36 分別是 "ㄓ"、"ㄨ"、"ㄥ" 的注音編號。 由於一個讀音最多有三個注音符號加一個聲調符號, 採用這種方式比較就不會混淆,也不需要注音符號出現的位置做特殊的比對。

CMEX 的屬性檔中,一個中文字最多有四種讀音。 在 Big5 碼中慣用的 13060 個中文字中,12098 個字只有一個讀音, 888 個字有兩個讀音,62 個字有三個讀音,10 個字有四個讀音。另外, 還有兩個字沒有讀音,分別是兀 (0xC94A) 與嗀 (0xDDFC) 這兩個次常用字。 (因為他們是重覆的字。而且 CMEX 的字形檔中也沒有這兩個字) 由於我們使用 CMEX 的屬性檔轉出來的對照表,所以這兩個字就不給予讀音。

4.2 tabeYinToZuYinSymbolSequence()

ZuYinSymbolSequence tabeYinToZuyinSymbolSequence(Yin yin);

將讀音轉為所組成的注音符號與聲調符號。

4.3 tabeZuYinSymbolSequenceToYin()

Yin tabeZuYinSymbolSequenceToYin(ZuYinSymbolSequence str);

將注音符號與聲調符號的組合轉成讀音。

4.4 tabeYinLookupZhiList()

ZhiStr tabeYinLookupZhiList(Yin yin);

查詢所有具有這個讀音的字。這些字存放在一個字串中。


Next Previous Contents