|
動態組字是一種漢字在計算機等領域的編碼理論及技術。
[编辑] 原理
英文字母,一套字型只要做好26個字母就好了,漢字的字型卻要有數千到數萬不等才能供應基本訊息交換,這製作、運作的成本都遠高於表音文字,這對於漢字的文化發展仍相當的不利。
鑑於此兩岸各有不同的人發展了動態組字技術,動態組字本質上就是解除西方電腦系統對漢字的束縛,在記憶體中,只要存有一千多個字根部件,漢字即可由這些部件(等同英文的字母,但仍為表意)以遞迴的方式作即時二維組字(英文是一維),來顯示到螢幕上來,使用者也可以應各式的需求自行組新字。動態組字除了容易組字的好處以外,組字的過程反向操作(也就是拆字),就可以作漢字理解。
此外Unicode標準從3.0開始,開始有表意文字序列(Ideograph Description Sequence),為採用表意文字組合符 (Ideograph Description Character)與文字部件的組合,為缺字描述定下一個標準基礎,只要加上解譯描繪的機制,也是一種動態組字的實現。
[编辑] 各家研究
- 漢字基因。這是最早產品化的,由當年開拓漢字電腦化處理的先鋒:朱邦復先生所提出。編碼上採文傳碼,是一種定長度編碼,也就是說可造字有限,文傳碼分為兩版:
- 2 byte 版的文傳碼,上限是 15 bits ( 三萬二千字) ,第一個 bit 為避開 ASCII
- 4 byte 版的文傳碼,每個輸入碼佔6bits 共5組, 每個6 bits為倉頡輸入碼 (26 個)+ 5個重複字(1號重複,2號重複) 所以理論上有超過一千萬個碼位。
- 目前只有在香港文化傳信授權製造的特定的嵌入式硬體才有實作此技術。
- 任職於中華人民共和國陝西省氣象局,張時釗先生的漢字筆畫組字理論
- 台灣中研院謝清俊院士所帶領的文獻處理實驗室,經年整理各代古文,提出構字式(基於BIG5)的作法,整理出各代文字的部件資料庫,分析所有漢字在文字學上的合理組成。
- 台灣剎那搜尋工坊(前易符科技)以構字式研究成果:漢字構形資料庫為基礎,改以unicode IDS(Ideographic Description Sequence且是不定長度編碼)實作,成為構形碼,可高效率以遞迴方式合成漢字。
- 美國文林公司提出的CDL字形描述語言 (字描語,以XML為基礎的構字式)
- 日本京都大學的漢字組字伺服器影
[编辑] 參考
[编辑] 外部連結
|