2003年版五代之相關資料並不完整,以下所列六代與五代之差異皆以1999年版五代倉頡為參照基準。 輸入碼與內碼對應可以是多對多(用選字方式處理);同一內碼在螢幕上渲染出的字形也可因電腦字體而異。 凸倉頡2023 例如五代的「難」為「廿人・人土」,「𦰩(廿人)」為字首,「隹(人土)」為字身;六代編碼為「廿中人・人土」,「𦰩(廿中人)」為反字身,「隹(人土)」為反字首。 連體字與分體字拆碼時皆是先運用第1點的3個基本原則,連體字最多取4碼,只取第1、2、3和尾碼,不足4碼就全取。 而分體字可拆開為2至3部份,最少
例如,內碼為萬國碼的話,「」、「」的內碼都是「麻」(U+9EBB),倉頡輸入法開發者根據台灣標準字形「」把「戈十金金」與「麻」(U+9EBB)的對應編入。 如果中國使用者輸入「戈十金金」,系統會輸出對應的「麻」(U+9EBB),但中國字體會把「麻」(U+9EBB)渲染作「」,取碼字形和顯示字形不同。 倉頡輸入法由於很早就開放,很多版本是人們自行開發,未與朱邦復團隊確認。 這些開發者或因不慎,或因對倉頡編碼規則不夠熟悉,為某些字設置了不符合倉頡輸入法的編碼規則的編碼。
凸倉頡: 輔助字形變更
2003年版五代收字較之前版本多,也多了一些為罕用字取碼建立的新規則,這些規則不與舊版衝突,且不引入將難以取碼,因而一些三代或1999年版五代倉頡也採用了這些規則。 1982年,朱邦復先生登報公開放棄倉頡輸入法專利權,不收取專利費免費開放給人使用,所以主流的中文作業系統都有內置倉頡輸入法。 連體字即是不能分割為兩個部份或以上的中文字,例如是「馬」、「事」等。 而分體字如「前」、「花」等,則因為筆劃不相連而可分成字首、字身的部分,有些字更可細分出次字首和次字身。 六代倉頡輸入法引入了以「片」表示翻轉的規則,即在翻轉的部件後加上「片」代表水平鏡像或垂直鏡像。
除漢文庫典查字會顯示2003年版五代倉頡碼[3]以外,很難找到完整的2003年版五代倉頡編碼表及支援2003年版五代倉頡編碼的倉頡輸入法。 注意:自製的倉頡輸入法可能混合了數代的編碼,或自行擴充了編碼,未必會完全符合以下敘述。 中文全字庫是中華民國國家發展委員會建立的中文交換碼標準(CNS11643)所附的倉頡碼。
凸倉頡: 倉頡輸入法/特別注意
2003年版五代倉頡是在六代倉頡後推出,本質上引入了一些六代倉頡的改變,惟改以較相容於三代、五代倉頡的作法。 「字形問題」指:取碼字形與螢幕顯示字形(或習慣的印刷、手寫字形)不同,按螢幕顯示字形(或習慣的印刷、手寫字形)取碼輸入卻打不出字的現象。 之後,朱邦復先生及助手沈紅蓮女仕一起改良「形意檢字法」,使之能應用在中文電腦上。
字首、字身各取1碼,最多共取5碼(即字首取2碼、字身取3碼)。 如果字身不是恰好為以上組合,則不套用此規則;如「順」的字首為「丿」,字身為「」,六代按一般取碼為「中・中・中片」,而不是按反字身規則取碼為「中・中中・一片」。 日常生活中不論是工作或閒聊,打倉頡時偶爾會卡在某些常用字,不懂拆碼無法順利「我手寫我心」。 凸倉頡2023 凸倉頡 TOPick集合了幾個熱門的倉頡難打字,先簡述一下倉頡的拆字規則。
凸倉頡: 字形問題
然而,輸入法開發者在容錯的努力不一,於是各版本的倉頡輸入法都有程度不一的「看字取碼卻打不出字」問題,使用者需要另行理解某些字的取碼字形,才能順利打出那些字。 朱邦復公佈三代倉頡時尚未為簡化字編碼,一些自製的三代倉頡輸入法便自行擴充簡化字編碼,造成取碼規則不一。 上述輔助字形相關取碼,1999年版五代倉頡的作法與三代倉頡並無二致,不少自製倉頡輸入法也跟進採用了這些官方規則。 六代倉頡相關字有些改用新規則處理,而繞過了此問題,其他字都取消了五代變動,比照三代適用「冖頭分離」。 民間自行開發的五代倉頡輸入法,有些沿用五代手冊的處理方式,但相關爭議字可能改為適用「冖頭分離」,或兼容兩種做法。 朱邦復團隊架設漢文樂園、漢文庫典時,為統一紛亂的倉頡輸入法版本,一併公佈了2003年版五代倉頡,但當時僅以文字敘述[2],未上網公開完整規則,合作網站也未跟進,目前較通行的五代倉頡仍是1999年版。
由於為國家標準且編碼表開放,有自製的倉頡輸入法會使用此編碼表,通稱「全字庫倉頡」或「中標倉頡」。 微軟亦於Windows 2007年以後的內建倉頡輸入法支援此編碼表(可在倉頡輸入法的[字元集設定]勾選[允許使用中文標準交換碼全字庫(CNS11643)所定義的字根輸入])。 此資料庫所收字集龐大,有許多倉頡碼是自行編入,而非採用朱邦復的編碼表,因而有一些並不符合倉頡輸入法的規則。 但類推時要注意,微軟倉頡收錄的大五字元(如「板」「飯」)多是沿用朱邦復的編碼,即「取碼字形編碼」,大五未收而萬國碼加收的字元(如「坂」),則是微軟自行按萬國碼收錄的標準字形擴充編碼,往往便符合「常見字形編碼」;許多市面上通行的倉頡也有類似情況。 朱邦復淡出資訊界後仍先後公布了一些編碼,且處理了一定的容錯問題,因此較晚開發的倉頡輸入法(若是採用朱邦復的編碼表)一般較少此類問題。
凸倉頡: 五代字首分割爭議編碼
Windows 2000以後的版本,開始支援萬國碼時,非大五字(多爲簡化字及罕用字)的倉頡編碼是由微軟人員自行擴充,這些編碼的擬定並沒有與朱邦復團隊溝通,於是有些字的編碼不符合倉頡輸入法的規則。 除非改用倉頡系統的架構,否則任何形碼輸入法都可能發生這種「顯示字形不同於取碼字形」的問題。 要解決這種困擾,開發者必須盡可能把「字」的各種異體字形編入輸入法與內碼的對應關係,也就是所謂的「容錯碼」。 凸倉頡2023 比如有些倉頡輸入法開發者會把「戈十金金」和「戈木木」都對應到「麻」(U+9EBB)字,令使用者無論是在螢幕上看到「」或「」,取碼「戈十金金」或「戈木木」都能打出「麻」(U+9EBB)字。
其中「的」、「止」為基本字母,單字分別取碼「的(H)」和「止(X)」,「竹」字改為拆開取碼「人中人弓」。 「片」字為特殊鍵,用於輸入符號或取一些複雜的輔助字形,「片」本字則取碼為「中中一尸」(異體為「中中一中」)。 朱邦復團隊於2001至2002年即已完成六代倉頡,漢文庫典等網站是以該架構運作。
凸倉頡: 三代與二代之差
初期只有正體中文版本,原名「形意檢字法」,用以解決電腦處理漢字的問題,包括漢字輸入、字形輸出、內碼儲存、漢字排序等。 朱邦復發明此輸入法時正值他為三軍大學發展中文通訊系統之際,時任三軍大學校長的蔣緯國為紀念上古時期倉頡造字的精神,乃於1978年將此輸入法重新定名為「倉頡輸入法」。 1982年,朱邦復登報公開放棄倉頡輸入法專利權,並且極力推動電腦的中文化。 現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,繁體中文鍵盤也大多印有倉頡輸入法的字根。 凸倉頡 倉頡輸入法適用於多種平台,主流的中文作業系統和大部分電子辭典均有內建。 早期正體中文版的微軟Windows系統用收字較少的大五作內碼,這萬三多字的倉頡碼是沿用朱邦復公佈的編碼,比較準確。
- 然而,輸入法開發者在容錯的努力不一,於是各版本的倉頡輸入法都有程度不一的「看字取碼卻打不出字」問題,使用者需要另行理解某些字的取碼字形,才能順利打出那些字。
- 朱邦復團隊架設漢文樂園、漢文庫典時,為統一紛亂的倉頡輸入法版本,一併公佈了2003年版五代倉頡,但當時僅以文字敘述[2],未上網公開完整規則,合作網站也未跟進,目前較通行的五代倉頡仍是1999年版。
- 現今大部分作業系統,甚至一些電子辭典皆附有倉頡輸入法,繁體中文鍵盤也大多印有倉頡輸入法的字根。
- 而分體字可拆開為2至3部份,最少
- 2003年版五代之相關資料並不完整,以下所列六代與五代之差異皆以1999年版五代倉頡為參照基準。
倉頡輸入法同時應用於正體字和簡化漢字,但早期應用三代編碼的作業系統中,大都以繁體中文的大五碼作系統的內碼,缺乏簡化字的倉頡碼。 而部份系統的設計者自行釐定簡化字倉頡碼,如國喬系統、微軟Windows等,以致拆碼各異。 後來,朱邦復先生公佈五代倉頡碼表,把正體字、簡化字一併編碼,以統一各家差異,詳見下方說明。 倉頡輸入法是一種常用的中文輸入法,由有「中文電腦之父」美譽的朱邦復先生於1976年創製。
凸倉頡: 中文標點符號的倉頡碼
倉頡系統的本質無此問題,且為避免重碼而沒有收錄太多異體字形,如朱邦復當初只公布「↔戈十金金」,而未公布「↔戈木木」。 此外,六代也取消了五代將部分漢字的「癶」、「𡗗」、「夂」、「」字形下緣視為不可「一刀分離」的取碼方式,回復三代的做法,統一視這些字形的下緣可「一刀分離」。 三代將「癶」、「𡗗」、「夂」、「」類字形下緣統一視為可「一刀分離」。 五代將部分漢字改視為不可「一刀分離」,但仍有部分視為可以,實際編碼不統一,有很多例外(詳見〈特別注意〉,此不盡列)。
下表依常見字形的倉頡編碼排序(三、五代不同者並列之,並以三代優先),列出一些取碼字形不同於常見字形的字例。 凸倉頡2023 倉頡系統最初的規劃是統一以倉頡碼作為輸入、内碼、渲染基礎,因而顯示字形和輸入編碼一致;如用者看到「」字形,並依照規則取碼輸入「戈十金金」,則系統必定渲染出「」字形;如想在螢幕上看到另一字形,比如「」,就必須輸入另一組倉頡碼「戈木木」。 即使對倉頡輸入法規則相當熟悉,實際取碼輸入時,仍可能因某些問題無法順利打出想要的字。
凸倉頡: 凸倉頡 「粒」同「突」倉頡或速成點樣打?
在發明倉頡輸入法之前,世上還未有能以英文鍵盤快速輸入中文漢字的方法,所以發明倉頡輸入法是中文電腦發展的其中一項突破。 六代新增了反字身規則:左右形()或左下-右上形()組合字的字身若為以下定義的組合,則「字首」「字身」互易成為「反字身」與「反字首」。 普通漢字先取字首,再取字身,最多取「二・三」碼;反字身漢字則先取反字身,再取反字首,最多取「三・二」碼。 反字首取碼比照字首,最多兩碼,超出者取頭、尾;反字身取碼比照字身,最多三碼,並且可細分作次字首和次字身。 凸倉頡 凸倉頡 朱邦復團隊於2001至2002年即已完成蒼頡檢字法(俗稱蒼檢或六代倉頡),漢文庫典等網站是以六代架構運作(漢字圖片檔名即以是六代倉頡碼),朱邦復工作室提供的倉頡電書套裝軟件也提供了六代倉頡輸入的功能。
Windows爲目前中文電腦之主流作業系統,其內建的中文輸入法也最多人用。 今日習稱的「三代倉頡」、「微軟倉頡」多是指Windows系統內建的倉頡輸入法或新倉頡輸入法。 凸倉頡2023 這是倉頡字典,可查詢倉頡碼和速成碼,同時提供「三代倉頡」及「五代倉頡」的倉頡碼。 收錄19000餘字,當中約有8000個常用字配有拆碼圖解。 有些字的編碼雖是由朱邦復團隊親自釐定,但其作法與其他相似字頗不一致,因而一般認為可能有疏失或錯誤。 一些倉頡輸入法開發者為便利使用者,會修改有爭議的官方編碼,或加上容錯碼。