我之後可能會再修這篇,總之先寫一下。
在進行人力文字辨識的時候,有的時候可能會有漢字是不知道讀音或不知道其他打法的。我的做法是這樣的:
假設我要打這個字:「苜」,但我不知道怎麽打。我知道倉頡的組字法,但我不記得漢字各種元素對應的倉頡碼。
- 我看得出來「苜」是「艹」和「目」組成的。所以我在 Emacs 打出「草」和「目」然後分別看它們的倉頡碼。我以前寫的 cangjie.el 裡面的
cangjie-at-point
就是這個用途。這樣查出來「草」是「廿日十」(代表草字頭是「廿」)、「目」是「月山」。 - 這告訴我「苜」的倉頡碼是「廿月山」。如果會倉頡輸入法的話可以直接打,但我連倉頡的鍵位都不記得,所以……
- cangjie.el 裡我還有寫一個
cangjie-to-han
指令,讓我把直接打在文件裡的倉頡碼轉成相符的漢字。我選擇「廿月山」之後用cangjie-to-han
的輸出是「苜蔝蘨繤萈藈薡萛莧䕎𥄕𦮷𧴹𥢞𦰲𦳮𦱛𧅚𤊾𦵅𦽉𧄒𦳥𦴁𦶔𦲰𦺊𦽖」,也就是 cangjie.el 所用的字典裡面所有倉頡碼是以「廿月山」開頭的字;然後我只要留下需要的字就好。
這樣比真正會倉頡還要慢,但我真的幾乎完全不用記住任何倉頡的細節。