一些筆記
我輸入舊假名與舊日文漢字的方式
我輸入舊假名與舊日文漢字的方式是用 Emacs 的 japanese-katakana 輸入法輸入假名,然後用注音輸入法輸入漢字。這是因為日文舊字體漢字與繁體中文漢字差異較小,這樣比較容易打出符合原文的漢字。
OCR
這個數位化沒有使用光學字元辨識 (OCR)。前言等文章的部分或許有 OCR 能使用,但這本書最大宗的部分是植物列表,而我認為這部分複雜的程度需要我自己親手處理過才比較有自信能說是沒有問題的。
etc.
The book uses POJ for Taiwanese (and even includes an introduction to POJ and Taiwanese tones).
Each entry is:
- scientific name (the word(s) after the comma are the name of the person who published the scientific name; this convention is still alive to this day)
- Indigenous (full-face) or introduced / cultivated (italics)
- Japanese name (in Romaji)
- Taiwanese name (in POJ)
- “Kanton dialect” (actually Hakka, in POJ) (italics)
- Aboriginals name (including which people)
- Where it's found
- [category and such]