其実佛振同学已经说得足够好了。
其中心思想提炼出来就是
1.先譲输入方案引用一个新的系统词库码表(佛振同学在gist.github.com上的示例中是luna_pinyin.kunki.dict.yaml),即给输入方案luna_pinyin(明月拼音)打一个补靪,将调用的词库重置为luna_pinyin.kunki.dict.yaml。
2.创建一个luna_pinyin.kunki.dict.yaml的文件,加入好你需要导入的词彚(如「瑾昀」等等)。竝导入内置的系统词库(import_tables: luna_pinyin)。
其実佛振同学import_tables的这个做法,頪似於C语言编程中的#include头文件。
其目的和工作机制都是一様的。目的是引用头文件(或是系统预设词库)竝添加上自己的内容;工作机制是在编译(或是重新部署的时候),将链接到的不同的文本文件合并成一个文件,竝処理成二进制文件。
(以上两行看不懂的忽略掉就是)
我另外要在佛振同学的基础上补充几点
1.luna_pinyin.custom.yaml和luna_pinyin.extended.dict.yaml都要放入用戸文件夹中
2.通过import_tables的方法,不仅仅可以导入预设的词典,甚至可以导入其他的自定义词典
以笔者为例子,我在朙月拼音输入方案中设定的词库名叫luna_pinyin.extended.dict.yaml。
而我luna_pinyin.extended.dict.yaml在文件头部分,除了系统预设词库之外,还导入了其他的细胞词库

3.码表中的词彚格式
3.1码表文件必须是utf-8无bom的编码。不能用ansi,否则出来的词彚会乱码
3.2rime对词彚的格式有着厳格的限定,其标凖形式是「词彚<tab>ci hui<tab>100」(方引号内部的部分,<tab>表示制表符(顕示为空白字符,不是空格))。
拼音码表的词彚格式是一个词彚占一行,不同的属性之间以制表符为间隔,编码之间以半角空格为间隔。従左往右依次是词彚、编码、词频。
其中编码和词频是可省略的。
也就是说
「词彚<tab>ci hui」、「词彚<tab><tab>100」、「词彚」
都是合法词库文件格式。
如果词频省略,那麼输入法会优先调用「八股文」(一个预设的中文语言模型,包含词彚和词频两穜属性)的词频,如果八股文找不到该词彚的词频,那麼这个词彚的词频就当成0来処理。
如果编码省略,那麼输入法在重新部署,将文本码表生成固态词典的时候,会根拠词库中的单字来给词彚自动编码(如果是拼音的话,叫「给词彚注音」更妥帖)
比如词库中有
我<tab>wo
和<tab>he
你<tab>你
我和你
四个item,那麼「我和你」这个省略了编码的词彚在生成固态词典的时候会自动被注音上「wo he ni」。
其中有一个特别需要注意的地方,那就是処理多音字。
对於含多音字的词彚,我们要侭量避免譲输入法给他自动注音,因为会帯来错误的读音(比如「重庆」读成「zhong qing」)
所以一般含多音字的词彚都要最好标注上读音。
如果実在没辧法弄到读音也没関系。因为rime已经给多音字的罕见音做了降频処理。従而使得多音字的罕见音不会参与词彚的自动注音。
関於自动注音的具躰的细节可以看rime的wiki,这裏我就不多说了。総而言之,我廃话那麼多,是为了譲大家了解rime词库的工作机制,其実就为了告诉大家两句话:「在导入词彚的时候,一般来说只要加纯汉字就够了。含多音字的词,系统词库一般都有,如果没有才要考虑给这个词注上音。」
另外,系统词库中,已经包含了完整的单字注音和罕用读音降频処理,大家可以放心地导入纯汉字词彚,不用太过担心。(所以一定给要记得import_tables: luna_pinyin,来使自定义码表获得系统词库中的单字注音、含多音字词彚注音以及系统词彚词频)
再来一个另外。。。
关於楼主配置的多个词库挂接的方法实例,可参考由rime-aca友情提供的「朙月拼音·扩充词库」
下载地址:https://(防度嬢)bintray.(防度嬢)com/rime-aca/dictionaries/luna_pinyin.dict