< PrevIndexNext >
PCLOSにことえりの辞書をあげてください
2014年06月25日

 PCLOSがすっかり安定しているので、そろそろ「試用」から「実用」に向けていろいろ揃えたいと思っている。他のディストリを色々試すのも面白そうだが、それはそれ、これはこれ。まずは漢字変換。精度自体は「ことえり」よりずっといいのだが、辞書が鍛えられていない。ことえりのユーザー辞書を書き出して登録するだけでかなり便利になるはず。

 いろいろ調べていたらWnnとかCannaとか、ああそう言えば遠い昔パソコン雑誌で目にしたなぁ、な単語が出てくる。Linuxと言う単語も当時「ついに核融合成功!」くらいな勢いの記事で読んだような気がする。ちんぷんかんぷんだったけど。他にiBusとかMozcとか色々出てきたけど意味わからん(笑)ので、今使っている(?)Anthyに絞る。

 ざっと検索をかけたところ、書き出した辞書ファイルの品詞と単語をひっくり返し、スペース区切りにして、UTF-8に変換すればいいらしい。ホームフォルダの.anthyを覗くとprivate_words_defaultというテキストファイルがいかにもユーザ辞書だ。試しにテキストエディタで変更を加え、ログインし直すとその単語が変換出来るようになった。こりゃ楽勝。

 ところがこのファイルに単語を登録しても、変換出来るのは頭の2〜3行。それ以降のは無視される。順番を入れ替えたり、書きかたを変えたり試行錯誤しているうちに、もしかしてソートしなければいけないんじゃないかと思い至る。試しに1行目に「わ」で始まる単語を登録すると、2行目以降は無視された。なるほど。

 で、テキストエディタで行ソート…出来ないじゃん。このへんはコマンドでやるのが定番か。UTF-8ってsortコマンドでソート出来るのかしらん。よく分からないまま env LC_ALL=C sort udic > udic.new とする。おお、ソート出来てるっぽい。んでこのファイルの中身をさっきのユーザー辞書にごっそり入れたら… 変換出来るのと出来ないのがある。わからん。ソートの方法が悪いのかも知れない。なかなか一筋縄では行かないのであった。

2014年06月25日

 メイン・メニューから「Anthy辞書管理」を選んで霞というのを起動してみる。んー、辞書に書いたものがちゃんと並んでいるのに、変換されないものがある。試しに変換されない単語をひとつ選んで品詞を変えてみる。すると、あれあれ、その単語だけでなく、全ての単語が変換出来るようになった。うまいこと辞書ファイル情報が更新されたようだ。うふふー。辞書登録成功!


< PrevIndexNext >
inserted by FC2 system