プラグイン集

無料ブログはココログ
2022年10月
            1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31          

サンプルJS

  • ユーロバカ一代の締切
    ・・・初期化中・・・

« バリウム検査 | トップページ | VScode、Atom エディタのポータブル化 »

2022年5月 8日 (日)

RockyLinux 8.5 で Mozc をコンパイル

前回は、CentOS7.4 で Mozc をコンパイルしたが、
今回は、 RockyLinux 8.5 で Mozc に UT第2世代辞書を入れた。

EPEL から スペックRPM を取ってきて、 cpio で展開の流れまでは、前回と同じ。
root 権限対応もソースのコメントアウト部分は変更なし。

前回分からないと言った、UT第2世代辞書との結合は実は簡単だった。
公式サイトの説明の通り、解凍して得られた、「 mozcdic-ut-日付.txt 」を
Mozc ソースの ./src/data/dictionary_oss/dictionary00.txt に追記してあげる。
心配であれば、 Mozc ソースの ./src/data/dictionary_oss/dictionary00.txt をバックアップしてから、
追記すればよい。

残りは、 Mozc をコンパイルしてあげる。
rpmbuild コマンドで頑張るのも変わらず。
コンパイルが終わったら、 yum install ./*.rpm でまとめて入れてあげる。
再起動して、設定から日本語入力に Mozc を追加すると、 UT第2世代辞書 を足した Mozc が使えるようになる。
西木野真姫や花鳥玲愛が一発で変換できるようなって気持ちいい。

※ UT第2世代辞書は、 Neologd の内容を内包しているとのこと。
Neologd は週1のペースで更新されていると言う。
だからファイル名に日付が入ってると思われる。

疑問点、Mozc のシステム辞書?は、追記した dictionary00.txt から dictionary09.txt まであるのだが、
どれが何の役割をしているのかが分からない。
よみがなと漢字表記
「 しまむらうづき 1916 1916 7668 島村卯月 」
の間の数字って何だろう?前との接続コスト、後ろとの接続コスト、単語本体のコストかしら?

UT第2世代辞書、公式サイトの通りUT第2世代辞書自体の更新や、
Rubyのプログラミング技術があれば、単語の情報源を追加できるし、
単語まとめサイトの情報を増やすこともできるだろう。

まとめ

UT第2世代辞書自体の追加は、 tar.bz2 ファイルを取ってきて、
Mozc の dictionary00.txt に追記すればよいと言う事が分かった。
しかし、Mozc のシステム辞書の作りや追加方法についてはよく分からないまま。

« バリウム検査 | トップページ | VScode、Atom エディタのポータブル化 »

パソコン・インターネット」カテゴリの記事

Linux」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« バリウム検査 | トップページ | VScode、Atom エディタのポータブル化 »