2010年5月21日金曜日

しばらくこっちは放置だったねぇ。

日本語環境のことは、こっちに書こうと思ってたんですが。
しばらくこっちは放置でしたね。
ibus-mozcがOSSとして提供されて、Linuxの日本語環境は、劇的に改善したんじゃないかと思います。
Googleから提供される標準の辞書は、IPA相当ということで、単語数なんかは不足しているのかも知れないんですが、Anthyのモデファイをしていた有志の方々が、さっそくもずく用の人名辞書とかを展開していて、辞書強化も進んでいるようです。
まあ、うかつに変な単語を大量に登録すると、変換効率が落ちてしまうのがこの手の変換エンジンの宿命みたいなところがあるんですが、こうして使ってる感じでは、IPA辞書でも、単語を追加した辞書でも、変換効率も、変換の性能も落ちた感じはしません。
予測変換そのものも、けっこう高い精度で候補を出してくれるので、「日本語を入力する」という操作に置いて、従来のAnthy環境よりも、格段に向上した、と言えるのではないかと、ワタクシは考えています。

もずくにする前は、ATOKを使っていました。
さすがに、ATOKは、商用アプリだけのことはあり、変換効率や、補助辞書を使った用例の表示、単語の意味の表示など、文書作成、校正のための機能まで充実しており、OSSのもずくと比較すると機能的には一歩先をゆく印象です。
まあ、将来的にはもずくにも、似たような機能が載るのかも知れないんですが、現時点では、ATOKに一歩甘んじるところがある、ってことですね。

ただ、これは機能面の話であり、変換エンジンとしての性能、精度で比較するなら、決してATOKに劣るものではない、というのがワタクシの感触です。
もずくの変換精度は素晴らしい。特に文節区切りの認識が素晴らしく、少しくらい長めの文章を入力しても、文節の区切り直しはかなり少なくなってます。
もちろん、短い単位での変換の際にも、それは有効に働いています。

また、切り直して確定した結果は、学習結果として保存されており、次回変換時には、それを優先的に採用してくれることも、非常に便利なところだと思います。
もちろんATOKでも、そういうところは充実しているのですが、Anthyが、この辺が壊滅的にダメなので、Anthyからの乗り換えだと、日本語入力は、劇的に改善された、とすぐに感じることが出来るんじゃないでしょうか。

提供当初は、キーバインドが変更できない、など、機能的な不足が目立っていましたが、そこはOSSの威力なのか、別のプロジェクトとして、GUIからキーバインドを変更するツールなども提供され始まりましたし、またユーザー辞書への単語登録も、CLIツールではありますが、提供されました。
#これらは、今後GUI化するそうです。
正直、この進化の速さというのが、OSSの強みなのか、と驚くところもありますね。
こんなに早く、いろいろな問題が改善されていくとは思ってもなかった、というのが正直なところです。

LinuxというOSはグローバルなものですが、日本語環境としてしまうと、日本固有のローカルな問題になります。例えばMSのWindowsなんかは、それらも手を抜かずにきちんと対応してくれますが、OSSのLinuxの場合、ローカライズに裂ける人的リソースの問題は常につきまとい、なかなか改善されていかない状態だったのではないか、と見ています。
事実、Anthyも事実上開発は停止していますし。
そんななか、皆から待望されていたとはいえ、いつ出るのか解らなかったGoogleIMEのOSS版、もずくの登場というのは、日本のLinuxerに取って、劇的な変化ではなかろうか、と思うわけです。
これが標準になれば、「Linuxの日本語環境って貧弱だよね」とは決して言われなくなるのみならず、標準のIMEということで考えるならば、MacOSのことえりは言うに及ばず、WindowsのMS-IMEをも軽く凌駕した環境が標準で提供されることになります。

まあ、Googleの思惑がどこにあるのかは、今のところ解りませんが、今後もきちんとOSSに反映される形で、もずくが提供され続けるなら、日本のLinuxerのGoogle支持は絶大なものになるんでしょうね。

もずく登場のおかげで、「日本語を書く」という、日本人に取っては、最も当たり前のことが、ストレスなく実現できる。これは、本当に日本のLinux環境に取って、歴史的なターニングポイントになるのかも知れませんよ?

0 件のコメント:

コメントを投稿