2010年5月21日金曜日

しばらくこっちは放置だったねぇ。

日本語環境のことは、こっちに書こうと思ってたんですが。
しばらくこっちは放置でしたね。
ibus-mozcがOSSとして提供されて、Linuxの日本語環境は、劇的に改善したんじゃないかと思います。
Googleから提供される標準の辞書は、IPA相当ということで、単語数なんかは不足しているのかも知れないんですが、Anthyのモデファイをしていた有志の方々が、さっそくもずく用の人名辞書とかを展開していて、辞書強化も進んでいるようです。
まあ、うかつに変な単語を大量に登録すると、変換効率が落ちてしまうのがこの手の変換エンジンの宿命みたいなところがあるんですが、こうして使ってる感じでは、IPA辞書でも、単語を追加した辞書でも、変換効率も、変換の性能も落ちた感じはしません。
予測変換そのものも、けっこう高い精度で候補を出してくれるので、「日本語を入力する」という操作に置いて、従来のAnthy環境よりも、格段に向上した、と言えるのではないかと、ワタクシは考えています。

もずくにする前は、ATOKを使っていました。
さすがに、ATOKは、商用アプリだけのことはあり、変換効率や、補助辞書を使った用例の表示、単語の意味の表示など、文書作成、校正のための機能まで充実しており、OSSのもずくと比較すると機能的には一歩先をゆく印象です。
まあ、将来的にはもずくにも、似たような機能が載るのかも知れないんですが、現時点では、ATOKに一歩甘んじるところがある、ってことですね。

ただ、これは機能面の話であり、変換エンジンとしての性能、精度で比較するなら、決してATOKに劣るものではない、というのがワタクシの感触です。
もずくの変換精度は素晴らしい。特に文節区切りの認識が素晴らしく、少しくらい長めの文章を入力しても、文節の区切り直しはかなり少なくなってます。
もちろん、短い単位での変換の際にも、それは有効に働いています。

また、切り直して確定した結果は、学習結果として保存されており、次回変換時には、それを優先的に採用してくれることも、非常に便利なところだと思います。
もちろんATOKでも、そういうところは充実しているのですが、Anthyが、この辺が壊滅的にダメなので、Anthyからの乗り換えだと、日本語入力は、劇的に改善された、とすぐに感じることが出来るんじゃないでしょうか。

提供当初は、キーバインドが変更できない、など、機能的な不足が目立っていましたが、そこはOSSの威力なのか、別のプロジェクトとして、GUIからキーバインドを変更するツールなども提供され始まりましたし、またユーザー辞書への単語登録も、CLIツールではありますが、提供されました。
#これらは、今後GUI化するそうです。
正直、この進化の速さというのが、OSSの強みなのか、と驚くところもありますね。
こんなに早く、いろいろな問題が改善されていくとは思ってもなかった、というのが正直なところです。

LinuxというOSはグローバルなものですが、日本語環境としてしまうと、日本固有のローカルな問題になります。例えばMSのWindowsなんかは、それらも手を抜かずにきちんと対応してくれますが、OSSのLinuxの場合、ローカライズに裂ける人的リソースの問題は常につきまとい、なかなか改善されていかない状態だったのではないか、と見ています。
事実、Anthyも事実上開発は停止していますし。
そんななか、皆から待望されていたとはいえ、いつ出るのか解らなかったGoogleIMEのOSS版、もずくの登場というのは、日本のLinuxerに取って、劇的な変化ではなかろうか、と思うわけです。
これが標準になれば、「Linuxの日本語環境って貧弱だよね」とは決して言われなくなるのみならず、標準のIMEということで考えるならば、MacOSのことえりは言うに及ばず、WindowsのMS-IMEをも軽く凌駕した環境が標準で提供されることになります。

まあ、Googleの思惑がどこにあるのかは、今のところ解りませんが、今後もきちんとOSSに反映される形で、もずくが提供され続けるなら、日本のLinuxerのGoogle支持は絶大なものになるんでしょうね。

もずく登場のおかげで、「日本語を書く」という、日本人に取っては、最も当たり前のことが、ストレスなく実現できる。これは、本当に日本のLinux環境に取って、歴史的なターニングポイントになるのかも知れませんよ?

2010年1月29日金曜日

最終回答なのかも。

結局、アスワンの日本語入力をATOKに戻してみた。
これが、以前に使ってたときより、快適に動作する。
たぶん、SSD化の影響だと思うんだけど。
前に試したときは、素のままのHDDだったし、まあ、性能的には、ね。
なので、それほど速くないSSDだけど、辞書アクセスみたいな頻繁にアクセスするような状況には、効くのかも知れない。
実際、Anthyと比較すると変換効率は全然違う。(笑)
まあ、そんでも、IIIMFは遅いけどね。もたつきが全然ない訳じゃない、ってのが残念なところ。
なので、iBusーATOKとか、SCIMーATOKとかあると、かなりいいんじゃないかとは思うんですけどね。
無理なんだろうなぁ。
JustSystemさん、どうにかIIIMFから脱却してくれないですか?

2010年1月1日金曜日

とりあえず辞書を入れ替えてみた。

alt-cannadic改が更新されていたので、辞書を入れ替えてみた。
ついでに、余計な人名辞書を削除して変換候補にやたらと人名が並ぶ件に対処。
その際、これまでの学習結果を破棄。
今は、その状態でこれを書いてますけど。

例によって使い込まないとこの辺の感覚は解らないので、なかなか定量的に判断がつかないところ。
難しいんだよね。

新年早々何やってるんだ、という気もしますけど、日本語入力はブロガー(笑)には、非常に重要な要素なので、まあよくなるならなんでも試してみようか、ってところですかね。
それもこれも、Google日本語入力がUbuntuにも導入されさえすれば、一発解決な気もしますけれども。

ま、現状はそれほどおかしな感じもないので、まずはこのまましばらく様子見。

2009年12月26日土曜日

しばらく放置でしたが。

IMEをSCIMにしてしまいました。
なんだかuimもiBusも調子悪くて。
仕方ないのでSCIMに。
まあ、9.10になったせいか、9.04の頃に悩まされたFireFoxが起動しないって問題は発生しないみたいなので、この際、問題がないならSCIMでも構わないかな、と考えていますが。

問題は、今後SCIMでも問題があることが発覚したとき、どれが一番マシか、選択を強いられること、でしょうかね。(^^;

この辺は、使い込んで行って解ることだったりするので、発覚するまで時間が掛かるのがネックかな。
まあ、SCIMにして、一日しか経ってないので、もう少し使い込んでから検討を開始しようかと。

ふう。

2009年12月12日土曜日

PPA Anthyにて。

PPAのAnthyに切り替えて、そこそこ経過しましたが。
辞書学習は行われているようですが、やはり基本的に辞書の頻度がおかしいのか、辞書情報を正しく使ってくれていないのか、学習結果にヒットしない変換は、相変わらずですね。

この辺、さすにがG-HALさんパッチはよくできていたなぁ、と改めて思います。
最新パッチが、Ubuntuのパッケージに適用できなくなっているので、今のところはPPA版でしのぐつもりでいますが、正直、一度Google日本語入力を使ってしまうと、そして、それが近く使える可能性があることを考えると、早いとこ提供してくれないかな、という想いばかりに囚われてしまいます。(笑)

まあ、ねぇ。まず半年は先だろうな、とは思うんです。
Googleの開発速度をもってしても。
#あそこ、リリース速いからなぁ。

日本語入力で一番の肝は、やはり文節の解析なんだろうな、と思うわけです。
これは、MS-IME使ってても、文節の解析が不適切でイラつかされることがあるので、Anthyだけの問題ではないと思うんですね。

その点、ATOKとかGoogle日本語入力は、きちんと解析しているように見えるし、そもそもGoogle日本語入力は、アプローチがちょっと異なるので、短文節で変換かかるため、思ったより文節の解釈が間違わないんですよね。
#てか、文節の区切りを決定するのが、人間なので、意図通りになるってだけかも。

Anthyでも、短い文節で変換するクセをつけると、実は意外にイケるんですけどね。
ま、そんでも我慢して使ってることには違いがないので。(^^;

今のAnthyしかないような現状は、異常といえば異常なので、早いところライバルが出て、切磋琢磨してもらいたいもんですね。

2009年12月10日木曜日

PPAのAnthy使ってますが。

PPAのAnthyを使っています。
今後の標準になるんでしょうし、まあ、これに慣れておいた方が後々のためなのかな、と。

んでも。
やっぱりなんか変なんだよね。
辞書はG-HALさんパッチ版と同じはずなのに、候補に上がるのがアレと違う。
ってことは、辞書の持つ頻度情報とか正しく解釈されていないのか、それともG-HALさんのパッチが、それらを無視して違う解釈で候補を出しているのか。

まあ、ぶっちゃけ解らないんですが。(笑)

ぼちぼち2週間くらいになるのかな。
学習はきちんと為されているように思います。
まあ、そんでも一部忘れられているというか、覚えてくれない変換結果もありそうな気がしますが。
特に文節区切り。
文節を区切り直して変換確定したときに、覚えてくれないような。バグ?
ま、解りません、これも。
学習のルールとかあるのかも知れないので。
ただ、辞書が比較的新しいcannadic改になっているので、以前ほどの不思議変換はなくなりました。
ちと疑問なのが人名が候補の結構上位に来てしまうのがなんとも。

これらは追加している辞書の頻度が悪さをしている可能性もあるので、素の状態で試さないと評価できない項目かも知れませんが。
日常使用に於いては、今の標準Anthyほど困惑しないで済むんじゃないかな、と思っています。

Google日本語入力が出た今、ほどなくAnthyの時代は終わりなんじゃないか、と思うので、これから大幅改変はないんだろうとは思うんですけどね。

そんでも、ほぼ毎日使うツールなので、いくらかでもマシになるのであれば、マシにしてもらいたいもんだと思いますよ。

ああ、Google日本語、IMEの提供はなさそうですね。
日本語エンジンだけ、Linuxでも動作するかもしれないってことのようで。
まあ、それはそれでOKかな。
IMEは手慣れたものを使いたいし。
変換エンジンが賢くなるだけで、全然違いますからね。
とはいえ。
TABキーで変換候補を切り替えていく、独特の操作になっているから、iBusなりなんなりの対応も大変そうだけど。

2009年12月6日日曜日

Google日本語いいなぁ。

Windows側でちょっと試したんですけどね。
かなりいい感じでした。
少なくともブログとか書く分には全然困らない。
文節切り直しもほとんど発生しなかったし。
たまに不思議変換が出てくるけど。
それと、よく使われる単語には、注釈っぽいものも表示されたりして、結構ね、いい感じなんですよ。
誤用が少なくできそうというか。

Google日本語使うためだけに、アスワンをWindowsにしようかと思ってしまいました。(笑)
そのくらい良かったなぁ。
あっち使ってから、Anthyにすると、結構ね、その差に驚くというか。
今のいくやさん版PPAのAnthyでも悪くはないです。
そんなに困りません。ノーマルのAnthyよりはずっといい。
んでもさ、って思うんです。

Google日本語いいなぁ、とね。
こういうのって、地味に使い勝手が効いてくるもので、良ければ良いほど意識されないから、評価もされにくいんだけど、悪いと操作感が覿面に悪く感じるから難しいんだよねぇ。
一見地味な仕事なんだけど。(笑)

こういうところにGoogleがやってくれた、ってのは嬉しいかなぁ。
ま、ChromeOS絡みから、かも知れないんですが。
ChromeOSがコケても、Google日本語が成果として残るのなら、これはこれでアリだろう、と思うわけです。

ああ、早く使いたいなぁ。
マジでアスワンXPに戻しちゃうかな…。