2010年5月27日木曜日

もずくに純正の設定とか辞書のGUIがついた。

更新されたファイルを見る限り、今回の変更はアルゴリズム周りではなく、GUIの追加がメインみたい。
設定ツール起動用のアイコンがないんで、追加しようと思ったんだけど、設定パスが見当たらなかった。ソースも見てみたけど、ちょっと見つけられない。

まあ、これまでも設定そのものは、一度行った設定で困ってなかったし、辞書ツールもOSSで提供されてたのがあったので、さほど困ってなかったんだけどね。
純正の安心感ってのはあるとして、単語登録するときに、きちんと品詞を選択できるようになった、ってのは使い勝手的には大きいかな。
正直、いちいち調べて品詞入力ってのは、ちと勘弁とか思ってたので。
試してはないけど、メニューとかを見る限り、辞書へのテキストからの一括登録や、ユーザー辞書のエクスポート、ユーザー辞書の追加なんかも出来るようになってるっぽい。
これで、ほぼWindows版と同じだけの機能は提供されたと思っていいんじゃなかろうか。
もう、これでWindowsユーザーや、Macユーザーに、「Linuxは、日本語入力の環境が貧弱だからなぁ」なんて言われなくて済む。
#今まで言われてたかどうかは知らんが。

いずれにせよ、例えば、Windowsから、Linuxに移行したユーザーが、なんだこれ、日本語まともに変換できないじゃん、ってことにはならなくなるのは大きいよね。

これに刺激されて、JustSystemとか、ATOKのバージョンアップとかやってくれると面白いんだけどな。
その他のメーカーが参入したりさ。
いずれにせよ、競争が起きないとよくならないから、他のメーカーとか変換エンジンにも頑張ってもらいたいところ。(笑)

2010年5月24日月曜日

Bloggerの投稿画面から投稿

もしかしたら、Bloggerの投稿画面から投稿するのは初めてかも知れない。
これまでは、たいていの場合、ScribeFireで投稿してたし。
んで、これ使い勝手悪いね。(笑)
ダメだこりゃ。

2010年5月22日土曜日

特にネタはない。

こう、IMEを変更した時なんかは、何か書きたくて書きたくて、仕方ないんですが、たいていの場合は、それほどネタがない。(笑)
今回も、その例に漏れず、特にネタらしいネタもなく。

こっちのブログには、PCやLinuxに限らず、なんでも書いていこうと思って作ったブログなんですけどね。
ただし、特にテーマも設けてない分、逆に書く事もなかったりするので、長時間放置されてしまったりします。
この前もずくの記事を書くまでは、ずいぶん期間が開いてしまいました。
ブログ小説でも書けばいいんですかね。(笑)

こっちのブログは、日に一件もアクセスがないようなブログなので、思い切ったことが書けたりするんですが〜。

小説とか絵画、音楽なんていう芸術性の高いものは、満たされた人間には出来るものではない、なんてことを聞いたことがあります。
まあ、言われてみれば、確かに、なんて思うこともありますが。
そんでも、最近のライトなミステリとかラノベに代表される作品なんかは、そうでもないんじゃないのかな、と思わないでもないんですが、社会的地位も、お金も、家族もきちんと持っているけれども、満たされない、そんな人もいるのかも知れません。
ただ、文学小説とか、なんか満ち足りたひとが、仕事として書いた、計算された描写の、作者の人間性が感じられないような作品を読んでも詰まらんだろうな、と思わないでもないですが。

いわゆる文学作品っていわれる作品を読むと、割と思うのが「この作者、実は気が狂ってたんじゃないのか」ってことですがね。
夏目漱石のこころ、なんかもそうですし、川端康成のみずうみ、雪国、この辺もそうですし。
武者小路実篤なんかもか。
古い探偵小説の夢野久作なんかもそうですけどね。

まあ、時代的な不満なんかもあったのかも知れませんし、疑問とか。
そういうなんらかの満たされない気持ちがないと、文学とかは書けないんだろうな、なんて思ったりはするんですが。
今時はそうでもないんですかねぇ。

2010年5月21日金曜日

しばらくこっちは放置だったねぇ。

日本語環境のことは、こっちに書こうと思ってたんですが。
しばらくこっちは放置でしたね。
ibus-mozcがOSSとして提供されて、Linuxの日本語環境は、劇的に改善したんじゃないかと思います。
Googleから提供される標準の辞書は、IPA相当ということで、単語数なんかは不足しているのかも知れないんですが、Anthyのモデファイをしていた有志の方々が、さっそくもずく用の人名辞書とかを展開していて、辞書強化も進んでいるようです。
まあ、うかつに変な単語を大量に登録すると、変換効率が落ちてしまうのがこの手の変換エンジンの宿命みたいなところがあるんですが、こうして使ってる感じでは、IPA辞書でも、単語を追加した辞書でも、変換効率も、変換の性能も落ちた感じはしません。
予測変換そのものも、けっこう高い精度で候補を出してくれるので、「日本語を入力する」という操作に置いて、従来のAnthy環境よりも、格段に向上した、と言えるのではないかと、ワタクシは考えています。

もずくにする前は、ATOKを使っていました。
さすがに、ATOKは、商用アプリだけのことはあり、変換効率や、補助辞書を使った用例の表示、単語の意味の表示など、文書作成、校正のための機能まで充実しており、OSSのもずくと比較すると機能的には一歩先をゆく印象です。
まあ、将来的にはもずくにも、似たような機能が載るのかも知れないんですが、現時点では、ATOKに一歩甘んじるところがある、ってことですね。

ただ、これは機能面の話であり、変換エンジンとしての性能、精度で比較するなら、決してATOKに劣るものではない、というのがワタクシの感触です。
もずくの変換精度は素晴らしい。特に文節区切りの認識が素晴らしく、少しくらい長めの文章を入力しても、文節の区切り直しはかなり少なくなってます。
もちろん、短い単位での変換の際にも、それは有効に働いています。

また、切り直して確定した結果は、学習結果として保存されており、次回変換時には、それを優先的に採用してくれることも、非常に便利なところだと思います。
もちろんATOKでも、そういうところは充実しているのですが、Anthyが、この辺が壊滅的にダメなので、Anthyからの乗り換えだと、日本語入力は、劇的に改善された、とすぐに感じることが出来るんじゃないでしょうか。

提供当初は、キーバインドが変更できない、など、機能的な不足が目立っていましたが、そこはOSSの威力なのか、別のプロジェクトとして、GUIからキーバインドを変更するツールなども提供され始まりましたし、またユーザー辞書への単語登録も、CLIツールではありますが、提供されました。
#これらは、今後GUI化するそうです。
正直、この進化の速さというのが、OSSの強みなのか、と驚くところもありますね。
こんなに早く、いろいろな問題が改善されていくとは思ってもなかった、というのが正直なところです。

LinuxというOSはグローバルなものですが、日本語環境としてしまうと、日本固有のローカルな問題になります。例えばMSのWindowsなんかは、それらも手を抜かずにきちんと対応してくれますが、OSSのLinuxの場合、ローカライズに裂ける人的リソースの問題は常につきまとい、なかなか改善されていかない状態だったのではないか、と見ています。
事実、Anthyも事実上開発は停止していますし。
そんななか、皆から待望されていたとはいえ、いつ出るのか解らなかったGoogleIMEのOSS版、もずくの登場というのは、日本のLinuxerに取って、劇的な変化ではなかろうか、と思うわけです。
これが標準になれば、「Linuxの日本語環境って貧弱だよね」とは決して言われなくなるのみならず、標準のIMEということで考えるならば、MacOSのことえりは言うに及ばず、WindowsのMS-IMEをも軽く凌駕した環境が標準で提供されることになります。

まあ、Googleの思惑がどこにあるのかは、今のところ解りませんが、今後もきちんとOSSに反映される形で、もずくが提供され続けるなら、日本のLinuxerのGoogle支持は絶大なものになるんでしょうね。

もずく登場のおかげで、「日本語を書く」という、日本人に取っては、最も当たり前のことが、ストレスなく実現できる。これは、本当に日本のLinux環境に取って、歴史的なターニングポイントになるのかも知れませんよ?

2010年1月29日金曜日

最終回答なのかも。

結局、アスワンの日本語入力をATOKに戻してみた。
これが、以前に使ってたときより、快適に動作する。
たぶん、SSD化の影響だと思うんだけど。
前に試したときは、素のままのHDDだったし、まあ、性能的には、ね。
なので、それほど速くないSSDだけど、辞書アクセスみたいな頻繁にアクセスするような状況には、効くのかも知れない。
実際、Anthyと比較すると変換効率は全然違う。(笑)
まあ、そんでも、IIIMFは遅いけどね。もたつきが全然ない訳じゃない、ってのが残念なところ。
なので、iBusーATOKとか、SCIMーATOKとかあると、かなりいいんじゃないかとは思うんですけどね。
無理なんだろうなぁ。
JustSystemさん、どうにかIIIMFから脱却してくれないですか?

2010年1月1日金曜日

とりあえず辞書を入れ替えてみた。

alt-cannadic改が更新されていたので、辞書を入れ替えてみた。
ついでに、余計な人名辞書を削除して変換候補にやたらと人名が並ぶ件に対処。
その際、これまでの学習結果を破棄。
今は、その状態でこれを書いてますけど。

例によって使い込まないとこの辺の感覚は解らないので、なかなか定量的に判断がつかないところ。
難しいんだよね。

新年早々何やってるんだ、という気もしますけど、日本語入力はブロガー(笑)には、非常に重要な要素なので、まあよくなるならなんでも試してみようか、ってところですかね。
それもこれも、Google日本語入力がUbuntuにも導入されさえすれば、一発解決な気もしますけれども。

ま、現状はそれほどおかしな感じもないので、まずはこのまましばらく様子見。