2009年9月20日日曜日

懲りもせず。

懲りもせずに、再度Anthyのコンフィグファイルなんぞを弄くってて見たり。
G-HALさんのサイトを再度読み直していたら、辞書の変更がある場合には、コーパスも作り直さないとならないらしい。Ubuntuでは、そもそも作り直してないみたいなので、コーパスを無視するように設定を変更してみた。
コーパスが与える影響がどのくらいあるのかは、ワタクシ自身解ってないので、この変更による影響は、ぶっちゃけどういう結果になるのか予測も何も出来ないのが正直なところ。
まあ、開発に関わってるわけでもなく、日本語変換に関してアルゴリズム的な知識があるわけでもないので、試行錯誤の連続になるのはある程度仕方ないのところではあるんですが。
そこそこ長い文節でも、今のところはきちんと切り直してくれるので、このレベルであれば問題はないのかな、と思うんですけどね。

まあ、ねぇ。実際、G-HALさんパッチを適用してから、辞書学習に間してはストレスは減ったなぁ。
標準でこのくらい辞書学習をしてくれて、きちんと保持してくれれば、いうことないんですけど。
今気がついたけど、口語的な変換がちょっと弱いのね。
口語の文節区切ろうとすると、たぶん区切りが見つからないんだろうなぁ。
一発というか、一つの文節として解釈しようとするから、そこそこ無理が出る、と。
まあ、なるほどな、って感じですけど。

もしかしたら。
この手の記事も本館の方に書いた方がいいのかも。
ま、自分用の備忘録である、という点と、パッチ適用結果の確認のために書いてるような内容なので、本館には不適かも。
う~ん。
この設定でOKかな。
これなら結構使えそう。
母艦と共有するか。
この設定だと、Atomではちょっと性能的に厳しいかもしれない。
以前の設定と比較して、ちょっと引っかかるような感じがあるので、変換時に結構CPUに負荷がかかってるものと思われる。
まあ、母艦の方はパワーは売るくらいあるので、あっちはこの設定でも全然問題ないか。
記事一本書いてみないと、文節区切りの結果に関しては解らないかも知れないなぁ。

0 件のコメント:

コメントを投稿