2009年9月21日月曜日

割と調子良いかも。

コーパスを無視すように設定したAnthyですが、割と良い感じかも。
そんでも、まだ文節区切り時に妙な区切りをすることはありますが、なんぼかマシになった気がします。
たぶん、どこまで行っても、完璧は有り得ないので、このくらいで十分と満足すべきなんだと思うんですけどね。
ま、実際、このくらいきちんと変換できていれば、問題はないかなぁ。
しかし、こうなるとコーパスってどんだけの意味があったんだろうな、と思ってしまったり。
標準のアルゴリズムだと、コーパスあった方が精度が高いのかもしれませんが、万人に使用可能なコーパスってのは困難だと思うので、最初はバカでも使い込んで行くうちに学習結果が蓄積されて、手放せなくなるってのがいいと思うんですけどね。
初期の変換効率の良さはシステム辞書の語彙だとは思うんですが、ある程度使い込んで行くと、特に文節の区切り、よく使う文字、それらは使う人の個性に依存していくものなので、変換結果、学習結果の保持の方が、最大公約数的な辞書やコーパスを充実させていくよりも効率がいいんじゃないかと思うんですが。
ま、Anthyその物の開発は終了しているっぽいので、今後ってのはあんまし期待は出来ないのかも知れませんけど。次があるなら、その辺は考えて欲しいものですよね。

0 件のコメント:

コメントを投稿