アカウント名:
パスワード:
chasenには前から対応してましたけど、今回のMeCab対応により、namazu本体とkakasiの両方をメンテナンスするのではなく、特定の形態素解析器への依存を排除する方針を選択した、という意図がより鮮明になったと思います。
参考:ChasenとKakasiとMeCabの形態素解析・わかち書きの比較 [nomadscafe.jp]
まぁ、形態素解析を必要としないN-gram方式の全文検索もいろいろ出てきたので、kakasiのアップデートを期待するよりも、kakasiを使わない方法を模索した方が吉かと。
#「自分でkakasiをhackする」という選択肢もありますが。
早速、和布蕪 [chasen.org]いれて、Namazuをupdateしてみました。
できたNMZ.wを見てみると、わかち書きの精度は確かに良くなっていますね。速度もあがってkakasi [namazu.org]よりは良いものの、namazu.cgiの分解とうまく合わない点はあまり変わらない。namazu.cgiの形態素分析はいまだに独自のままなのだろうか。
perl moduleがCPANにないのもちょっと。自分でMakeするのがたいした手間というわけではないけれど。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
あと、僕は馬鹿なことをするのは嫌いですよ (わざとやるとき以外は)。-- Larry Wall
namazuもそうだが (スコア:1)
そのためのMeCab (スコア:4, 参考になる)
chasenには前から対応してましたけど、今回のMeCab対応により、namazu本体とkakasiの両方をメンテナンスするのではなく、特定の形態素解析器への依存を排除する方針を選択した、という意図がより鮮明になったと思います。
参考:ChasenとKakasiとMeCabの形態素解析・わかち書きの比較 [nomadscafe.jp]
まぁ、形態素解析を必要としないN-gram方式の全文検索もいろいろ出てきたので、kakasiのアップデートを期待するよりも、kakasiを使わない方法を模索した方が吉かと。
#「自分でkakasiをhackする」という選択肢もありますが。
Re:そのためのMeCab (スコア:1)
早速、和布蕪 [chasen.org]いれて、Namazuをupdateしてみました。
できたNMZ.wを見てみると、わかち書きの精度は確かに良くなっていますね。速度もあがってkakasi [namazu.org]よりは良いものの、namazu.cgiの分解とうまく合わない点はあまり変わらない。namazu.cgiの形態素分析はいまだに独自のままなのだろうか。
perl moduleがCPANにないのもちょっと。自分でMakeするのがたいした手間というわけではないけれど。