アカウント名:
パスワード:
タレコミ人が利用してみたところ、キーワードに日本語をサポートしていることを発見したのですが、インデックスされたソースコードが少ないのかキーワードがまずいのか結果は良くありません。
ソースコードの中身を検索するものですから、日本語をキーワードにして探すのは得策ではないよ。タレコミ人さんの例でいえば、"ソート" ではなく "sort" で探
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
身近な人の偉大さは半減する -- あるアレゲ人
(オープン)ソースコードに日本語を書く人は少ない (スコア:3, 興味深い)
ソースコードの中身を検索するものですから、日本語をキーワードにして探すのは得策ではないよ。タレコミ人さんの例でいえば、"ソート" ではなく "sort" で探
日本語検索の問題 (スコア:0)
全文検索の主流ってなに? (スコア:1)
n-Gram とかはどうなってんだろうな~とか。
#無知をさらけ出したいのでID
屍体メモ [windy.cx]
Re:全文検索の主流ってなに? (スコア:1)
うろ覚えですが、例えばMitakeSearchがソレをやってるんじゃありませんでしたっけ?
辞書方式は限度が有ると思っています。
用語集をロクにメンテしてないプロジェクト(藁)でNamazuを使って、地獄を見ましたんです。
「業務で使ってる、あの単語が、全然ヒットしないやん!」というお叱りを頻繁に受けるんですが、
「じゃあ検索させたい単語を挙げてください。そうすれば辞書に追記しときますから」と返答したら、
相手はダンマリになってしまう、という…。とほほ。
#しかもNamazuって、ちょうど不味いことに、
#単語1つづつなら検索できるんだけど、複数の単語の所定の並びを検索できないんだよね。
#だから個々の単語が辞書に収録されてても、それの並びが出てくる個所を、狙い撃ちで検索できない。
#2つか3つの一般語の並びから成る業務用語とかが、全滅するんだ。
#いっぽうで人間は、一般語の並びから成る語を別途登録しないとならないという状況を、感覚的に受け入れにくいみたいで。
まあデスマなプロジェクトはどうでもいいんですが、
外向きの検索エンジンで、どんな単語を検索語とするか判ったものじゃないという状況では、
同じように辞書方式は破綻しやすいと思います。
N-Gram(どういうのか知らないけど)とか
SuffixArray(かな?)とか、
ああいう非辞書な方式のほうが、将来が有ると思ってます。