アカウント名:
パスワード:
まさか識別子のうち辞書に載ってるもののユニーク数を数えてるだけだったりしないよな?
それにかなり近いです。プログラミング言語の文脈等はほとんど考慮されていません。
1. 関数定義をトークン分け。2. トークン列を抽象トークン列に変換。3. 抽象トークン列からトークンの順序構造を取り除いて、抽象語彙集合を作る。4. それぞれの関数定義の抽象語彙集合の部分集合のうち、全ての関数定義で部分抽象語彙集合が異なっていて、最も大きさが小さくなる様に取る(最小部分中小語彙集合)。5. 抽象語彙集合と最小部分中小語彙集合の大きさの比が冗長度を表していると考えられる。
まずはやってみました、ってことでいうと、なかなか面白い試みだと思いますし、最終的には プログラミング言語だって、背景知識を持った文脈解釈器に、クエリ言語で命令するぐらいのものになるはずで、例えば
「この前のアレの中で一番いい評判だったの100個出して平均も出しといて。出来上がったら教えて」
てな具合に自然言語に近いものになるはずだから、今はイマイチでも いずれいい指標になるかも、ですね。
解釈器に過度な期待をしなければ、今でもselect foo,avg(foo) from bar order by reputation desc limit 100くらいのことは普通にできる。
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
UNIXはただ死んだだけでなく、本当にひどい臭いを放ち始めている -- あるソフトウェアエンジニア
5%って (スコア:0)
まさか識別子のうち辞書に載ってるもののユニーク数を数えてるだけだったりしないよな?
Re: (スコア:2, 参考になる)
それにかなり近いです。
プログラミング言語の文脈等はほとんど考慮されていません。
1. 関数定義をトークン分け。
2. トークン列を抽象トークン列に変換。
3. 抽象トークン列からトークンの順序構造を取り除いて、抽象語彙集合を作る。
4. それぞれの関数定義の抽象語彙集合の部分集合のうち、全ての関数定義で部分抽象語彙集合が異なっていて、最も大きさが小さくなる様に取る(最小部分中小語彙集合)。
5. 抽象語彙集合と最小部分中小語彙集合の大きさの比が冗長度を表していると考えられる。
Re: (スコア:0)
まずはやってみました、ってことでいうと、なかなか面白い試みだと思いますし、
最終的には プログラミング言語だって、
背景知識を持った文脈解釈器に、クエリ言語で命令するぐらいのものになるはずで、
例えば
「この前のアレの中で一番いい評判だったの100個出して平均も出しといて。出来上がったら教えて」
てな具合に自然言語に近いものになるはずだから、
今はイマイチでも いずれいい指標になるかも、ですね。
Re:5%って (スコア:1)
解釈器に過度な期待をしなければ、今でも
select foo,avg(foo) from bar order by reputation desc limit 100
くらいのことは普通にできる。