アカウント名:
パスワード:
囲碁はモンテカルロ法を採用したstone(という名前だったと思うけど違ったかも)というプログラムがブレークスルーになったようです。以前は人間を破るのには100年かかるなどコンピュータ囲碁の難しさが言われてましたが、モンテカルロ法の有効性が実証され、いまではコンピュータ将棋より早く人間のプロが倒せるだろうとすら言われるまでになってます。モンテカルロ法については このへん [ocn.ne.jp]が参考になるかもしれません。また、モンテカルロ法を使った囲碁プログラ
素人考えだけれど。
モンテカルロ法って要は乱数を用いた確率的な計算なのだから、個人的感想としては「みっちり理詰めでやるより、適当に運任せでやらせる方が『今のところ』効率がいい」という状態なだけなんじゃないかなぁ・・・ という気がします。
物凄い下手な人間が色々考えるよりランダムに置くほうがまだ強い、みたいな。
とりあえずランダムに手を進めた中で評価点の高いものを採用するという、とても力任せな手段は、コンピュータにはとてもやりやすい方法だとは思うのですが、素人や段位の低めの人くらいなら圧倒的な計算量である程度誤魔化せても、上位のプロ相手に安定した戦績を上げれるようになるには、この手法は割りとすぐに限界がくるんじゃないかなぁ・・・ という気がします。
「考えもなしに圧倒的な計算量でごまかしている」というのはそもそもコンピュータが将棋や囲碁をやってる時点で当然なのですが、そんな中でも計算量に強引にものをいわせるのは、モンテカルロではなくむしろ全探査型のアルゴリズムの方じゃないですかね。
プロの人間の「理詰め」だって、別に数手先までで既に何百万通りだかになるだろうあらゆる可能性を全部探索してるわけではなく、ランダムなひらめきと理詰めを適宜組み合わせてやってるわけで。
全探索を放棄することで遥か先まで読む長考が得られ、代わりに3手先も読めないポカがごく低い確率で混在したとしても、それが人間に近くて勝率が高くなったというのであれば、そうなんでしょう。
仮にアルゴリズムが変わらずに、コンピュータの速度が今の10倍とか1万倍にしたとしても、やっぱり全探査型のアルゴリズムよりもモンテカルロが強いんでしょうし、どっかで逆転するとは思いませんが。
逆転するとしたら、持ち時間中に全探索空間を検索できるようになるほどの計算能力が手に入るころ、かな?
# 評価関数の決定方法も気になるなぁ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
一つのことを行い、またそれをうまくやるプログラムを書け -- Malcolm Douglas McIlroy
モンテカルロ法 (スコア:3, 興味深い)
囲碁はモンテカルロ法を採用したstone(という名前だったと思うけど違ったかも)
というプログラムがブレークスルーになったようです。以前は人間を破るのには
100年かかるなどコンピュータ囲碁の難しさが言われてましたが、モンテカルロ法の
有効性が実証され、いまではコンピュータ将棋より早く人間のプロが倒せるだろうと
すら言われるまでになってます。
モンテカルロ法については このへん [ocn.ne.jp]が参考に
なるかもしれません。
また、モンテカルロ法を使った囲碁プログラ
Re: (スコア:0)
素人考えだけれど。
モンテカルロ法って要は乱数を用いた確率的な計算なのだから、個人的感想としては
「みっちり理詰めでやるより、適当に運任せでやらせる方が『今のところ』効率がいい」
という状態なだけなんじゃないかなぁ・・・ という気がします。
物凄い下手な人間が色々考えるよりランダムに置くほうがまだ強い、みたいな。
とりあえずランダムに手を進めた中で評価点の高いものを採用するという、とても力任せな手段は、
コンピュータにはとてもやりやすい方法だとは思うのですが、素人や段位の低めの人くらいなら
圧倒的な計算量である程度誤魔化せても、上位のプロ相手に安定した戦績を上げれるようになるには、
この手法は割りとすぐに限界がくるんじゃないかなぁ・・・ という気がします。
Re: (スコア:0)
「考えもなしに圧倒的な計算量でごまかしている」というのは
そもそもコンピュータが将棋や囲碁をやってる時点で当然なのですが、
そんな中でも計算量に強引にものをいわせるのは、モンテカルロではなく
むしろ全探査型のアルゴリズムの方じゃないですかね。
プロの人間の「理詰め」だって、別に数手先までで既に
何百万通りだかになるだろうあらゆる可能性を全部探索してるわけではなく、
ランダムなひらめきと理詰めを適宜組み合わせてやってるわけで。
全探索を放棄することで遥か先まで読む長考が得られ、代わりに3手先も読めないポカがごく低い確率で混在したとしても、
それが人間に近くて勝率が高くなったというのであれば、そうなんでしょう。
仮にアルゴリズムが変わらずに、コンピュータの速度が今の10倍とか1万倍にしたとしても、
やっぱり全探査型のアルゴリズムよりもモンテカルロが強いんでしょうし、どっかで逆転するとは思いませんが。
Re:モンテカルロ法 (スコア:1)
逆転するとしたら、持ち時間中に全探索空間を検索できるようになるほどの計算能力が手に入るころ、かな?
# 評価関数の決定方法も気になるなぁ
M-FalconSky (暑いか寒い)