アカウント名:
パスワード:
囲碁はモンテカルロ法を採用したstone(という名前だったと思うけど違ったかも)というプログラムがブレークスルーになったようです。以前は人間を破るのには100年かかるなどコンピュータ囲碁の難しさが言われてましたが、モンテカルロ法の有効性が実証され、いまではコンピュータ将棋より早く人間のプロが倒せるだろうとすら言われるまでになってます。モンテカルロ法については このへん [ocn.ne.jp]が参考になるかもしれません。また、モンテカルロ法を使った囲碁プログラ
素人考えだけれど。
モンテカルロ法って要は乱数を用いた確率的な計算なのだから、個人的感想としては「みっちり理詰めでやるより、適当に運任せでやらせる方が『今のところ』効率がいい」という状態なだけなんじゃないかなぁ・・・ という気がします。
物凄い下手な人間が色々考えるよりランダムに置くほうがまだ強い、みたいな。
とりあえずランダムに手を進めた中で評価点の高いものを採用するという、とても力任せな手段は、コンピュータにはとてもやりやすい方法だとは思うのですが、素人や段位の低めの人くらいなら圧倒的な計算量である程度誤魔化せても、上位のプロ相手に安定した戦績を上げれるようになるには、この手法は割りとすぐに限界がくるんじゃないかなぁ・・・ という気がします。
あんまり詳しくないんだけど、人工知能学会誌のVol. 24 No. 3の特集を読んだ感じだと、モンテカルロツリー探索は、「ある局面から終局までランダムに打った場合、勝ちが多くなる局面を採用する」というゲーム木の探索法のことだったと思う。このアルゴリズムの都合上、シチョウアタや大石のアタリを見逃したりしやすいんだそうな。
もう一度読み直したら,間違ってたので訂正します.大石のアタリの別の話と勘違いしてたみたいです.うろ覚えで書くものではないですね. 正しくは,モンテカルロ木探索(正確にはUCT(Upper Confidence Bound)木探索)は,ヨセには強いけど,最善手が1手だけの長手順が苦手ということらしいです.シチョウやナカデが絡む死活や攻め合いが苦手とのこと.勝つときは細かく勝ち,負けるときは大差になりやすいのだとか.
結局は処理能力不足を補う苦肉の策なわけで
3手先まで完全に網羅するよりも、20手先の可能性の0.00001%でも抑えた方が有用という考えですから限界が来るというよりは、限界を無理やり突破しているという感じかと
「考えもなしに圧倒的な計算量でごまかしている」というのはそもそもコンピュータが将棋や囲碁をやってる時点で当然なのですが、そんな中でも計算量に強引にものをいわせるのは、モンテカルロではなくむしろ全探査型のアルゴリズムの方じゃないですかね。
プロの人間の「理詰め」だって、別に数手先までで既に何百万通りだかになるだろうあらゆる可能性を全部探索してるわけではなく、ランダムなひらめきと理詰めを適宜組み合わせてやってるわけで。
全探索を放棄することで遥か先まで読む長考が得られ、代わりに3手先も読めないポカがごく低い確率で混在したとしても、それが人間に近くて勝率が高くなったというのであれば、そうなんでしょう。
仮にアルゴリズムが変わらずに、コンピュータの速度が今の10倍とか1万倍にしたとしても、やっぱり全探査型のアルゴリズムよりもモンテカルロが強いんでしょうし、どっかで逆転するとは思いませんが。
逆転するとしたら、持ち時間中に全探索空間を検索できるようになるほどの計算能力が手に入るころ、かな?
# 評価関数の決定方法も気になるなぁ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
192.168.0.1は、私が使っている IPアドレスですので勝手に使わないでください --- ある通りすがり
モンテカルロ法 (スコア:3, 興味深い)
囲碁はモンテカルロ法を採用したstone(という名前だったと思うけど違ったかも)
というプログラムがブレークスルーになったようです。以前は人間を破るのには
100年かかるなどコンピュータ囲碁の難しさが言われてましたが、モンテカルロ法の
有効性が実証され、いまではコンピュータ将棋より早く人間のプロが倒せるだろうと
すら言われるまでになってます。
モンテカルロ法については このへん [ocn.ne.jp]が参考に
なるかもしれません。
また、モンテカルロ法を使った囲碁プログラ
Re:モンテカルロ法 (スコア:0)
素人考えだけれど。
モンテカルロ法って要は乱数を用いた確率的な計算なのだから、個人的感想としては
「みっちり理詰めでやるより、適当に運任せでやらせる方が『今のところ』効率がいい」
という状態なだけなんじゃないかなぁ・・・ という気がします。
物凄い下手な人間が色々考えるよりランダムに置くほうがまだ強い、みたいな。
とりあえずランダムに手を進めた中で評価点の高いものを採用するという、とても力任せな手段は、
コンピュータにはとてもやりやすい方法だとは思うのですが、素人や段位の低めの人くらいなら
圧倒的な計算量である程度誤魔化せても、上位のプロ相手に安定した戦績を上げれるようになるには、
この手法は割りとすぐに限界がくるんじゃないかなぁ・・・ という気がします。
Re:モンテカルロ法 (スコア:2, 興味深い)
あんまり詳しくないんだけど、人工知能学会誌のVol. 24 No. 3の特集を読んだ感じだと、モンテカルロツリー探索は、「ある局面から終局までランダムに打った場合、勝ちが多くなる局面を採用する」というゲーム木の探索法のことだったと思う。このアルゴリズムの都合上、シチョウアタや大石のアタリを見逃したりしやすいんだそうな。
Re:モンテカルロ法 (スコア:3, 参考になる)
もう一度読み直したら,間違ってたので訂正します.大石のアタリの別の話と勘違いしてたみたいです.うろ覚えで書くものではないですね.
正しくは,モンテカルロ木探索(正確にはUCT(Upper Confidence Bound)木探索)は,ヨセには強いけど,最善手が1手だけの長手順が苦手ということらしいです.シチョウやナカデが絡む死活や攻め合いが苦手とのこと.勝つときは細かく勝ち,負けるときは大差になりやすいのだとか.
Re: (スコア:0)
結局は処理能力不足を補う苦肉の策なわけで
3手先まで完全に網羅するよりも、20手先の可能性の0.00001%でも抑えた方が有用という考えですから
限界が来るというよりは、限界を無理やり突破しているという感じかと
Re: (スコア:0)
「考えもなしに圧倒的な計算量でごまかしている」というのは
そもそもコンピュータが将棋や囲碁をやってる時点で当然なのですが、
そんな中でも計算量に強引にものをいわせるのは、モンテカルロではなく
むしろ全探査型のアルゴリズムの方じゃないですかね。
プロの人間の「理詰め」だって、別に数手先までで既に
何百万通りだかになるだろうあらゆる可能性を全部探索してるわけではなく、
ランダムなひらめきと理詰めを適宜組み合わせてやってるわけで。
全探索を放棄することで遥か先まで読む長考が得られ、代わりに3手先も読めないポカがごく低い確率で混在したとしても、
それが人間に近くて勝率が高くなったというのであれば、そうなんでしょう。
仮にアルゴリズムが変わらずに、コンピュータの速度が今の10倍とか1万倍にしたとしても、
やっぱり全探査型のアルゴリズムよりもモンテカルロが強いんでしょうし、どっかで逆転するとは思いませんが。
Re:モンテカルロ法 (スコア:1)
逆転するとしたら、持ち時間中に全探索空間を検索できるようになるほどの計算能力が手に入るころ、かな?
# 評価関数の決定方法も気になるなぁ
M-FalconSky (暑いか寒い)