Re:モンテカルロ法 (#1621145) | コンピュータ囲碁プログラムが9段のプロ棋士と対戦、ハンデ付きで辛くも勝利

「コンピュータ囲碁プログラムが9段のプロ棋士と対戦、ハンデ付きで辛くも勝利」記事へのコメント

記事ページを表示すべてのコメント取得

検索54コメント Log In/Create an Account

モンテカルロ法 (スコア:3, 興味深い)

by Anonymous Coward

囲碁はモンテカルロ法を採用したstone（という名前だったと思うけど違ったかも）
というプログラムがブレークスルーになったようです。以前は人間を破るのには
100年かかるなどコンピュータ囲碁の難しさが言われてましたが、モンテカルロ法の
有効性が実証され、いまではコンピュータ将棋より早く人間のプロが倒せるだろうと
すら言われるまでになってます。
モンテカルロ法についてはこのへん [ocn.ne.jp]が参考に
なるかもしれません。
また、モンテカルロ法を使った囲碁プログラ
- Re:モンテカルロ法 (スコア:0)
  
  by Anonymous Coward on 2009年08月11日 21時16分 (#1621145)
  
  素人考えだけれど。
  モンテカルロ法って要は乱数を用いた確率的な計算なのだから、個人的感想としては
  「みっちり理詰めでやるより、適当に運任せでやらせる方が『今のところ』効率がいい」
  という状態なだけなんじゃないかなぁ・・・　という気がします。
  物凄い下手な人間が色々考えるよりランダムに置くほうがまだ強い、みたいな。
  とりあえずランダムに手を進めた中で評価点の高いものを採用するという、とても力任せな手段は、
  コンピュータにはとてもやりやすい方法だとは思うのですが、素人や段位の低めの人くらいなら
  圧倒的な計算量である程度誤魔化せても、上位のプロ相手に安定した戦績を上げれるようになるには、
  この手法は割りとすぐに限界がくるんじゃないかなぁ・・・　という気がします。
  
  シェア
  
  親コメント
  - Re:モンテカルロ法 (スコア:2, 興味深い)
    
    by orcinus (28475) on 2009年08月12日 4時27分 (#1621341)
    
    　あんまり詳しくないんだけど、人工知能学会誌のVol. 24 No. 3の特集を読んだ感じだと、モンテカルロツリー探索は、「ある局面から終局までランダムに打った場合、勝ちが多くなる局面を採用する」というゲーム木の探索法のことだったと思う。このアルゴリズムの都合上、シチョウアタや大石のアタリを見逃したりしやすいんだそうな。
    
    シェア
    
    親コメント
    - Re:モンテカルロ法 (スコア:3, 参考になる)
      
      by orcinus (28475) on 2009年08月12日 8時24分 (#1621375)
      
      もう一度読み直したら，間違ってたので訂正します．大石のアタリの別の話と勘違いしてたみたいです．うろ覚えで書くものではないですね．
      　正しくは，モンテカルロ木探索（正確にはUCT(Upper Confidence Bound)木探索）は，ヨセには強いけど，最善手が1手だけの長手順が苦手ということらしいです．シチョウやナカデが絡む死活や攻め合いが苦手とのこと．勝つときは細かく勝ち，負けるときは大差になりやすいのだとか．
      
      シェア
      
      親コメント
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    結局は処理能力不足を補う苦肉の策なわけで
    3手先まで完全に網羅するよりも、20手先の可能性の0.00001%でも抑えた方が有用という考えですから
    限界が来るというよりは、限界を無理やり突破しているという感じかと
  - Re: (スコア:0)
    
    by Anonymous Coward
    
    「考えもなしに圧倒的な計算量でごまかしている」というのは
    そもそもコンピュータが将棋や囲碁をやってる時点で当然なのですが、
    そんな中でも計算量に強引にものをいわせるのは、モンテカルロではなく
    むしろ全探査型のアルゴリズムの方じゃないですかね。
    プロの人間の「理詰め」だって、別に数手先までで既に
    何百万通りだかになるだろうあらゆる可能性を全部探索してるわけではなく、
    ランダムなひらめきと理詰めを適宜組み合わせてやってるわけで。
    全探索を放棄することで遥か先まで読む長考が得られ、代わりに3手先も読めないポカがごく低い確率で混在したとしても、
    それが人間に近くて勝率が高くなったというのであれば、そうなんでしょう。
    仮にアルゴリズムが変わらずに、コンピュータの速度が今の10倍とか1万倍にしたとしても、
    やっぱり全探査型のアルゴリズムよりもモンテカルロが強いんでしょうし、どっかで逆転するとは思いませんが。
    - Re:モンテカルロ法 (スコア:1)
      
      by M-FalconSky (8868) <reversethis-{moc ... als+ykS.noclaFM}> on 2009年08月12日 9時27分 (#1621395) ホームページ日記
      
      逆転するとしたら、持ち時間中に全探索空間を検索できるようになるほどの計算能力が手に入るころ、かな?
      # 評価関数の決定方法も気になるなぁ
      
      --
      M-FalconSky (暑いか寒い)
      
      シェア
      
      親コメント

より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。

コンピュータ囲碁プログラムが9段のプロ棋士と対戦、ハンデ付きで辛くも勝利 More ログイン

「コンピュータ囲碁プログラムが9段のプロ棋士と対戦、ハンデ付きで辛くも勝利」記事へのコメント

モンテカルロ法 (スコア:3, 興味深い)

Re:モンテカルロ法 (スコア:0)

Re:モンテカルロ法 (スコア:2, 興味深い)

Re:モンテカルロ法 (スコア:3, 参考になる)

Re: (スコア:0)

Re: (スコア:0)

Re:モンテカルロ法 (スコア:1)

スラド