アカウント名:
パスワード:
3年経ったので、AlphaZeroの自己対戦型の学習に比べてどれぐらい変わったのか不明だけど
https://ja.wikipedia.org/wiki/Elmo_(%E3%82%B3%E3%83%B3%E3%83%94%E3%83%... [wikipedia.org]
elmoは、過去の電王戦でも活躍した強豪AI「Apery」「やねうら王」がベース。elmo同士の対戦を重ねてどのような手を指すと勝率が高いかを調べ、そうした手を選び出せるように評価関数(形勢判断をする際の指標)を調整。その工夫の結果、より正確な形勢判断ができるようになった。2017年12月、2時間の学習を行
AlphaZeroが最強だったのは一時だけで、今はチェスも将棋も既存手法によるアルゴリズムのほうが強いと考えられています。(AlphaZeroは非公開システムなので誰も追試できないわけですが)
チェスに関する分析↓https://chess.stackexchange.com/questions/29791/which-is-better-stockf... [stackexchange.com]
実際に、AobaZeroというAlphaZeroを再現しようとしたプロジェクトがありますが、現在までのところさほど強くありません。
そもそも論としてCPUとGPUで使うものが違う以上、マシンスペックを揃えた対局というのは原理的に不可能なので、どっちが強いという比較は難しいですが。
既存手法(2駒、3駒関係)の評価関数と、DNN(ディープラーニング)の評価関数のどちらが強いかは使える計算量にもよると考えられてます。評価関数の表現力では、DNN >> 既存手法計算コストも、DNN >> 既存手法
ソフトの強さは、評価関数の表現力・精度と、計算コストの両方が効いてきます。いくら評価関数が正確でも、読める手数が少なければ将棋やチェスでは負けてしまうので。今の時点では、将棋・チェスでは既存手法の評価関数の表現力はまだ限界に達しておらず、同じリソースを使うならDNNより既存手法の方が強いと考えられてます。AlphaZeroの将棋・チェス版は、計算リソースを無視すれば現時点でもDNNが既存手法並みに強くできることを示しただけ。
そのうち既存手法の評価関数の表現力が頭打ちになって、DNNの方が有利になることも、ほとんどの開発者が認めてます。これがいつになるかはゲーム次第ですが、囲碁は既にDNNの方が有利、将棋は今が正に端境期、チェスはもっとずっと先でしょう。
もう一つ既存手法とDNNの中間の手法としてNNUEがあります。https://www.chessprogramming.org/NNUE [chessprogramming.org]CPUで計算できる軽量なニューラルネットワークです。将棋では上位のソフトのほぼすべてに採用されているし、チェスソフトのStockfishにも採用されて大きな成果を上げてます。
これも評価関数の表現力と計算コストのバランスの問題で、今はちょうど中間であるNNUEが最適なのだと私は理解してます。そのうち使える計算リソースがもっと増えれば、将棋やチェスも本格的なDNNに移っていくのでしょうね。
Googleの資金力による学習データの物量が重要なんでしょ
より多くのコメントがこの議論にあるかもしれませんが、JavaScriptが有効ではない環境を使用している場合、クラシックなコメントシステム(D1)に設定を変更する必要があります。
吾輩はリファレンスである。名前はまだ無い -- perlの中の人
AlphaZero (スコア:2, 既出)
3年経ったので、AlphaZeroの自己対戦型の学習に比べてどれぐらい変わったのか不明だけど
https://ja.wikipedia.org/wiki/Elmo_(%E3%82%B3%E3%83%B3%E3%83%94%E3%83%... [wikipedia.org]
Re:AlphaZero (スコア:1)
AlphaZeroが最強だったのは一時だけで、今はチェスも将棋も既存手法によるアルゴリズムのほうが強いと考えられています。
(AlphaZeroは非公開システムなので誰も追試できないわけですが)
チェスに関する分析↓
https://chess.stackexchange.com/questions/29791/which-is-better-stockf... [stackexchange.com]
実際に、AobaZeroというAlphaZeroを再現しようとしたプロジェクトがありますが、現在までのところさほど強くありません。
そもそも論としてCPUとGPUで使うものが違う以上、マシンスペックを揃えた対局というのは原理的に不可能なので、
どっちが強いという比較は難しいですが。
Re:AlphaZero (スコア:1)
既存手法(2駒、3駒関係)の評価関数と、DNN(ディープラーニング)の評価関数のどちらが強いかは使える計算量にもよると考えられてます。
評価関数の表現力では、DNN >> 既存手法
計算コストも、DNN >> 既存手法
ソフトの強さは、評価関数の表現力・精度と、計算コストの両方が効いてきます。
いくら評価関数が正確でも、読める手数が少なければ将棋やチェスでは負けてしまうので。
今の時点では、将棋・チェスでは既存手法の評価関数の表現力はまだ限界に達しておらず、同じリソースを使うならDNNより既存手法の方が強いと考えられてます。
AlphaZeroの将棋・チェス版は、計算リソースを無視すれば現時点でもDNNが既存手法並みに強くできることを示しただけ。
そのうち既存手法の評価関数の表現力が頭打ちになって、DNNの方が有利になることも、ほとんどの開発者が認めてます。
これがいつになるかはゲーム次第ですが、囲碁は既にDNNの方が有利、将棋は今が正に端境期、チェスはもっとずっと先でしょう。
もう一つ既存手法とDNNの中間の手法としてNNUEがあります。
https://www.chessprogramming.org/NNUE [chessprogramming.org]
CPUで計算できる軽量なニューラルネットワークです。
将棋では上位のソフトのほぼすべてに採用されているし、チェスソフトのStockfishにも採用されて大きな成果を上げてます。
これも評価関数の表現力と計算コストのバランスの問題で、今はちょうど中間であるNNUEが最適なのだと私は理解してます。
そのうち使える計算リソースがもっと増えれば、将棋やチェスも本格的なDNNに移っていくのでしょうね。
Re: (スコア:0)
Googleの資金力による学習データの物量が重要なんでしょ