AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    А, кстати, какой-нить docker образ, заточенный под под cuda для amazon с Leela есть?
     
  2. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    632
    Пусть попробует. С полным описанием технических деталей - и в прямом эфире.
    Я готов комментировать.

    Опыт показывает, что предварительные прогнозы субъективны и относительны.
    Всё решает эксперимент. Прямая, реальная борьба.
     
    Kesandr нравится это.
  3. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    632
    Сильно сомневаюсь.
    Такой хищнический инстинкт должен быть от Бога. Свыше. Генетически...
    И в целом, у меня - не специалиста в компьютерных делах, но недурного шахматиста - возникает ощущение, что Альфа - вовсе не Зеро.
     
  4. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Насколько понимаю в дальнейшем эту настройку убрали. И в дивизионе 2 и сейчас в дивизионе 1 играет уже обычная версия. И это печально. Потому что версия с Trade Penalty черными выигрывала почти столь же часто сколько и белыми. А обычная версия черными побеждает по большим праздникам. Интересно было бы посмотреть насколько хорошо эта настройка работает против движков посильнее.
     
  5. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    И тем не менее по тем бумагам создали самообучающийся движок уровня ТОП-4: https://www.chess.com/computer-chess-championship (Lc0)
    И даже будет матч этого движка против Stockfish 10 с описанием технических деталей: https://lichess.org/blog/XA7juREAAC4AxZsR/deathmatch-leela-vs.-stockfish :)

    Будут комментарии от ChessNetwork, но наверняка многие бы хотели увидеть комментарии от Вас, если Вам это интересно, конечно)
     
  6. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    И все-таки Stockfish был прав, сыграв здесь Be7. После Rf8, скорее всего, еще быстрее проигрывают.
    Это сначала нули пишет. Потом понимает, что 3 пешки не просто так были отданы)
    -1.60 на 41-й глубине

    AlphaZero - Stockfish 8


    Код:
    FEN: r1bqr1k1/p6p/npp2p2/4p2N/1b1pP3/1P4P1/3B2BP/R2Q1R1K b - - 0 1
    
    Stockfish:
     1/1    00:00    634    317k    +1,51    Bb4-e7
     2/2    00:00    2k    580k    +3,69    Re8-f8 h2-h3
     3/3    00:00    2k    709k    +3,15    Re8-f8 g3-g4 Bb4xd2
     4/4    00:00    3k    959k    +3,45    Re8-f8 g3-g4 Bb4xd2 Qd1xd2
     5/5    00:00    4k    904k    +3,48    Re8-f8 h2-h3 Rf8-f7
     6/6    00:00    6k    1 438k    +2,67    Re8-f8 Bd2-h6 Rf8-f7 g3-g4 Bb4-c3 g4-g5
     7/7    00:00    7k    1 802k    +3,27    Re8-f8 Rf1-f2 Rf8-f7 Bd2-h6 Na6-c5
     8/9    00:00    12k    2 409k    +2,38    Re8-f8 Qd1-c1 Bb4xd2 Qc1xd2 Bc8-g4 Ra1xa6 Bg4xh5 b3-b4
     9/12    00:00    31k    3 893k    +0,67    Re8-f8 Bd2-h6 Rf8-f7 Qd1-f3 Bb4-e7 Qf3-e2 Na6-b4 Qe2-c4
     10/13    00:00    67k    4 484k    +1,41    Kg8-h8 Rf1xf6 Re8-g8 Bd2-h6 Bc8-g4 Qd1-f1 Bg4xh5 Ra1xa6
     11/24    00:00    264k    5 078k    +0,15    Kg8-h8 Nh5xf6 Re8-f8 Nf6xh7 Rf8xf1+ Bg2xf1 Bb4xd2 Qd1-h5 Bc8-g4 Qh5xg4 Qd8-g8 Qg4-f5 Qg8xh7
     12/19    00:00    305k    5 164k    +0,15    Kg8-h8 Nh5xf6 Re8-f8 Nf6xh7 Rf8xf1+ Bg2xf1 Bb4xd2 Qd1-h5 Bc8-g4 Qh5xg4 Qd8-g8 Qg4-f5 Qg8xh7 Qf5xe5+ Qh7-g7 Qe5-h5+ Qg7-h6 Qh5xh6+ Bd2xh6 Bf1xa6
     13/25    00:00    643k    5 742k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     14/13    00:00    660k    5 742k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     15/13    00:00    685k    5 759k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     16/29    00:00    1 220k    6 040k    -1,01    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Ba6-c8 g3-g4 Bc8-e6 Qd1-f3 Ra8-c8 Nh5xf6+ Qd8xf6 Qf3xf6 Rf7xf6 Rf1xf6 Be6xb3
     17/27    00:00    1 564k    6 014k    -0,93    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Ba6-c8 Qd1-f3 f6-f5 e4xf5 Bc8xf5 b3-b4 Qd8-d6 g3-g4 Qd6xh6 g4xf5 Kg8-h8 Qf3-e2
     18/32    00:00    1 868k    6 047k    -0,54    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Rf1-f2 Ba6-c8 Qd1-f1 Bc8-e6 Rf2xf6 Rf7xf6 Nh5xf6+ Kg8-h8 Qf1-f3 Ra8-d8
     19/27    00:00    2 009k    6 070k    -0,48    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Rf1-f5 Ba6-c8 Rf5-f2 Qe7-d6 h2-h4 f6-f5 Bh6-g5 d4-d3 e4xf5 Bc8xf5 g3-g4
     20/29    00:00    2 218k    6 061k    0,00    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-e6 Qe7xe6 Rf6xe6 Ba6-e2 Nh5-f6 Rg8-c8 Bh6-g5 Kh8-g7 Nf6-e8+ Kg7-f8 Ne8-f6
     21/44    00:00    4 192k    6 303k    -0,85    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-e6 Qe7xe6 Rf6xe6 c6-c5 Nh5-f6 Rg8-d8 Nf6-d5 Ba6-d3 Bh6-g5 Rd8-a8 Re6xe5 Bd3-c2 b3-b4 d4-d3 b4xc5 b6xc5 Bg5-d2 Ra8-b8 Nd5-c3 c5-c4 Re5-c5 Bc2-b3 Kh1-g1 Rb8-f8
     22/42    00:00    5 408k    6 377k    -0,26    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-f5 Rf7xf6 Nh5xf6 Rg8-g6 Bh6-g5 d4-d3 Bg2-f3 d3-d2 Nf6xh7 Qe7xh7 Bg5xd2 Kh8-g8 Qf5xe5 Qh7-h3 Qe5-e8+ Kg8-h7
     23/50    00:01    8 934k    6 405k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+
     24/27    00:01    12 377k    6 426k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+
     25/46    00:06    41 522k    6 442k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+ Kf7-f8 Qh7-h8+
     26/52    00:06    41 931k    6 440k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Bh3-g4 Ba6-d3 Qg6-h7+ Ke7-d8 Rd1xd2 Bd3xe4+ Qh7xe4 Qd6xd2 Qe4xc6 Qd2-e1+ Kh1-g2 Qe1-d2+ Kg2-h3 Qd2-h6+ Kh3-g2
     27/42    00:06    42 912k    6 444k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Bh3-g4 Ba6-d3 Qg6-h7+ Ke7-d8 Rd1xd2 Bd3xe4+ Qh7xe4 Qd6xd2 Qe4xc6 Qd2-e1+ Kh1-g2 Qe1-d2+
     28/55    00:06    44 684k    6 409k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Bh3-g4 Ba6-c8 Bg4xc8 Kd8xc8 Qh7xa7 Qd6-d3 Qa7-a8+ Kc8-c7 Qa8-a7+
     29/60    00:07    47 319k    6 006k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8 Qe6xb6+ Kd8-e8 Qb6-e6+ Ke8-d8 Qe6-f6+ Kd8-e8
     30/57    00:10    58 560k    5 809k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8 Qe6xb6+ Kd8-e8 Qb6-e6+ Ke8-d8 Qe6-f6+ Kd8-e8 Qf6-g6+
     31/56    00:11    67 167k    5 890k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     32/56    00:13    78 800k    5 965k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     33/56    00:15    92 370k    6 032k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     34/56    00:20    124 524k    6 173k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     35/56    00:23    145 418k    6 210k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     36/56    00:28    181 269k    6 279k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8
     37/62-    01:43    672 116k    6 498k    -0,10    Re8-f8 Bd2-h6
     37/62-    01:50    716 318k    6 484k    -0,19    Re8-f8 Bd2-h6
     37/62-    03:47    1 433 030k    6 290k    -1,18    Re8-f8 Bd2-h6
     37/62+    05:14    1 971 186k    6 271k    -0,88    Kg8-h8
     37/64    05:29    2 069 330k    6 272k    -0,94    Kg8-h8 Nh5xf6 Re8-f8 Qd1-h5 Rf8xf6 Bd2xb4 Na6xb4 Qh5xe5 Qd8-d6 Qe5xf6+ Qd6xf6 Rf1xf6 Bc8-g4 Rf6-d6 d4-d3 Kh1-g1 a7-a5 Ra1-c1 c6-c5 Bg2-f1 Ra8-e8 Bf1xd3 Nb4xd3 Rd6xd3 Re8xe4 Rc1-c4 Re4xc4 b3xc4 Bg4-e6 Rd3-c3 Kh8-g7 Kg1-f2 a5-a4 Rc3-a3 Be6xc4 Ra3xa4 b6-b5 Ra4-a7+ Bc4-f7 Ra7-a5 Bf7-e8 Kf2-e3 Kg7-f6 Ke3-d2 Kf6-e6 Ra5-a7 Ke6-d6
     38/54-    05:35    2 101 884k    6 273k    -1,03    Kg8-h8 Nh5xf6
     38/54-    05:39    2 133 337k    6 277k    -1,13    Kg8-h8 Nh5xf6
     38/69-    06:12    2 342 910k    6 291k    -1,27    Kg8-h8 Nh5xf6
     38/69+    06:16    2 367 627k    6 292k    -1,15    Kg8-h8
     38/69+    06:19    2 391 634k    6 294k    -0,88    Kg8-h8
     38/69    06:33    2 479 778k    6 302k    -1,25    Kg8-h8 Nh5xf6 Re8-f8 Qd1-h5 Rf8xf6 Bd2xb4 Na6xb4 Qh5xe5 Qd8-d6 Qe5xf6+ Qd6xf6 Rf1xf6 Bc8-g4 e4-e5 d4-d3 Bg2-f3 Bg4xf3+ Rf6xf3 a7-a5 Ra1-f1 Kh8-g8 e5-e6 Ra8-e8 Rf3-e3 Re8-f8 Rf1-d1 Rf8-e8 Re3-e4 Kg8-g7 Kh1-g2 Re8-e7 Rd1-f1 h7-h5 Re4-e5 Nb4-c2 Kg2-f3 Nc2-d4+ Kf3-e3 Nd4xb3 h2-h4 d3-d2 Re5-g5+ Kg7-h6 Rf1-f6+ Kh6-h7 Ke3-e2 Re7xe6+ Rf6xe6 Nb3-d4+ Ke2xd2 Nd4xe6 Rg5-e5 Ne6-d4 Re5xh5+ Kh7-g6 Rh5-g5+ Kg6-f6
     39/62-    07:09    2 715 587k    6 328k    -1,35    Kg8-h8 Nh5xf6
     39/64+    08:26    3 199 049k    6 313k    -1,25    Bb4-e7
     39/64    09:01    3 405 688k    6 286k    -1,31    Bb4-e7 Ra1xa6 Kg8-h8 Ra6-a1 a7-a5 h2-h3 Re8-g8 Rf1-f3 Bc8-e6 Bg2-f1 a5-a4 Ra1xa4 Ra8xa4 b3xa4 c6-c5 Qd1-c2 Rg8-g6 g3-g4 Qd8-c8 Nh5-g3 c5-c4 Ng3-f5 Be7-f8 Nf5-h4 Rg6-g8 Rf3xf6 Bf8-e7 Rf6xe6 Qc8xe6 Bf1xc4 Rg8-c8 Bc4xe6 Rc8xc2 Nh4-f3 Kh8-g7 g4-g5 Rc2-b2 Be6-c4 Be7-b4 Bd2xb4 Rb2xb4 Nf3xe5 Rb4xa4 Kh1-g2 Ra4-a3
     40/51+    09:32    3 588 178k    6 264k    -1,21    Bb4-e7
     40/73    09:45    3 659 240k    6 255k    -1,26    Bb4-e7 Ra1xa6 Kg8-h8 Ra6-a1 a7-a5 h2-h3 Re8-g8 Rf1-f3 Bc8-e6 Bg2-f1 a5-a4 Ra1xa4 Ra8xa4 b3xa4 c6-c5 Qd1-c2 Qd8-f8 g3-g4 c5-c4 Bf1xc4 Qf8-c8 Bc4-d3 Be6xg4 h3xg4 Qc8xg4 Rf3-g3 Qg4xh5+ Kh1-g2 Rg8xg3+ Kg2xg3 Qh5-g6+ Kg3-f2 Qg6-g4 Bd3-e2 Qg4-h3 Be2-f3 Qh3-h2+ Bf3-g2 Qh2-h4+ Kf2-e2 Qh4-h5+ Bg2-f3 Qh5-h2+ Ke2-d3 Qh2-h3 Qc2-d1 Be7-c5 Kd3-c2 Qh3-d7 Kc2-b2 d4-d3 Bd2-c3 Bc5-d4 Qd1xd3 Qd7xa4 Bc3xd4 Qa4-b4+ Kb2-c1 e5xd4 Bf3-d1 b6-b5 Bd1-b3 Qb4-c3+ Qd3xc3 d4xc3 Kc1-c2 b5-b4
     41/67-    10:23    3 883 551k    6 231k    -1,36    Bb4-e7 Ra1xa6
     41/67-    12:39    4 676 876k    6 156k    -1,46    Bb4-e7 Ra1xa6
     41/67+    13:12    4 850 246k    6 120k    -1,36    Bb4-e7
     41/67-    16:48    6 061 754k    6 009k    -1,60    Bb4-e7 Ra1xa6
    
    
    
     
    Alhimik88 нравится это.
  7. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    632
    Не знаю, Бог он или плут.
    Но он реально очень крут!

     
    Boroda, Challenger Spy, Kalvados и 2 другим нравится это.
  8. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Давая Стоку плутовства уроки,
    Он схож со скандинавским богом Локи.
     
  9. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    Насчёт дебютных подстав - похоже, каждой табии посвящалось две партии: каждый движок играл её и белыми, и чёрными. АльфаЗеро не смог выиграть белыми французскую позицию с принятой жертвой на g5. Особо в партию не вникаю, но такое ощущение, что АльфаЗеро продешевил: согласился на лучший эндшпиль. А Стофкиш оказался неподкупен.

     
    Последнее редактирование: 17 дек 2018
    redhelicopter и Edwards нравится это.
  10. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Ради интереса открыл оценку эндшпиля. Стокфиш 10: 4.99, lc0: 2.04
    Лила адекватнее оценивает ничейный эндшпиль. Теперь я видел все
     
  11. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    26:00 Ход в партии Be7 не является ошибкой, выше анализ :)
     
    Alhimik88 нравится это.
  12. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    С чего это вдруг адекватнее??
    Оба не показывают ничью.

    Ты на циферки смотришь что-ли?
     
  13. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    Тот Стокфиш явно играл с эндшпильными базами, оценка у него стояла "ничья".
    Хотя если бы он играл без баз, то по-человечески сыграл бы более адекватно: в ничейном ладейнике просто отфиксировал бы ничью, не пропустил бы белую пешку в ферзи.
     
  14. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Шипов в разборе партий АльфаЗеро говорит о презрении Альфы к сопернику и настройке снижающей ценность ничьей. Но на самом деле таких настроек в Альфе нет. Партия, которая приводится, объясняется совсем по другому:



    Эту позицию Альфа явно оценивает с большим своим преимуществом. Пешка в одном поле от превращения, противник парализован. А то что ресурсов для усиления своей позиции нет, нейронка не понимает. Альфа ходит, ходит, ходит. Выщелкивает 50 ходов и нужно соглашаться на ничью. Но проблему что после h4 Альфа что-то не досчитывает и все равно считает, что ее позиция уже чуть-чуть, но все еще лучше. И механизм выбора хода видит, что если не ходить h4, то будет ничья по правилу 50 ходов (т.е. оценка 0). А если сходить, то оценка скажем 0.1. Естественно выбирается то что больше. И Альфа ради того, чтобы не попасть под правило 50 ходов, просто отдает материал без всякой идеи и компенсации. И иногда запаса прочности в позиции не хватает и Альфа в результате проигрывает. У Лилы есть (или была) такая же проблема, видел несколько партий, которые она проиграла аналогичным образом.

    То есть это просто человеческая недоработка в движке. Не должен движок тупо ухудшать свою позицию, ради того, чтобы не попасть под правило 50 ходов. Возможно в этот момент имеет смысл пользоваться не интегральной оценкой, а ее компонентами. Нейронка ведь выдает шансы на победу, ничью и поражение. Соответственно если после хода вырастает только шанс поражения, а шанс на победу не растет, то не нужно делать этот ход, ради того чтобы избежать ничьи по правилу 50 ходов.
    —- добавлено: 17 дек 2018, опубликовано: 17 дек 2018 —-
    А вот в следующей позиции Альфа просто не досчитала:



    Сыграла Nа2 и пошла на осложнения, скорей всего видя что ее ферзь встает раньше. А это оказался тот редкий случай, когда лишнего ферзя не хватает не то, что для победы, но даже для ничьи.
     
    Launder, Alhimik88, crem и ещё 1-му нравится это.
  15. redhelicopter
    Оффлайн

    redhelicopter Старожил

    Репутация:
    41
    Может все-таки это глюк оценки, которая выдает завышенные 0.1 в свою пользу, хотя там уже явно в пользу соперника?
     
  16. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    Он много там чего говорит, не всему же надо верить.
     
    crem нравится это.
  17. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Не оценка, а статистика доигрываний. А это уже интереснее, за счёт чего статистика доигрываний в этой линии выше.
     
  18. KEV81
    Оффлайн

    KEV81 Учаcтник

    Репутация:
    6
    Надо думать что из за несовершенства доигрываний.
     
  19. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Да нет там никаких "доигрываний". Есть дохождение до конечного узла и оценка его нейросетью. От доигрываний до конца партий отказались где-то в районе AlphaGo Master или AlphaGo Lee.
     
    Undying и Rom нравится это.
  20. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Оценка Альфы в таких случаях тоже не идеальна, но с этим сложно что-то поделать. А вот доработать механизм выбора хода в условиях действия правила 50 ходов достаточно просто.

    Кстати что усугубляет проблему. За эти 50 ходов хождения туда-сюда Альфа успевает потратить всё время. И получается, что ответственнейшее решение о сбросе материала Альфа зачастую принимает на секундах, толком ничего не досчитав.
     
  21. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    А до какого узла доходить и как его оценивать? Я понимаю, что доигрывание идёт не до конца, а до некоторого момента, пока нейросеть не скажет: тут всё понятно, нечего доигрывать дальше, проставляем результат 1-0 или ½. Так что доигрывание есть, но только до мата. Вряд ли прямо в корневой ноде мы принимаем решение о том, что обрываем счёт и возвращаем ход, рекомендованный нейросетью без всякого счёта. Так что в данной ноде какое-то количество рулаутов таки будет, и оценка будет на основании них. Другой вопрос, насколько они глубокие.
    —- добавлено: 17 дек 2018 —-
    Теоретически нет смысла ресетить статистику доигрываний в случае, когда код даёт инкремент счётчика 50-ти ходов. Потому что позиция вполне может возникнуть в результате перестановки, и для неё уже будет наиграна некоторая статистика.
    —- добавлено: 17 дек 2018, опубликовано: 17 дек 2018 —-
    Вообще, по логике доигрывание имеет смысл прерывать в случае рыбы. Потому что если оценка большая, то нам обычно не так уж много ходов надо сделать до мата. А вот когда какой-нить разноцвет, где ещё можно 200 ходов наиграть, то вполне можно и прервать счёт, и то с учётом счётчика 50-ходов.
     
  22. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Нет доигрываний. Движемся по дереву вариантов. Для каждого узла нейронка возвращает вероятности победы, ничьи и поражения. В зависимости от этих вероятностей какие-то ветки считаем более перспективными и движемся дальше по ним. Менее перспективные отсекаем. Когда время на обдумывание заканчивается, то обрываем счет.
     
  23. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    А какие формулы перспективности? Это уже не MCTS. Опять же, какой узел должен быть выбран для пролонгации? Опять же, как выбирать ход, по минимаксу или по статам?
     
  24. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    AZ.PNG

    https://deepmind.com/documents/119/agz_unformatted_nature.pdf
     
    Undying нравится это.
  25. Ondatr
    Оффлайн

    Ondatr Учаcтник

    Репутация:
    41
    Алгоритм AlphaGo Zero может обыграть человека во что угодно
    Выучился сам.
     
  26. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    632
    А как это делается?
    Для этого же нужна оценочная функция. То есть, пусть и усеченная, но обычная игровая программа. Обычный подручный движок.
     
  27. redhelicopter
    Оффлайн

    redhelicopter Старожил

    Репутация:
    41
    Так обученная нейронная сеть и выполняет роль оценочной функции. Именно в том и суть нейросетевого подхода к шахматам: сделать интеллектуальную оценочную функцию. Которая работает непойми как, но дает хороший результат :)
     
    Undying нравится это.
  28. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Интересно, что в популярных сообщениях об АльфаЗеро всегда упоминается нейронная сеть, и практически никогда - поиск UCT, в просторечии "Монте-Карло" (хотя он и не Монте-Карло, в смысле случайности). А ведь это очень существенная часть алгоритма, в которой АЗ тоже сильно отличается от традиционных движков. И нейронная сеть в АЗ используется не только для оценки позиций, но и для управления этим весьма нетривиальным поиском (выбора порядка ходов-кандидатов, на привычном шахматистам языке).
     
    Undying и sovaz1997 нравится это.
  29. redhelicopter
    Оффлайн

    redhelicopter Старожил

    Репутация:
    41
    Думаю, главная фишка-то все же в оценке. Просто потому что всем понятно, что оценочные функции в традиционных движках весьма слабые, и этот аспект действительно нуждается в усилении.
     
  30. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Главная фишка в их сочетании. Потому что если прикрутить тяжелую нейронную оценку к традиционной альфа-бете, качество оценки нивелируется снижением скорости, к которому альфа-бета очень чувствительна.
     
  31. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Есть ещё такой аспект, как выбор ходов кандидатов, который выполняется нейросетью параллельно и вне зависимости от оценки.
     
  32. Ondatr
    Оффлайн

    Ondatr Учаcтник

    Репутация:
    41
    Меня интересует, а каким образом реализуется сохранение-модификация найденных оптимальных параметров?
    Они должны где-то сохраняться, т.е. должна существовать база данных таких параметров, возможно, с гибкой структурой?
     
  33. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    http://www.lczero.org/networks/
     
    Ondatr нравится это.
  34. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
  35. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А они там накручивают рейтинг по системе "камень - ножницы - бумага" ("... - ящерица - Спок").
    То есть каждая следующая версия эксплуатирует какую-то слабость предыдущей, и так по кругу :)