AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    А, кстати, какой-нить docker образ, заточенный под под cuda для amazon с Leela есть?
  2. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    50.416
    Симпатии:
    11.163
    Репутация:
    454
    Адрес:
    Москва, Россия
    Оффлайн
    Пусть попробует. С полным описанием технических деталей - и в прямом эфире.
    Я готов комментировать.

    Опыт показывает, что предварительные прогнозы субъективны и относительны.
    Всё решает эксперимент. Прямая, реальная борьба.
    Kesandr нравится это.
  3. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    50.416
    Симпатии:
    11.163
    Репутация:
    454
    Адрес:
    Москва, Россия
    Оффлайн
    Сильно сомневаюсь.
    Такой хищнический инстинкт должен быть от Бога. Свыше. Генетически...
    И в целом, у меня - не специалиста в компьютерных делах, но недурного шахматиста - возникает ощущение, что Альфа - вовсе не Зеро.
  4. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    921
    Симпатии:
    416
    Репутация:
    10
    Оффлайн
    Насколько понимаю в дальнейшем эту настройку убрали. И в дивизионе 2 и сейчас в дивизионе 1 играет уже обычная версия. И это печально. Потому что версия с Trade Penalty черными выигрывала почти столь же часто сколько и белыми. А обычная версия черными побеждает по большим праздникам. Интересно было бы посмотреть насколько хорошо эта настройка работает против движков посильнее.
  5. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    620
    Симпатии:
    107
    Репутация:
    2
    Оффлайн
    И тем не менее по тем бумагам создали самообучающийся движок уровня ТОП-4: https://www.chess.com/computer-chess-championship (Lc0)
    И даже будет матч этого движка против Stockfish 10 с описанием технических деталей: https://lichess.org/blog/XA7juREAAC4AxZsR/deathmatch-leela-vs.-stockfish :)

    Будут комментарии от ChessNetwork, но наверняка многие бы хотели увидеть комментарии от Вас, если Вам это интересно, конечно)
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    620
    Симпатии:
    107
    Репутация:
    2
    Оффлайн
    И все-таки Stockfish был прав, сыграв здесь Be7. После Rf8, скорее всего, еще быстрее проигрывают.
    Это сначала нули пишет. Потом понимает, что 3 пешки не просто так были отданы)
    -1.60 на 41-й глубине

    AlphaZero - Stockfish 8


    Код:
    FEN: r1bqr1k1/p6p/npp2p2/4p2N/1b1pP3/1P4P1/3B2BP/R2Q1R1K b - - 0 1
    
    Stockfish:
     1/1    00:00    634    317k    +1,51    Bb4-e7
     2/2    00:00    2k    580k    +3,69    Re8-f8 h2-h3
     3/3    00:00    2k    709k    +3,15    Re8-f8 g3-g4 Bb4xd2
     4/4    00:00    3k    959k    +3,45    Re8-f8 g3-g4 Bb4xd2 Qd1xd2
     5/5    00:00    4k    904k    +3,48    Re8-f8 h2-h3 Rf8-f7
     6/6    00:00    6k    1 438k    +2,67    Re8-f8 Bd2-h6 Rf8-f7 g3-g4 Bb4-c3 g4-g5
     7/7    00:00    7k    1 802k    +3,27    Re8-f8 Rf1-f2 Rf8-f7 Bd2-h6 Na6-c5
     8/9    00:00    12k    2 409k    +2,38    Re8-f8 Qd1-c1 Bb4xd2 Qc1xd2 Bc8-g4 Ra1xa6 Bg4xh5 b3-b4
     9/12    00:00    31k    3 893k    +0,67    Re8-f8 Bd2-h6 Rf8-f7 Qd1-f3 Bb4-e7 Qf3-e2 Na6-b4 Qe2-c4
     10/13    00:00    67k    4 484k    +1,41    Kg8-h8 Rf1xf6 Re8-g8 Bd2-h6 Bc8-g4 Qd1-f1 Bg4xh5 Ra1xa6
     11/24    00:00    264k    5 078k    +0,15    Kg8-h8 Nh5xf6 Re8-f8 Nf6xh7 Rf8xf1+ Bg2xf1 Bb4xd2 Qd1-h5 Bc8-g4 Qh5xg4 Qd8-g8 Qg4-f5 Qg8xh7
     12/19    00:00    305k    5 164k    +0,15    Kg8-h8 Nh5xf6 Re8-f8 Nf6xh7 Rf8xf1+ Bg2xf1 Bb4xd2 Qd1-h5 Bc8-g4 Qh5xg4 Qd8-g8 Qg4-f5 Qg8xh7 Qf5xe5+ Qh7-g7 Qe5-h5+ Qg7-h6 Qh5xh6+ Bd2xh6 Bf1xa6
     13/25    00:00    643k    5 742k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     14/13    00:00    660k    5 742k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     15/13    00:00    685k    5 759k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Ba6xf1 Qg4-e6+ Kf7-g6 Qe6-g4+
     16/29    00:00    1 220k    6 040k    -1,01    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Ba6-c8 g3-g4 Bc8-e6 Qd1-f3 Ra8-c8 Nh5xf6+ Qd8xf6 Qf3xf6 Rf7xf6 Rf1xf6 Be6xb3
     17/27    00:00    1 564k    6 014k    -0,93    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Ba6-c8 Qd1-f3 f6-f5 e4xf5 Bc8xf5 b3-b4 Qd8-d6 g3-g4 Qd6xh6 g4xf5 Kg8-h8 Qf3-e2
     18/32    00:00    1 868k    6 047k    -0,54    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Rf1-f2 Ba6-c8 Qd1-f1 Bc8-e6 Rf2xf6 Rf7xf6 Nh5xf6+ Kg8-h8 Qf1-f3 Ra8-d8
     19/27    00:00    2 009k    6 070k    -0,48    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Rf1-f5 Ba6-c8 Rf5-f2 Qe7-d6 h2-h4 f6-f5 Bh6-g5 d4-d3 e4xf5 Bc8xf5 g3-g4
     20/29    00:00    2 218k    6 061k    0,00    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-e6 Qe7xe6 Rf6xe6 Ba6-e2 Nh5-f6 Rg8-c8 Bh6-g5 Kh8-g7 Nf6-e8+ Kg7-f8 Ne8-f6
     21/44    00:00    4 192k    6 303k    -0,85    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-e6 Qe7xe6 Rf6xe6 c6-c5 Nh5-f6 Rg8-d8 Nf6-d5 Ba6-d3 Bh6-g5 Rd8-a8 Re6xe5 Bd3-c2 b3-b4 d4-d3 b4xc5 b6xc5 Bg5-d2 Ra8-b8 Nd5-c3 c5-c4 Re5-c5 Bc2-b3 Kh1-g1 Rb8-f8
     22/42    00:00    5 408k    6 377k    -0,26    Re8-f8 Bd2-h6 Rf8-f7 Ra1xa6 Bb4-f8 Bh6xf8 Bc8xa6 Bf8-h6 Qd8-e7 Qd1-g4+ Kg8-h8 Rf1xf6 Ra8-g8 Qg4-f5 Rf7xf6 Nh5xf6 Rg8-g6 Bh6-g5 d4-d3 Bg2-f3 d3-d2 Nf6xh7 Qe7xh7 Bg5xd2 Kh8-g8 Qf5xe5 Qh7-h3 Qe5-e8+ Kg8-h7
     23/50    00:01    8 934k    6 405k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+
     24/27    00:01    12 377k    6 426k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+
     25/46    00:06    41 522k    6 442k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Qh6-h7 Rg8-g5 Qh7-h8+ Ke8-f7 Qh8-h7+ Kf7-f8 Qh7-h8+
     26/52    00:06    41 931k    6 440k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Bh3-g4 Ba6-d3 Qg6-h7+ Ke7-d8 Rd1xd2 Bd3xe4+ Qh7xe4 Qd6xd2 Qe4xc6 Qd2-e1+ Kh1-g2 Qe1-d2+ Kg2-h3 Qd2-h6+ Kh3-g2
     27/42    00:06    42 912k    6 444k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Bh3-g4 Ba6-d3 Qg6-h7+ Ke7-d8 Rd1xd2 Bd3xe4+ Qh7xe4 Qd6xd2 Qe4xc6 Qd2-e1+ Kh1-g2 Qe1-d2+
     28/55    00:06    44 684k    6 409k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Bh3-g4 Ba6-c8 Bg4xc8 Kd8xc8 Qh7xa7 Qd6-d3 Qa7-a8+ Kc8-c7 Qa8-a7+
     29/60    00:07    47 319k    6 006k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8 Qe6xb6+ Kd8-e8 Qb6-e6+ Ke8-d8 Qe6-f6+ Kd8-e8
     30/57    00:10    58 560k    5 809k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8 Qe6xb6+ Kd8-e8 Qb6-e6+ Ke8-d8 Qe6-f6+ Kd8-e8 Qf6-g6+
     31/56    00:11    67 167k    5 890k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     32/56    00:13    78 800k    5 965k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     33/56    00:15    92 370k    6 032k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     34/56    00:20    124 524k    6 173k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     35/56    00:23    145 418k    6 210k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8
     36/56    00:28    181 269k    6 279k    0,00    Re8-f8 Bd2-h6 Bb4-e7 Ra1xa6 Bc8xa6 Qd1-g4+ Kg8-f7 Bg2-h3 Qd8-d6 Bh6xf8 Ra8xf8 Rf1-a1 Rf8-g8 Qg4-f5 d4-d3 Qf5xh7+ Kf7-f8 Qh7-h6+ Kf8-e8 Nh5-g7+ Rg8xg7 Qh6xg7 d3-d2 Ra1-d1 Be7-f8 Qg7-g6+ Ke8-e7 Qg6-h7+ Ke7-d8 Qh7xa7 Ba6-e2 Qa7-a8+ Kd8-e7 Qa8-b7+ Ke7-d8 Qb7-c8+ Kd8-e7 Rd1xd2 Qd6xd2 Qc8-e6+ Ke7-d8 Qe6xf6+ Kd8-e8 Qf6xc6+ Ke8-d8 Qc6-c8+ Kd8-e7 Qc8-e6+ Ke7-d8
     37/62-    01:43    672 116k    6 498k    -0,10    Re8-f8 Bd2-h6
     37/62-    01:50    716 318k    6 484k    -0,19    Re8-f8 Bd2-h6
     37/62-    03:47    1 433 030k    6 290k    -1,18    Re8-f8 Bd2-h6
     37/62+    05:14    1 971 186k    6 271k    -0,88    Kg8-h8
     37/64    05:29    2 069 330k    6 272k    -0,94    Kg8-h8 Nh5xf6 Re8-f8 Qd1-h5 Rf8xf6 Bd2xb4 Na6xb4 Qh5xe5 Qd8-d6 Qe5xf6+ Qd6xf6 Rf1xf6 Bc8-g4 Rf6-d6 d4-d3 Kh1-g1 a7-a5 Ra1-c1 c6-c5 Bg2-f1 Ra8-e8 Bf1xd3 Nb4xd3 Rd6xd3 Re8xe4 Rc1-c4 Re4xc4 b3xc4 Bg4-e6 Rd3-c3 Kh8-g7 Kg1-f2 a5-a4 Rc3-a3 Be6xc4 Ra3xa4 b6-b5 Ra4-a7+ Bc4-f7 Ra7-a5 Bf7-e8 Kf2-e3 Kg7-f6 Ke3-d2 Kf6-e6 Ra5-a7 Ke6-d6
     38/54-    05:35    2 101 884k    6 273k    -1,03    Kg8-h8 Nh5xf6
     38/54-    05:39    2 133 337k    6 277k    -1,13    Kg8-h8 Nh5xf6
     38/69-    06:12    2 342 910k    6 291k    -1,27    Kg8-h8 Nh5xf6
     38/69+    06:16    2 367 627k    6 292k    -1,15    Kg8-h8
     38/69+    06:19    2 391 634k    6 294k    -0,88    Kg8-h8
     38/69    06:33    2 479 778k    6 302k    -1,25    Kg8-h8 Nh5xf6 Re8-f8 Qd1-h5 Rf8xf6 Bd2xb4 Na6xb4 Qh5xe5 Qd8-d6 Qe5xf6+ Qd6xf6 Rf1xf6 Bc8-g4 e4-e5 d4-d3 Bg2-f3 Bg4xf3+ Rf6xf3 a7-a5 Ra1-f1 Kh8-g8 e5-e6 Ra8-e8 Rf3-e3 Re8-f8 Rf1-d1 Rf8-e8 Re3-e4 Kg8-g7 Kh1-g2 Re8-e7 Rd1-f1 h7-h5 Re4-e5 Nb4-c2 Kg2-f3 Nc2-d4+ Kf3-e3 Nd4xb3 h2-h4 d3-d2 Re5-g5+ Kg7-h6 Rf1-f6+ Kh6-h7 Ke3-e2 Re7xe6+ Rf6xe6 Nb3-d4+ Ke2xd2 Nd4xe6 Rg5-e5 Ne6-d4 Re5xh5+ Kh7-g6 Rh5-g5+ Kg6-f6
     39/62-    07:09    2 715 587k    6 328k    -1,35    Kg8-h8 Nh5xf6
     39/64+    08:26    3 199 049k    6 313k    -1,25    Bb4-e7
     39/64    09:01    3 405 688k    6 286k    -1,31    Bb4-e7 Ra1xa6 Kg8-h8 Ra6-a1 a7-a5 h2-h3 Re8-g8 Rf1-f3 Bc8-e6 Bg2-f1 a5-a4 Ra1xa4 Ra8xa4 b3xa4 c6-c5 Qd1-c2 Rg8-g6 g3-g4 Qd8-c8 Nh5-g3 c5-c4 Ng3-f5 Be7-f8 Nf5-h4 Rg6-g8 Rf3xf6 Bf8-e7 Rf6xe6 Qc8xe6 Bf1xc4 Rg8-c8 Bc4xe6 Rc8xc2 Nh4-f3 Kh8-g7 g4-g5 Rc2-b2 Be6-c4 Be7-b4 Bd2xb4 Rb2xb4 Nf3xe5 Rb4xa4 Kh1-g2 Ra4-a3
     40/51+    09:32    3 588 178k    6 264k    -1,21    Bb4-e7
     40/73    09:45    3 659 240k    6 255k    -1,26    Bb4-e7 Ra1xa6 Kg8-h8 Ra6-a1 a7-a5 h2-h3 Re8-g8 Rf1-f3 Bc8-e6 Bg2-f1 a5-a4 Ra1xa4 Ra8xa4 b3xa4 c6-c5 Qd1-c2 Qd8-f8 g3-g4 c5-c4 Bf1xc4 Qf8-c8 Bc4-d3 Be6xg4 h3xg4 Qc8xg4 Rf3-g3 Qg4xh5+ Kh1-g2 Rg8xg3+ Kg2xg3 Qh5-g6+ Kg3-f2 Qg6-g4 Bd3-e2 Qg4-h3 Be2-f3 Qh3-h2+ Bf3-g2 Qh2-h4+ Kf2-e2 Qh4-h5+ Bg2-f3 Qh5-h2+ Ke2-d3 Qh2-h3 Qc2-d1 Be7-c5 Kd3-c2 Qh3-d7 Kc2-b2 d4-d3 Bd2-c3 Bc5-d4 Qd1xd3 Qd7xa4 Bc3xd4 Qa4-b4+ Kb2-c1 e5xd4 Bf3-d1 b6-b5 Bd1-b3 Qb4-c3+ Qd3xc3 d4xc3 Kc1-c2 b5-b4
     41/67-    10:23    3 883 551k    6 231k    -1,36    Bb4-e7 Ra1xa6
     41/67-    12:39    4 676 876k    6 156k    -1,46    Bb4-e7 Ra1xa6
     41/67+    13:12    4 850 246k    6 120k    -1,36    Bb4-e7
     41/67-    16:48    6 061 754k    6 009k    -1,60    Bb4-e7 Ra1xa6
    
    
    
    Alhimik88 нравится это.
  7. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    50.416
    Симпатии:
    11.163
    Репутация:
    454
    Адрес:
    Москва, Россия
    Оффлайн
    Не знаю, Бог он или плут.
    Но он реально очень крут!

    Boroda, Challenger Spy, Kalvados и 2 другим нравится это.
  8. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Давая Стоку плутовства уроки,
    Он схож со скандинавским богом Локи.
  9. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.241
    Симпатии:
    1.796
    Репутация:
    95
    Адрес:
    Заир
    Оффлайн
    Насчёт дебютных подстав - похоже, каждой табии посвящалось две партии: каждый движок играл её и белыми, и чёрными. АльфаЗеро не смог выиграть белыми французскую позицию с принятой жертвой на g5. Особо в партию не вникаю, но такое ощущение, что АльфаЗеро продешевил: согласился на лучший эндшпиль. А Стофкиш оказался неподкупен.

    redhelicopter и Edwards нравится это.
  10. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    173
    Симпатии:
    60
    Репутация:
    2
    Оффлайн
    Ради интереса открыл оценку эндшпиля. Стокфиш 10: 4.99, lc0: 2.04
    Лила адекватнее оценивает ничейный эндшпиль. Теперь я видел все
  11. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    620
    Симпатии:
    107
    Репутация:
    2
    Оффлайн
    26:00 Ход в партии Be7 не является ошибкой, выше анализ :)
    Alhimik88 нравится это.
  12. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    232
    Симпатии:
    42
    Репутация:
    6
    Оффлайн
    С чего это вдруг адекватнее??
    Оба не показывают ничью.

    Ты на циферки смотришь что-ли?
  13. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.241
    Симпатии:
    1.796
    Репутация:
    95
    Адрес:
    Заир
    Оффлайн
    Тот Стокфиш явно играл с эндшпильными базами, оценка у него стояла "ничья".
    Хотя если бы он играл без баз, то по-человечески сыграл бы более адекватно: в ничейном ладейнике просто отфиксировал бы ничью, не пропустил бы белую пешку в ферзи.
  14. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    921
    Симпатии:
    416
    Репутация:
    10
    Оффлайн
    Шипов в разборе партий АльфаЗеро говорит о презрении Альфы к сопернику и настройке снижающей ценность ничьей. Но на самом деле таких настроек в Альфе нет. Партия, которая приводится, объясняется совсем по другому:



    Эту позицию Альфа явно оценивает с большим своим преимуществом. Пешка в одном поле от превращения, противник парализован. А то что ресурсов для усиления своей позиции нет, нейронка не понимает. Альфа ходит, ходит, ходит. Выщелкивает 50 ходов и нужно соглашаться на ничью. Но проблему что после h4 Альфа что-то не досчитывает и все равно считает, что ее позиция уже чуть-чуть, но все еще лучше. И механизм выбора хода видит, что если не ходить h4, то будет ничья по правилу 50 ходов (т.е. оценка 0). А если сходить, то оценка скажем 0.1. Естественно выбирается то что больше. И Альфа ради того, чтобы не попасть под правило 50 ходов, просто отдает материал без всякой идеи и компенсации. И иногда запаса прочности в позиции не хватает и Альфа в результате проигрывает. У Лилы есть (или была) такая же проблема, видел несколько партий, которые она проиграла аналогичным образом.

    То есть это просто человеческая недоработка в движке. Не должен движок тупо ухудшать свою позицию, ради того, чтобы не попасть под правило 50 ходов. Возможно в этот момент имеет смысл пользоваться не интегральной оценкой, а ее компонентами. Нейронка ведь выдает шансы на победу, ничью и поражение. Соответственно если после хода вырастает только шанс поражения, а шанс на победу не растет, то не нужно делать этот ход, ради того чтобы избежать ничьи по правилу 50 ходов.
    —- добавлено: 17 дек 2018, опубликовано: 17 дек 2018 —-
    А вот в следующей позиции Альфа просто не досчитала:



    Сыграла Nа2 и пошла на осложнения, скорей всего видя что ее ферзь встает раньше. А это оказался тот редкий случай, когда лишнего ферзя не хватает не то, что для победы, но даже для ничьи.
    Launder, Alhimik88, crem и ещё 1-му нравится это.
  15. redhelicopter Учаcтник

    • Участник
    Рег.:
    10.11.2014
    Сообщения:
    150
    Симпатии:
    315
    Репутация:
    8
    Оффлайн
    Может все-таки это глюк оценки, которая выдает завышенные 0.1 в свою пользу, хотя там уже явно в пользу соперника?
  16. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    232
    Симпатии:
    42
    Репутация:
    6
    Оффлайн
    Он много там чего говорит, не всему же надо верить.
    crem нравится это.
  17. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Не оценка, а статистика доигрываний. А это уже интереснее, за счёт чего статистика доигрываний в этой линии выше.
  18. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    232
    Симпатии:
    42
    Репутация:
    6
    Оффлайн
    Надо думать что из за несовершенства доигрываний.
  19. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Да нет там никаких "доигрываний". Есть дохождение до конечного узла и оценка его нейросетью. От доигрываний до конца партий отказались где-то в районе AlphaGo Master или AlphaGo Lee.
    Undying и Rom нравится это.
  20. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    921
    Симпатии:
    416
    Репутация:
    10
    Оффлайн
    Оценка Альфы в таких случаях тоже не идеальна, но с этим сложно что-то поделать. А вот доработать механизм выбора хода в условиях действия правила 50 ходов достаточно просто.

    Кстати что усугубляет проблему. За эти 50 ходов хождения туда-сюда Альфа успевает потратить всё время. И получается, что ответственнейшее решение о сбросе материала Альфа зачастую принимает на секундах, толком ничего не досчитав.
  21. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    А до какого узла доходить и как его оценивать? Я понимаю, что доигрывание идёт не до конца, а до некоторого момента, пока нейросеть не скажет: тут всё понятно, нечего доигрывать дальше, проставляем результат 1-0 или ½. Так что доигрывание есть, но только до мата. Вряд ли прямо в корневой ноде мы принимаем решение о том, что обрываем счёт и возвращаем ход, рекомендованный нейросетью без всякого счёта. Так что в данной ноде какое-то количество рулаутов таки будет, и оценка будет на основании них. Другой вопрос, насколько они глубокие.
    —- добавлено: 17 дек 2018 —-
    Теоретически нет смысла ресетить статистику доигрываний в случае, когда код даёт инкремент счётчика 50-ти ходов. Потому что позиция вполне может возникнуть в результате перестановки, и для неё уже будет наиграна некоторая статистика.
    —- добавлено: 17 дек 2018, опубликовано: 17 дек 2018 —-
    Вообще, по логике доигрывание имеет смысл прерывать в случае рыбы. Потому что если оценка большая, то нам обычно не так уж много ходов надо сделать до мата. А вот когда какой-нить разноцвет, где ещё можно 200 ходов наиграть, то вполне можно и прервать счёт, и то с учётом счётчика 50-ходов.
  22. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    921
    Симпатии:
    416
    Репутация:
    10
    Оффлайн
    Нет доигрываний. Движемся по дереву вариантов. Для каждого узла нейронка возвращает вероятности победы, ничьи и поражения. В зависимости от этих вероятностей какие-то ветки считаем более перспективными и движемся дальше по ним. Менее перспективные отсекаем. Когда время на обдумывание заканчивается, то обрываем счет.
  23. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    А какие формулы перспективности? Это уже не MCTS. Опять же, какой узел должен быть выбран для пролонгации? Опять же, как выбирать ход, по минимаксу или по статам?
  24. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    550
    Симпатии:
    203
    Репутация:
    21
    Оффлайн
    AZ.PNG

    https://deepmind.com/documents/119/agz_unformatted_nature.pdf
    Undying нравится это.
  25. Ondatr Учаcтник

    • Участник
    Рег.:
    21.11.2016
    Сообщения:
    975
    Симпатии:
    480
    Репутация:
    35
    Адрес:
    не дом и не улица
    Оффлайн
    Алгоритм AlphaGo Zero может обыграть человека во что угодно
    Выучился сам.
  26. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    50.416
    Симпатии:
    11.163
    Репутация:
    454
    Адрес:
    Москва, Россия
    Оффлайн
    А как это делается?
    Для этого же нужна оценочная функция. То есть, пусть и усеченная, но обычная игровая программа. Обычный подручный движок.
  27. redhelicopter Учаcтник

    • Участник
    Рег.:
    10.11.2014
    Сообщения:
    150
    Симпатии:
    315
    Репутация:
    8
    Оффлайн
    Так обученная нейронная сеть и выполняет роль оценочной функции. Именно в том и суть нейросетевого подхода к шахматам: сделать интеллектуальную оценочную функцию. Которая работает непойми как, но дает хороший результат :)
    Undying нравится это.
  28. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Интересно, что в популярных сообщениях об АльфаЗеро всегда упоминается нейронная сеть, и практически никогда - поиск UCT, в просторечии "Монте-Карло" (хотя он и не Монте-Карло, в смысле случайности). А ведь это очень существенная часть алгоритма, в которой АЗ тоже сильно отличается от традиционных движков. И нейронная сеть в АЗ используется не только для оценки позиций, но и для управления этим весьма нетривиальным поиском (выбора порядка ходов-кандидатов, на привычном шахматистам языке).
    Undying и sovaz1997 нравится это.
  29. redhelicopter Учаcтник

    • Участник
    Рег.:
    10.11.2014
    Сообщения:
    150
    Симпатии:
    315
    Репутация:
    8
    Оффлайн
    Думаю, главная фишка-то все же в оценке. Просто потому что всем понятно, что оценочные функции в традиционных движках весьма слабые, и этот аспект действительно нуждается в усилении.
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    Главная фишка в их сочетании. Потому что если прикрутить тяжелую нейронную оценку к традиционной альфа-бете, качество оценки нивелируется снижением скорости, к которому альфа-бета очень чувствительна.
  31. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Есть ещё такой аспект, как выбор ходов кандидатов, который выполняется нейросетью параллельно и вне зависимости от оценки.
  32. Ondatr Учаcтник

    • Участник
    Рег.:
    21.11.2016
    Сообщения:
    975
    Симпатии:
    480
    Репутация:
    35
    Адрес:
    не дом и не улица
    Оффлайн
    Меня интересует, а каким образом реализуется сохранение-модификация найденных оптимальных параметров?
    Они должны где-то сохраняться, т.е. должна существовать база данных таких параметров, возможно, с гибкой структурой?
  33. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    http://www.lczero.org/networks/
    Ondatr нравится это.
  34. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.968
    Симпатии:
    401
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.973
    Симпатии:
    2.181
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    А они там накручивают рейтинг по системе "камень - ножницы - бумага" ("... - ящерица - Спок").
    То есть каждая следующая версия эксплуатирует какую-то слабость предыдущей, и так по кругу :)

Поделиться этой страницей