AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    А интересно, в SEE она использует заранее заданные стоимости фигур, или те, которые насчитала в процессе обучения?
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Скорей всего все-таки не использует SEE. ИМХО написано так, что путает человека плохо владеющего английским.
  3. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    А что это за зверь, потому что Google показывает кучу слов see...
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Static Exchange Evaluation
    Быстрое вычисление стоимости размена фигур на каком-то одном поле, без построения обычного дерева перебора.
    Может использоваться для сортировки ходов, отсечений и т.д.
    https://chessprogramming.wikispaces.com/Static+Exchange+Evaluation
  5. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Там если и есть SEE, то несколько модифицированное. Нейронная сеть, возможно, сама выбирает, как лучше сортировать размены.
  6. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    2.195
    Симпатии:
    52
    Репутация:
    3
    Оффлайн
    У меня далеко не последние версии фрица. В одном это Редактировать - Копировать - Скопировать игру, в другом Edit - Copy game. Да!.... еще, предварительно, я делаю вариант главным и удаляю все варианты.
  7. Осипов Юрий Учаcтник

    • Участник
    Рег.:
    18.06.2007
    Сообщения:
    392
    Симпатии:
    416
    Репутация:
    10
    Адрес:
    Правда
    Оффлайн
    А зачем нейронной сети какой-то убогий SEE ?
    Посмотрел на позицию, распознал её, и с разменами всё ясно. Не нужно считать не только SEE, но и форсированные варианты.
    sovaz1997 и crem нравится это.
  8. cs111g Начинающий

    • Начинающий
    Рег.:
    15.12.2017
    Сообщения:
    5
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Большое спасибо!
    У меня Deep Fritz 14, и всё оказалось омерзительно просто: вкладка "Home" / кнопка "Copy Game" (ну и дальше текст партии в буфере обмена).
  9. NeoNeuro Учаcтник

    • Участник
    Рег.:
    17.02.2013
    Сообщения:
    612
    Симпатии:
    299
    Репутация:
    43
    Оффлайн
    Всем привет!
    Прочитал https://arxiv.org/pdf/1712.01815.pdf. Много "воды", много общих слов, описывающих действительно колоссальные достижения искусственных нейронных сетей (ИНС), правда совсем непонятны детали.
    Если кто-либо разобрался - помогите. Пример вопроса, ответить на который не смог - оценивает ли ИНС материал на доске самостоятельно?

    Главное уместилось на странице номер 13:
    Мне эта тема интересна, см. https://neoneuro.com/ru/data-mining - первый алгоритм ИИ, который можно научить.. ходу шахматной фигуры. Не игре в шахматы на уровне МГ, даже не правилам шахматной игры, а лишь простым ходам, не более того. Учитывая личный опыт, интересно, что сделали в Google на эту тему. Google пошли немного иначе, проще. Они не стали учить программу шахматным ходам, заложили их сразу:
    Фигуры в данном случае не используют принципы хода (вертикали, горизонтали, диагонали), а сразу используюся все возможные варианты - оказывается, всего возможно 4672 разных хода в шахматах.

    На вход ИНС дают матрицу:
    Кто разобрался, помогите - как они кодируют фигуру и какой же вектор на входе?
    64 клетки, те. 64 числа, каждый из который может представлять из себя разный вид фигуры?

    Пока впечатление такое:
    В AlphaZero ИНС - это дополнение к обычному логическому шахматному алгоритму, который позволяет из 50 возможных ходов в каждой позиции выбрать десяток наиболее перспективных. То есть ИНС используется как интуиция человека, оптимизирующая поиск на базе предыдущего опыта. ИНС выбирает наиболее популярные ходы, которые встречались ранее в позициях, наиболее близких к заданной. Определение близких известных позиций на базе неизвестной - это нормальная задача для ИНС и для интуиции Человека. Но если бы это было именно так, то зачем писать о самообучаемости.. За 30 000 партий программа самообучилась до уровня ЭЛО 2000. 30 тыс. итераций - это очень мало для ИНС, обычно в нейросетях делаются тысячи проходов для обучения самым элементарным математическим задачам. А здесь такая бешеная эффективность.

    Пока я считаю наиболее эпохальной задачей для ИИ будущего - возмоность полного обучения игре крестики-нолики (Tic tac toe). И в это время появляются статьи о том, что ИИ можно с нуля научить играть в шахматы до уровня, сильно превосходящего Человека... колоссальный разрыв уровней.
    Я восхищаюсь достижениями Google, которые недавно смогли с нуля научить робота с ИНС открывать ручку двери.. задачка эта куда проще "крестиков-ноликов", но для ИНС - очень сложная.
    Научить робота собирать яблоки, а не любой мусор с земли - это задача сложнейшая, но решить её с текущими технологиями - можно. Пока никто не решил. Научить робота игре в шахматы ... на мой взгляд - когда это действительно будет сделано, наше мнение об ИИ будет уже не таким важным, как мнение ИИ о нас.
    ШахматыЭтоДиагноз нравится это.
  10. NeoNeuro Учаcтник

    • Участник
    Рег.:
    17.02.2013
    Сообщения:
    612
    Симпатии:
    299
    Репутация:
    43
    Оффлайн

    Здесь рассказываю о том, что такое искусственный интеллект и как отличить обычное устройство от думающего.
    В частности, и пример с шахматами привожу.
    Данные на входе алгоритма NeoNeuro понятны:
    название_фигуры, x_откуда_пошли, y_откуда_пошли, x_куда_пошли, y_куда_пошли, можно_ли_ходить

    Если обозначением пешки будет 6, то ход
    e2-e4 это набор (вектор) чисел в интерфейсе ИНС (x и y считаю от единицы для удобства):
    6, 5, 2, 5, 4, 1
    добавляем невозможность хода e2-e5:
    6, 5, 2, 5, 5, 0 (последний ноль - это невозможность хода)
    и так далее.
    программа изначально ничего о шахматах не знает, учится с нуля как младенец. Эти слова у AlphaZero похожи, НО - у них программа учится не шахматным правилам, а сразу "играть сильнее StockFish", при этом правила им "даны заранее" - как именно, пока загадка.

    у AlphaZero видимо на вход имеется вектор в 64 числа с обозначениями фигур на каждом поле (делят ли они черные и белые или всё в одну цифру записывают - интересно), плюс ход как цифра от 1 до 4672.
    Как они узнают - возможен ли ход или нет? Учитывая, что про алгоритмы обучения правилам шахмат они не говорят, можно предположить, что для этого используется обычный жёсткий шахматный алгоритм.

    То, что шахматная программа, использующая ИНС для оценки позиций играет сильнее программы, которая их не использует - я вполне могу поверить и понять, как это работает. Но специалисты AlphaZero пишут, что их алгоритмы совсем не похожи на алгоритмы движков (которые они описали в статье более подробно).
    ШахматыЭтоДиагноз и sovaz1997 нравится это.
  11. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Попытался в максимально упрощенном виде сделать слепок зафиксированных до сегодняшнего дня оценок движков пользователей ChessBase.
    Почему начал с 13-го хода? — думаю, не стоит объяснять.
    Обратите внимание на удивительную "прозорливость" Komodo! Видимо, пользователь вел из конца к началу, что, по-моему, правильно для поиска ошибок, но вряд ли говорит о превосходстве движка над другими.
    AlphaZero — Stockfish 8

    13.Nc3 Nxc3
    [13...Bf6 14.Nxd5 cxd5 15.Ne3 Na6
    a) 15...Nc6 16.Nxd5 Re8 (16...Be5) ;
    b) 15...Nd7 16.Nxd5 Nc5 (16...Bxd5) ;
    16.Nxd5 Nc5 1/2 (16) Bobras,P (2565)-Macieja,B (2600) Germany 2008
    17.Rb1 Rc8 (17...Ba6) и т.д. — последний писк из компьютерного творчества до эпохи AlphaZero;
    13...Na6 14.Nxd5 cxd5 15.Bxd5 Bxd5 16.Qxd5 Bf6 17.Qf3 Nc5 18.Rd1 Qe8 19.Nh6+ Kh8 20.Ng4 Be7 21.Bf4 Ne6 22.Rd5 f5 23.Ne5 Rd8 24.Rxd8 Bxd8 25.Rd1 Bf6 26.Nd7 Nd4 27.Rxd4 Bxd4 28.Nxf8 Qxf8 29.b3 h6 30.Kg2 Kh7 31.h4 Qc5 32.h5 b5 33.g4 fxg4 34.Qe4+ Kh8 35.Qe8+ Kh7 36.Qg6+ Kh8 37.Qe8+ Kh7 1/2 (37) Ramakrishna,J (2224)-Kathmale,S (2334) Chennai 2013]

    14.Qg4!N
    [14.bxc3 Bf6 15.Qc2 Nd7 16.Rd1 Qc7 17.Bf4 Ne5 18.Nd6 Rad8 19.Nxb7 Qxb7 20.Be4 g6 21.Qe2 Qe7 22.Be3 Qe6 23.Bh6 Rfe8 24.Bg2 Qf5 25.Rxd8 Rxd8 26.Re1 Qd3 27.Qxd3 Nxd3 28.Rd1 c5 29.c4 Ne5 30.Rxd8+ Bxd8 31.Bd5 g5 32.f4 Ng4 33.fxg5 Ne3 34.Be4 Nxc4 35.h4 Nd6 36.Bc2 b5 37.Kf2 Bb6 38.Kf3 c4 39.h5 Bd4 40.g6 hxg6 41.Bf4 Nf5 42.hxg6 fxg6 43.g4 Ne7 44.Ke4 Bg7 45.Bd6 Kf7 46.Bc5 a6 47.a4 Ke6 48.axb5 axb5 49.Bxe7 Kxe7 50.Kd5 Kf6 1/2 (50) Schumacher,N (2191)-Hanisch,S (2075) Germany 2016;
    14.bxc3 Bc8 15.Nxe7+ Houdini 6.03 x64/MedusaV4 0.08/31 ;
    14.Qg4 Bf6 15.bxc3 Komodo 11.2.2 64-bit/MedusaV4 1.38/25 ;
    14.bxc3 Bc8 15.Nxe7+ Stockfish 8 0.06/42 ]
    14...g6
    [14...Bf6]
    15.Nh6+
    [15.bxc3 h5 16.Qe2 Stockfish 181117/Omavein 0.08/53 ;
    15.bxc3 Bc8 16.Nxe7+ Komodo 11.2.2 64-bit/MedusaV4 1.73/24 ;
    15.Nh6+ Kg7 16.bxc3 Komodo 11.2.2 64-bit/MedusaV4 2.71/21 ]
    15...Kg7 16.bxc3
    [16.bxc3 Bc8 17.Qa4 Komodo 11.2.2 64-bit/MedusaV4 1.93/24 ;
    16.Nf5+ Kg8 17.bxc3 Komodo 10.3 64-bit 0.00/35 ;
    16.Nf5+ Kg8 17.bxc3 Stockfish 181117/Omavein 0.08/47 ]
    16...Bc8 17.Qf4
    [17.Qf4 Bc5 18.h4 Komodo 11.2.2 64-bit/MedusaV4 1.50/22 ;
    17.Qf4 Qd6 18.Qf3 Houdini 6 x64/TwoKnights -0.09/29 ;
    17.Qf4 Qd6 18.Qf3 New Engine/MedusaV4 -0.17/24 ]
    17...Qd6
    [17...Qd6 18.Qa4 g5 Stockfish 181117/Omavein 0.00/40 ;
    17...Be6 18.Be3 Bc5 Komodo 11.2.2 64-bit/MedusaV4 1.32/23 ;
    17...Qd6 18.Qa4 g5 Houdini 6 x64/TwoKnights -0.02/30 ]
    18.Qa4
    [18.Qa4 g5 19.Ng4 Houdini 6 x64/TwoKnights 0.00/34 ;
    18.Qa4 Na6 19.Bf4 Komodo 11.2.2 64-bit/MedusaV4 1.87/24 ;
    18.Qa4 Rd8 19.Re1 New Engine 0.00/43 ]
    18...g5
    [18...Rd8]
    19.Re1!! Kxh6 20.h4
    [20.h4 f6 21.Be3 Stockfish 8 0.00/40 ;
    20.h4 f6 21.Be3 Komodo 11.2.2 64-bit/MedusaV4 2.95/25 ;
    20.h4 f6 21.Rxe7 Komodo 8 64-bit -0.52/25 ]
    20...f6
    [20...f6 21.Be3 Bf5 Stockfish 111217/Omavein 0.00/54 ;
    20...f6 21.Rxe7 Qxe7 Houdini 5.01 x64/Ziegler -0.68/30 ;
    20...f6 21.Be3 Kg7 Komodo 11.2.2 64-bit/MedusaV4 2.94/25 ]
    21.Be3 Bf5
    22.Rad1! Qa3

    [22...Qa3 23.hxg5+ fxg5 Stockfish 111217/schacuzi 0.00/43 ;
    22...Qa3 23.Qd4 Kg7 Komodo 11.2.2 64-bit/MedusaV4 2.99/23 ;
    22...Qa3 23.hxg5+ fxg5 Stockfish 051217/DerAmateur121 0.00/38 ]
    23.Qc4
    [23.hxg5+ fxg5 24.Qh4+ Stockfish 8 0.00/35 ;
    23.Qd4 Na6 24.hxg5+ Komodo 11.2.2 64-bit/MedusaV4 -0.17/42 ;
    23.hxg5+ fxg5 24.Qh4+ Stockfish 181117/Omavein 0.00/49 ]
    23...b5
    [23...Kg7!? zeroalphazero ;
    23...Nd7!? Мобуту
    ]
    24.hxg5+!
    [24.hxg5+ fxg5 25.Qh4+ Fritz 13 -0.35/29 ;
    24.Qe2 Kg7 25.g4 Komodo 11.2.2 64-bit/MedusaV4 3.73/24 ;
    24.hxg5+ fxg5 25.Qh4+ Fritz 15 0.00/19 ]
    24...fxg5
    [24...fxg5 25.Qh4+ Kg6 Fritz 11 SE 0.00/28 ;
    24...fxg5 25.Qh4+ Kg6 Stockfish 111217/schacuzi 0.00/49 ;
    24...fxg5 25.Qh4+ Kg6 Komodo 11.2.2 64-bit/MedusaV4 2.15/24 ]
    25.Qh4+
    [25.Qh4+ Kg6 26.Qh1 Komodo 11.2.2 64-bit/MedusaV4 2.02/24 ;
    25.Qh4+ Kg6 26.Qh1 Stockfish 181117/Omavein 0.00/49 ;
    25.Qh4+ Kg6 26.Qh1 Fritz 13 -0.53/26 ]
    25...Kg6
    [25...Kg6 26.Qh1 Kg7 Stockfish 181117/Omavein 0.00/50 ;
    25...Kg6 26.Qh1 Kg7 Komodo 11.2.2 64-bit/MedusaV4 1.97/25 ;
    25...Kg6 26.Qh1 Kg7 Stockfish 8 0.00/38 ]
    26.Qh1
    [26.Qh1 Kg7 27.Bc1 Stockfish 181117/Omavein 0.00/51 ;
    26.Qh1 Kg7 27.Bc1 Stockfish 8/Two80 0.00/32 ;
    26.Qh1 Kg7 27.Be4 Komodo 11.01 64-bit/Pacificrabbit 0.31/36 ]
    26...Kg7 27.Be4!
    [27.Bc1=]
    27...Bg6
    [27...Bg6 28.Bxg6 hxg6 Stockfish 8 0.00/52 ;
    27...Bg6 28.Bxg6 hxg6 Komodo 10 64-bit 0.00/34 ;
    27...Bxe4 28.Qxe4 Kg8 Stockfish 051217 0.29/42 ]
    28.Bxg6
    [28.Bxg6 hxg6 29.Bc1 Stockfish 8 0.00/45 ;
    28.Bxg6 hxg6 29.Qh3 Komodo 11.2.2 64-bit/MedusaV4 2.71/25 ;
    28.Bxg6 hxg6 29.Bc1 Deep Fritz 13/Cux 0.00/21 ]
    28...hxg6
    [28...hxg6 29.Bc1 Qc5 Stockfish 8/M_Bechmann 0.00/46 ;
    28...hxg6 29.Bc1 Qc5 Stockfish 111217/schacuzi 0.00/50 ;
    28...hxg6 29.Qh3 Bf6 Komodo 11.2.2 64-bit/MedusaV4 2.78/26 ]
    29.Qh3 Bf6
    [29...Bf6 30.Kg2 Qxa2 Stockfish 111217/schacuzi 0.00/50 ;
    29...Bf6 30.Kg2 Qxa2 Stockfish 111017 0.00/43 ;
    29...Bf6 30.Kg2 Rh8 Stockfish 171217/Voodoo Master 0.97/41 ]
    30.Kg2
    [30.Kg2 Qxa2 31.Rh1 Stockfish 111217/Omavein 0.75/58 ;
    30.Kg2 Qxa2 31.Rh1 Stockfish 181117 0.00/48 ;
    30.Kg2 Qxa2 31.Rh1 New Engine 0.00/49 ]
    30...Qxa2
    [30...Rh8 31.Qg4 Rf8 Stockfish 111217/Omavein 1.44/64 ;
    30...Qxa2 31.Rh1 Qg8 Houdini 6.02 x64 0.00/43 ;
    30...Rh8 31.Qg4 Rf8 New Engine/Crow 0.81/52 ]
    31.Rh1
    [31.Rh1 Qg8 32.c4 Stockfish 111217/Omavein 1.50/53 ;
    31.Rh1 Qg8 32.Rd6 Houdini 6.02 x64 0.00/43 ;
    31.Rd6 Be5 32.Rh1 Stockfish 8/Kikouyou 0.00/38 ]
    31...Qg8
    [31...Qg8 32.Rd6 Re8 Stockfish 111217/Omavein 2.22/54 ;
    31...Qg8 32.Rd6 Re8 Houdini 6.02 x64 0.00/43 ;
    31...Qg8 32.c4 a5 Stockfish 061217/Omavein 1.39/37 ]

    32.c4!!
    [32.Rd6 Re8 33.c4 Stockfish 181117/Omavein 2.32/59 ;
    32.Rd6 Be5 33.Re6 Houdini 6.03 x64/G A R G A M E L 1.07/45 ;
    32.c4 Re8 33.Rd6 Komodo 11.2.2 64-bit 1.62/38 ]
    32...Re8
    [32...Re8 33.Rd6 Be5 Stockfish 181117/Omavein 2.58/50 ;
    32...a5 33.Rd6 bxc4 Houdini 6.03 x64/Pacificrabbit 1.76/38 ;
    32...c5 33.Bxc5 Re8 Stockfish 171217 0.98/40 ]
    33.Bd4!!
    [33.Rd6 Be5 34.Bd4 Stockfish 181117/Omavein 2.73/58 ;
    33.Bd4 Bxd4 34.Rxd4 New Engine 2.35/50 ;
    33.Bd4 Bxd4 34.Rxd4 Stockfish 261116/aplusk 1.63/43 ]
    33...Bxd4
    [33...Bxd4 34.Rxd4 Rd8 Stockfish 181117/Omavein 2.73/51 ;
    33...Bxd4 34.Rxd4 Stockfish 8/fair1play 1.27/35 ;
    33...Rd8 34.Qh6+ Stockfish 111217 0.63/35 ]
    34.Rxd4
    [34.Rxd4 Rd8 35.Rxd8 Stockfish 8 1.89/42 ;
    34.Rxd4 Rd8 35.Rxd8 Komodo 11.01 64-bit/lmcarter 1.03/28 ;
    34.Rxd4 Re7 35.cxb5 Houdini 6.03 x64/Pacificrabbit 1.80/27 ]
    34...Rd8
    [34...Rd8 35.Rxd8 Qxd8 Stockfish 181117/Omavein 2.73/58 ;
    34...Rd8 35.Rxd8 Qxd8 Houdini 6.03 x64/G A R G A M E L 1.65/42 ;
    34...Rd8 35.Rxd8 Qxd8 Stockfish 171217 1.63/43 ]
    35.Rxd8
    [35.Rxd8 Qxd8 36.Qe6 Fritz 15 1.92/26 ;
    35.Rxd8 Qxd8 36.Qe6 Stockfish 111217/schacuzi 2.20/49 ;
    35.Rxd8 Qxd8 36.Qe6 Stockfish 181117/Omavein 2.80/60 ]
    35...Qxd8
    [35...Qxd8 36.Qe6 Nd7 Stockfish 8 2.41/52 ;
    35...Qxd8 36.Qe6 Nd7 Stockfish 111217/schacuzi 2.32/48 ;
    35...Qxd8 36.Qe6 Nd7 Houdini 4 x64 1.13/21 ]
    36.Qe6!
    [36.Qe6 Nd7 37.Rd1 Stockfish 111217/Neuron 2.15/42 ;
    36.Qe6 Nd7 37.Rd1 Fritz 10 0.66/21 ;
    36.Qe6 Nd7 37.Rd1 Stockfish 181117/Omavein 2.80/63 ]
    36...Nd7
    [36...Qc7 37.Qe8 Kf6 Stockfish 061217/Omavein 9.43/51 ;
    36...Nd7 37.Rd1 Nc5 Stockfish 8/grautvornix 2.23/54 ;
    36...Nd7 37.Rd1 Nc5 Houdini 6.02 x64 2.74/44 ]
    37.Rd1
    [37.Rd1 Nf8 38.Rxd8 Stockfish 061217/Omavein 132.26/64 ;
    37.Rd1 Nf8 38.Rxd8 Stockfish 181117/Omavein 4.15/54 ;
    37.Rd1 Houdini 6.03 x64/Pacificrabbit 6.59/36 ]
    37...Nc5
    [37...Nf8 38.Rxd8 Nxe6 Fritz 16 2.18/62 ;
    37...Nc5 38.Rxd8 Nxe6 Stockfish 061217/Omavein 131.31/63 ;
    37...Nf8 38.Rxd8 Nxe6 Houdini 6.03 x64/Pacificrabbit 6.35/40 ]
    38.Rxd8
    [38.Rxd8 Nxe6 39.Rxa8 Stockfish 181117/Omavein 5.70/62 ;
    38.Rxd8 Nxe6 39.Rxa8 Stockfish 8/KOTLD 2.84/47 ;
    38.Rxd8 Nxe6 39.Rxa8 Stockfish 070216 1.83/46 ]
    38...Nxe6
    [38...Nxe6 39.Rxa8 bxc4 Stockfish 181117/Omavein 5.85/57 ;
    38...Nxe6 39.Rxa8 b4 Houdini 6.03 x64/Pacificrabbit 4.69/36 ;
    38...Nxe6 39.Rxa8 Nd4 Stockfish 061217/Shazbat 1.62/34 ]
    39.Rxa8
    [39.Rxa8 bxc4 40.Rxa7+ Stockfish 181117/Omavein 5.93/61 ;
    39.Rxa8 bxc4 40.Rxa7+ Stockfish 051217/DerAmateur121 3.02/57 ;
    39.Rxa8 bxc4 40.Rxa7+ Houdini 6.03 x64/Pacificrabbit 4.40/34 ]
    39...Kf6
    [39...b4 40.Rxa7+ Kf6 Stockfish 061217/Omavein 7.09/57 ;
    39...bxc4 40.Rxa7+ Kf6 Fritz 15 2.08/30 ;
    39...bxc4 40.Rxa7+ Kf8 Stockfish 171217/Voodoo Master 5.23/50 ]
    40.cxb5
    [40.cxb5 cxb5 41.Rxa7 Stockfish 181117/Omavein 132.61/90 ;
    40.cxb5 cxb5 41.Kf3 Stockfish 111217/schacuzi 4.57/45 ;
    40.cxb5 cxb5 41.Kf3 Stockfish 8/Leontxo 1.97/28 ]
    40...cxb5
    [40...cxb5 41.Rxa7 Ke5 Stockfish 181117/Omavein 132.62/89 ;
    40...cxb5 41.Kf3 Nd4+ Stockfish 171217/Voodoo Master 132.52/49 ;
    40...cxb5 41.Kf3 Ke5 Stockfish 050715 SSE/Software_012 1.74/36 ]
    41.Kf3
    [41.Rxa7 Ke5 42.Rb7 Stockfish 181117/Omavein 132.63/93 ;
    41.Kf3 Ke5 42.Ke3 Houdini 6.03 x64/Pacificrabbit 4.93/32 ;
    41.Kf3 Ke5 42.Ke3 Stockfish 111217/schacuzi 4.07/40 ]
    41...Nd4+
    [41...Ke5 42.Ke3 b4 Stockfish 8 7.34/46 ;
    41...Ke5 42.Ke3 Kd5 Stockfish 181117/Omavein 132.54/75 ;
    41...Nd4+ 42.Ke4 Nc6 Stockfish 171217/Voodoo Master 132.53/50 ]
    42.Ke4
    [42.Ke4 Nc6 43.Rc8 Stockfish 111217/schacuzi 5.21/39 ;
    42.Ke4 Nc6 43.Rc8 Stockfish 181117/Omavein 132.58/59 ;
    42.Ke4 Nc6 43.Rc8 Houdini 6.03 x64/Pacificrabbit 11.05/29 ]
    42...Nc6
    [42...Nc6 43.Rc8 Nb4 Stockfish 8 3.90/58 ;
    42...Nc6 43.Rc8 Nb4 Stockfish 171217/Voodoo Master 132.05/45 ;
    42...Nc6 43.Rc8 Houdini 6.03 x64/Pacificrabbit 10.02/30 ]
    43.Rc8
    [43.Rc8 Nb4 44.Rb8 Stockfish 061217/Omavein 132.55/71 ;
    43.Kd5 Nb4+ 44.Kc5 Gull 3 x64/VadimR 2.07/30 ;
    43.Rg8 a5 44.Rc8 Stockfish 8 2.28/41 ]
    43...Ne7
    [43...Nb4 44.Rf8+ Ke6 Komodo 11.01 64-bit/Pacificrabbit 4.44/46 ;
    43...Ne5 44.Rc5 Nc4 Stockfish 181117/Omavein 132.61/71 ;
    43...Nb4 44.Rc7 a6 Stockfish 171217/Voodoo Master 15.72/38 ]
    44.Rb8
    [44.Rc7 a5 45.Rb7 Stockfish 181117/Omavein 132.65/77 ;
    44.Rb8 g4 45.Rxb5 Stockfish 111217/schacuzi 22.15/42 ;
    44.Rb8 Ke6 45.Rxb5 Houdini 6.03 x64/Pacificrabbit 75.80/30 ]
    44...Nf5
    [44...g4 45.Rxb5 Ke6 Stockfish 111217/schacuzi 15.32/40 ;
    44...Nf5 45.Ra8 Nd6+ Stockfish 8 6.61/48 ;
    44...b4 45.Rxb4 Nc8 Stockfish 8 #41/46 ]
    45.g4
    [45.Kd5 Ne7+ 46.Kc5 Stockfish 221017 9.91/40 ;
    45.g4 Nh6 46.f3 Houdini 6.03 x64/Pacificrabbit 148.75/41 ;
    45.g4 Nh6 46.f3 Stockfish 8 #40/36 ]
    45...Nh6 46.f3 Nf7 47.Ra8 Nd6+ 48.Kd5 Nc4 49.Rxa7 Ne3+ 50.Ke4 Nc4 51.Ra6+ Kg7 52.Rc6 Kf7 53.Rc5 Ke6 54.Rxg5 Kf6 55.Rc5 g5 56.Kd4
    [56.Kd4 Na3 57.Kd3 b4 Stockfish 8 #24/69 ]
    1-0
  12. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    А не придётся ли для этого иметь нейросеть с информационной ёмкостью порядка числа вариантов шахматных партий? Типичные случаи разменов на одном поле, наверное, заучить можно. А вот с ФВ посложнее будет, нетривиальных случаев слишком много.
    Опять же, чтобы обучить её таким разменам, надо чтобы в обучающей выборке за время игры с самой собой они все хотя бы по разу случились. А лучше не по разу...
  13. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.100
    Симпатии:
    2.769
    Репутация:
    108
    Нарушения:
    9
    Оффлайн
    За прошедшую неделю согласно самотестированию сила игры Leela Zero увеличилась где-то на 1500 эло. Однако, эта цифра как-то плохо согласуется с рейтингом на этом сайте. Все еще не может обойти GnuGo. Возможно тесты с собой слишком растягивают шкалу, а также, что методика вычисления эло с доигрыванием прошедших sprt-тестов дает слишком большое систематическое отклонение.
    Может, правда, последняя версия обойдет GnuGo, но игр пока мало.

    Здесь интересно, что если судить по эло в играх со своими версиями, то скорость увеличения силы Leela Zero со значительно меньшей сетью соответствует AlphaGo Zero. Но непонятно, так ли это на самом деле.
  14. Осипов Юрий Учаcтник

    • Участник
    Рег.:
    18.06.2007
    Сообщения:
    392
    Симпатии:
    416
    Репутация:
    10
    Адрес:
    Правда
    Оффлайн
    Но ведь умеет же AZ каким-то образом оценивать любые позиции, в том числе и те, которые она ни разу раньше не встречала.
    crem нравится это.
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Но уже периодически стали появляться сообщения, что обыграна Aya на уровне 4 или 5 кю, да и люди в диапазоне однозначных кю уже время от времени проигрывают. Правда, чаще из-за какого-нибудь зевка.

    I lost to LeelaZSlow (3k KGS)

    Convincing win against 4k Aya!
    LeelaZSlow defeats 6k on KGS
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Если не обращать внимания на глюк Gnugo с просрочкой - то в личном матче уже достоверно догнала Gnugo (Gnugo-3.7.10-a1 1800).
    7 из 10, средний рейтинг 1873. Две сигмы на силу - нижняя граница 1800.
    http://www.yss-aya.com/cgos/19x19/cross/LZ-7ba9d2-t1-p1600.html
  17. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Моя любимица-Strelka, кстати, тоже умеет. И не только она.
    Другое дело — КАК?!:beer:
    Видимо, должен пояснить свой вопрос.
    Есть "отмазка": русский — не мой родной, стараюсь излагать на нем-Великом, а думаю по-своему, уж простите, Христа-то ради...
    Засим, скорректирую: меня (как пользователя) может совершенно не волновать вопрос типа "каким образом ОНИ иценивают", меня может интересовать лишь насколько правильно-точно.
    А Монте-понте-там-Карло или Альфа-Бета — какая мне разница?!
  18. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Ой, можно в качестве эксперимента заставить AlphaZero сыграть матч в шахматы Фишера со Стокфишем. Заодно увидим, как она оценивает незнакомые позиции, и насколько велика составляющая дебютной книги в её оценке.

    А есть какие-то новости от создателей AlphaZero? Что-то они молчат... Могли бы 4TPU выделить на растерзание общественности :)
  19. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    370
    Симпатии:
    77
    Репутация:
    0
    Оффлайн
    Народ, Вы видимо не врубились - Вас удостоил честью сам товарищ Чужакин (да-да, автор той самой, пока ещё не очень знаменитой системы). Он (наверное) знает о нейросетях гораздо больше вашего. Так что задавайте ему свои вопросы - и про железо для стока и остальное....
  20. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    nn и NS нравится это.
  21. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Сыграл партию с LeelaZeroSlow на КГС. Очень не хотелось войти в историю ещё одним вторым кю, проигравшим программе, поэтому действовать старался аккуратно...
    http://eidogo.com/#3ZnXQgfed
    nn нравится это.
  22. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.100
    Симпатии:
    2.769
    Репутация:
    108
    Нарушения:
    9
    Оффлайн
    Да, 7ba оказалась более-менее нормальной по игре с GnuGo, даже если просрочки убрать. Но опять наблюдается то же самое. Новая версия 30f уже на 300 эло сильнее, чем 7ba по тестам с собой. Огромная цифра, но по игре на yss-aya не видно особого прогресса. Опять же набирает меньше против GnuGo. Если есть 30 эло прироста из этих 300, то хорошо.

    P.S. А, ну собственно автор графика вверху о том же и говорит.
  23. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    629
    Симпатии:
    261
    Репутация:
    27
    Онлайн
  24. Michael-13 Господин

    • Участник
    Рег.:
    18.11.2011
    Сообщения:
    3.066
    Симпатии:
    1.101
    Репутация:
    29
    Оффлайн
  25. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    140
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Ну возми программу отсюда
    https://www.sjeng.org/leela.html
    и покажи как ты ее обыграешь :)
  26. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Со старыми версиями Лилы я полтора года назад баловался, иногда получалось очень смешно:
    http://gokifu.com/share/2jra

    Новые, конечно, на высших уровнях не обыграю, там на персоналке вполне честный 5-7 дан.
    Я из программ регулярно только на телефоне с Crazy Stone играю, на плавающей форе. Она мне где-то 1-2 дан определяет, при своём максимуме в 5-й.
  27. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    140
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Ну это не серьезно - это просто глюк в программе. Я вообще раньше с программами почти не играл а вот конда летом поставил ту Лилу, ту был удивлен , не то как она играет но том , что она очень маленькая программа и всегда вспоминал про то как говорили , что сделать программу которая играла бы хоть на первый дан - мощности офигенные нужны - оказываеться ничего такого не нужно...
    Ну и вспомнил те слова последнего двухкратного чемпиона СССР Саши , что проснулься и понял как надо играть ... :) .
    Начинаю в такое верить....
    WinPooh нравится это.
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    С "Crazy Stone Deep Learning"? Я думаю, покупать её или нет. Чем она лучше ChampionGo?
    Бесплатная версия Deep Learning мне не понравилась.
  29. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Бесплатную не смотрел. А в платной по сравнению с ChampionGo есть режим автоматического анализа партии (не очень удобный, правда) и уровни силы размечены по шкале кю-данов. Плюс рейтинговый режим, как во Фрице или Шредере - когда программа подстраивает свою силу под игрока. И, я так понимаю, движок обновлён - в оценке используется нейросеть, а в старой версии только MCTS был.
    NS нравится это.
  30. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Я читал статьи Remi Coulom (когда писал свою UCT/MCTS программу в Symple) - у него с самого начала ОФ была в Crazy Stone, то есть уже не голый MCTS.
  31. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Я неточно выразился. Там была MTCS + классическая оценка. В новой версии добавилась оценка с нейросетью.
    Кстати, пытался читать правила Symple, так ничего и не понял. Это вариант Го, где побеждает тот, у кого групп получилось меньше?
    NS нравится это.
  32. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    629
    Симпатии:
    261
    Репутация:
    27
    Онлайн
    Мне кажется, уже достаточно скоро можно будет просто скачать Sabaki, установить в неё нейросетку Leela Zero, подходящей силы, и играть сколько влезет. Даже фору устанавливать будет не нужно. Отчасти это возможно уже и сейчас.
  33. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Текущая версия LeelaZero работает только с GPU, причём с достаточно новыми. На моём старом ноуте, например, запускаться она отказывается.
  34. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    629
    Симпатии:
    261
    Репутация:
    27
    Онлайн
    Поэтому с нетерпением жду версию для CPU, которая уже на подходе. Кстати, вы наверное даже сможете скомпилировать её самостоятельно уже сейчас.
    —- добавлено: 25 дек 2017, опубликовано: 25 дек 2017 —-
    Если я правильно понимаю, там использовалась автоматическая генерация шаблонов из партий профессионалов.

    Кстати, если кому интересно почитать описание топовой "классической" Монте-Карловской программы, то рекомендую ознакомиться с диссертацией Айя Хуанга, где описывается его программа Эрика:
    https://www.usgo.org/files/bh_library/Supercomputer Go Appendix Two.pdf
    NS и WinPooh нравится это.
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Добавлено правило усложняющее жизнь программам - за один ход игрок делает несколько движений.
    Хода два вида - свободный ход в точку не связанную со своими группами, либо расширение на один камень всех своих групп на поле. Белые играют первые. Черные для компенсации права выступки, если никто ни разу не расширялся, имеют право на ход которым сначала расширяет все свои группы, а потом ставят камень в свободное поле.

    Камни с доски не снимаются, выигрывает тот, у кого больше камней на доске, и при этом меньше групп (группы лучше соединены). Количество очков каждого игрока - Количество камней на поле минус (количество групп)*6
    http://archive.codecup.nl/2013/49/rules_symple.html
    https://senseis.xmp.net/?Symple
    В игре есть диллема - чтоб ставить больше камней нужно иметь больше групп, но при этом чем больше групп, тем больший штраф при подсчете очков. Ну и количество возможных ходов за одну сторону - может быть очень большим.
    WinPooh нравится это.

Поделиться этой страницей