AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Интересный график
    Показано изменение силы игры в пунктах Эло относительно количества просмотренных узлов на один ход. Тестирование проводилось на сетке ID 125. Если построить этот график в обычных координатах, то мне кажется более наглядно:
    Дельта Эло.gif
    До 6000 узлов на ход - значительный рост силы игры, а дальше скорость изменения снижается.
    Для стокфиша есть что-то подобное?
    sovaz1997 and admd like this.
  2. Rom Старожил

    • Участник
    • Старожил
    Member Since:
    12.02.2012
    Message Count:
    645
    Likes Received:
    276
    Репутация:
    28
    Оффлайн
    http://fastgm.de/time-control4.html

    Для Стокфиша примерно так же.
    admd likes this.
  3. Sergey1983 Учаcтник

    • Участник
    Member Since:
    03.04.2018
    Message Count:
    126
    Likes Received:
    14
    Репутация:
    1
    Оффлайн
    Каждые N пунктов Эло преимущества это P кратная разница в очках.Таким образом, если перевести график из Эло в набранные за матч очки, то он будет более линейным чем здесь. Примерно так.
  4. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
  5. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Imagine :to_become_senile:Наигрались? Доигрались? Ждите — будет!:grabli:
  6. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    А можно для непонятливых (для меня) объяснить более развернуто? )))
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.230
    Likes Received:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Нейросеть шалит
  8. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Spesial for You:
    Только дурак не поймёт. А умный (и/или хоть глаза-уши-мозги имеющий)?
    Ещё вопросы?
    Слава Богу, пока пронесло.
    Если Вас не обманули в Его ПЕРВОСТЕПЕННОМ присутствии — т.е. когда-либо в этом мире Он, якобы, был — если был, то уж точно спит; отвечаю — проверил лично!
    Или, в натуре, наигрался с дураками... Очень надеюсь, что вопрошающий к ним не хочет относиться.
    Но не все имеют уши, глаза, мозги и пр. атрибутику, чтобы не играть в бирюльки под названием шахматы.
    Ящики ПандорРры (или как её там было?..) — ничто по сравнению с вашим (заметить прошу — с маленькой буквы!) сыром.
    Едите. ЖРИТЕ! Жрецы?:to_become_senile:Лохи. По жизни.
    Повторяю для ВСЕХ: Danger!
    Я-то уж как-нибудь. А вы?..
    —- добавлено: 29 Apr 2018 —-
    Короче: правА на ошибку иссякли. Не прощается.
  9. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Ещё более кратко: я не Пушкин и не Гоголь.
    Ищите.
  10. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Я конечно осознаю, что это дикий оффтоп, но все же...
    Из Вашего поста я понял следующее:
    1. Совсем недавно произошло нечто похожее на апокалипсис.
    2. Это было последнее предупреждение.
    3. Это "нечто" как-то похоже на шахматы, но шахматы и рядом не валялись.

    Могу предположить, что Вы имеете ввиду построение СИИ (сильного искусственного интеллекта). Если так, тогда не могли бы дать ссылку на работы, которые хоть как-то приближаются к его реализации. Дело в том, что я почти 20 лет интересуюсь этой темой, и не вижу НИ ОДНОГО прорыва в этой области.
  11. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Повторяю: ищите.
    Не мои проблемы.
    У меня проблем нет.
    И никогда не было.
    P.S. Начинаешь решать ЧУЖИЕ проблемы — становятся ТВОИМИ.
    Это по-нашему. По-вашему — ваши.
  12. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    В начале появления A0 многими было высказано предположение, что во время обучение нейросеть фактически начитывает себе дебютную книгу. И что, дескать, в этом и заключается ее главная сила. Если, к примеру, поменять слона и коня местами, то результат будет иной. Я захотел проверить. Ноутбук у меня слабенький, игр не много, но результат может кого-нибудь заинтересует.

    leela N211 vs Stockfish 9 level 17.
    При контроле 5 секунд на ход на моем ноуте core i5 в 3 потока эти товарищи играют с равным счетом.
    10 игр начальной стандартной позиции закончились так:
    +3 -3 =4
    При этом я бы так охарактеризовал характер борьбы:
    - LC0 всегда разыгрывает дебют лучше, и ведет игру по своим правилам. Идет позиционная борьба с лишней пешкой, или с лучшей структурой, или с преимуществом двух слонов
    - Игра довольно сухая. Мало тактики.
    - Оценка у обоих движков похожа в начале игры, SF часто понимает, что его давят, но ни чего поделать не может.
    - SF выигрывает только если удается найти сложную тактику или в эндшпиле спасается, так как "знает", что лишний конь или пешка у оппонента - это не всегда выигрыш.

    Затем я поменял слонов с конями местами и запустил заново.
    Кратко, разгром LC0:
    +0 -7 =3
    Эти игры я бы охарактеризовал так:
    - в дебюте движки по разному оценивают себя. Каждый думает, что у него лучше. Бывало, что одну и ту же позицию SF оценивал +1.5, а LC0 -2.0.
    - SF ведет все игры с позиции силы. Получает насыщенные тактические позиции.
    - Спасаться LC0 удается только если пошла позиционная борьба.

    Пока у меня такие выводы:
    1. LC0 действительно наигрывает себе дебютную книгу, в нестандартных позициях проваливается.
    2. LC0 любит получать позиционную игру, в тактике не понимает ничего. Зевки тактики на глубине 6 полуходов - обычное явление.
    3. LC0 вообще пока не понимает нюансы эндшпиля. Пытается выходить в ничейные ладейники с лишней пешкой или конём.
    crem, Undying, Mustitz and 3 others like this.
  13. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    1 нестандартных позиций в тех играх на которых она учится не так уж и много, ей просто не на чем учиться,поэтому всякие не стандартные задачи ей вряд ли хорошо получиться решать
    2 не все учебные игры доходят до эндшпиля, опять таки не на чем учиться
  14. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Игра с огнем. Ария. Скрипач дьявола. Неофициальный клип от Poleandv.

    «Игра с огнём» стала одной из самых популярных у Арии. В её вступлении использован фрагмент «Каприса № 24» Никколо Паганини, а текст романтически обыгрывает миф, что Паганини продал душу дьяволу за виртуозную игру. Это одно из первых обращений Арии к мистической теме, которая вскоре станет одной из основных в творчестве группы. «Игра с огнём» является самым длинным в истории группы (длительность 9:04).
  15. Boroda Новичок

    • Новичок
    Member Since:
    12.01.2018
    Message Count:
    62
    Likes Received:
    8
    Репутация:
    0
    Оффлайн
    Подскажите плиз где скачать лилу и будет ли она нормально работать на компе без видеокарты?
  16. Polarity Новичок

    • Новичок
    Member Since:
    24.04.2018
    Message Count:
    77
    Likes Received:
    17
    Репутация:
    0
    Оффлайн
    Чувствую здесь противоречие. Если поменять фигуры местами, то получается нестандартная позиция, в которой она лучше разыгрывает дебют.

    Кажется, не стоит забывать, что нейронная сеть, как правило, умеет неплохо обобщать, т. е. действовать хорошо в ситуациях, которые она никогда не видела (в пределах разумного). А вот стокфиш видимо наоборот, слишком сильно полагается на дебютные книги.
  17. Sergey1983 Учаcтник

    • Участник
    Member Since:
    03.04.2018
    Message Count:
    126
    Likes Received:
    14
    Репутация:
    1
    Оффлайн
    Посмотри на 39 странице 1336 пост автор Crem.
    Для работы на CPU качай CPU-Win.zip
    Boroda likes this.
  18. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Вы не внимательно прочитали. LC0 всегда лучше разыгрывает дебют только в играх из начальной позиции. Когда же позиция изначально изменена, то у SF лучше. Игра шла без дебютных библиотек.
  19. Polarity Новичок

    • Новичок
    Member Since:
    24.04.2018
    Message Count:
    77
    Likes Received:
    17
    Репутация:
    0
    Оффлайн
    Пломбир, да, виноват, прошу прощения.
  20. Boroda Новичок

    • Новичок
    Member Since:
    12.01.2018
    Message Count:
    62
    Likes Received:
    8
    Репутация:
    0
    Оффлайн
    Вот с этим пунктром не понял что нужно делать
    6. Добавить lczero.exe в качестве движка с параметром "-w путь/к/файлу/сети".
    Я просто установил движок в Арене, запускаю турнир, но он почему то не начинает играть.
  21. Sergey1983 Учаcтник

    • Участник
    Member Since:
    03.04.2018
    Message Count:
    126
    Likes Received:
    14
    Репутация:
    1
    Оффлайн
    Страница 42 последний пост, файл нейронки должен быть в папке с движком.
    Boroda likes this.
  22. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Если файл с сетью оставить в папке с движком и переименовать его "weights.txt", то работает даже без этих параметров. У меня запускается даже в аквариуме.
    Boroda likes this.
  23. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Собственно это логично. Игра нейронной сети похожа на человеческую. Человек аналогично в нестандартных позициях и в тактике не понимает ничего. В этих случаях понимание шахмат не работает и все сводится к счету. А в счете с переборным движком естественно бороться невозможно.
  24. Boroda Новичок

    • Новичок
    Member Since:
    12.01.2018
    Message Count:
    62
    Likes Received:
    8
    Репутация:
    0
    Оффлайн
    Сделал так, заработало, спс!
    А теперь еще более нубские вопросы, как в арене, посмотреть партии по окончании турнира? и как русифицировать арену3.5.1?
  25. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    К сожалению мне не приходит в голову ничего другого как загрузить файл турнира (Файл- загрузить F3), надеюсь кто то подскажет более простой вариант

    скачать русификатор,официального до сих пор нет,
    поэтому вот хотя бы мой
    Распаковать в папку \Arena\Languages и выбрать его extras/select language

    Attached Files:

    Boroda likes this.
  26. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    Ещё вам может потребоваться дебютная книжка (если будете играть с движком не LC0), их есть много разных, но могу порекомендовать например 5-ходовую
    или даже 8-и ходовую (rar архив, расширение переименовать в rar и распаковать в \Arena\Books )

    Attached Files:

    Boroda likes this.
  27. Boroda Новичок

    • Новичок
    Member Since:
    12.01.2018
    Message Count:
    62
    Likes Received:
    8
    Репутация:
    0
    Оффлайн
    Спасибо большое, всё получилось!
  28. hornet Учаcтник

    • Участник
    Member Since:
    05.11.2016
    Message Count:
    844
    Likes Received:
    770
    Репутация:
    467
    Оффлайн
    У меня всё это не работает, не знаю почему. При двойном клике на файл lczero.exe - окрывается окно типа коммандной строки и тут же закрывается...
  29. Kesandr Учаcтник

    • Участник
    Member Since:
    02.09.2008
    Message Count:
    464
    Likes Received:
    35
    Репутация:
    11
    Оффлайн
    У меня уже третий день подряд не откривается http://play.lczero.org. У всех так? Или єто что то у меня?
  30. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    а вы пишете,что не работает? а на самом деле может все у вас работает...
    лучше для начала запустите обычную cpu версию, и про все библиотеки не забудьте, включая и vc
    Надо просто скачать файл сети и поместить в папку с lczero.exe и переименовать его в weights.txt
    и запихнуть в любимую оболочку (у меня - Арена, а у вас?),не файл сети , конечно, а lczero.exe

    у меня также. нет н у вас одних...
  31. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Обнаружил баг в отображении оценки LC0 в многопоточном режиме (во всяком случае на CPU)
    При работе на одном ядре все хорошо. При увеличении потоков - на низкой глубине оценка отображается неадекватно.
    Например, в начальной позиции при одном потоке все нормально:
    info depth 6 nodes 2 nps 11 score cp 0 time 86 pv e2e4 c7c5
    info depth 7 nodes 3 nps 16 score cp 1 time 127 pv e2e4 c7c5 c2c3
    info depth 8 nodes 5 nps 19 score cp 3 time 210 pv e2e4 c7c5 c2c3 g8f6 e4e5
    info depth 9 nodes 8 nps 21 score cp 6 time 327 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5
    info depth 10 nodes 15 nps 23 score cp 7 time 603 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5
    info depth 11 nodes 25 nps 24 score cp 4 time 989 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4
    info depth 12 nodes 43 nps 25 score cp 4 time 1681 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4
    info depth 13 nodes 78 nps 25 score cp 4 time 3023 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6
    info depth 14 nodes 137 nps 26 score cp 4 time 5288 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6
    info depth 15 nodes 240 nps 26 score cp 5 time 9131 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6
    info depth 16 nodes 423 nps 27 score cp 5 time 15841 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8
    info depth 17 nodes 755 nps 28 score cp 5 time 27156 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3
    info depth 18 nodes 1342 nps 29 score cp 5 time 46825 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3 h7h6 e1g1

    А при двух потоках начальная оценка уходит в минуса:
    info depth 6 nodes 2 nps 11 score cp -388 time 90 pv e2e4 c7c5
    info depth 7 nodes 4 nps 14 score cp -222 time 214 pv e2e4 c7c5 c2c3 g8f6
    info depth 8 nodes 7 nps 21 score cp -140 time 280 pv e2e4 c7c5 c2c3 g8f6 e4e5
    info depth 9 nodes 9 nps 23 score cp -111 time 349 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5
    info depth 10 nodes 15 nps 26 score cp -69 time 543 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5
    info depth 11 nodes 25 nps 31 score cp -42 time 780 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4
    info depth 12 nodes 44 nps 32 score cp -25 time 1341 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4
    info depth 13 nodes 78 nps 32 score cp -12 time 2431 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6
    info depth 14 nodes 138 nps 34 score cp -5 time 4055 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6
    info depth 15 nodes 242 nps 36 score cp 0 time 6620 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6
    info depth 16 nodes 425 nps 40 score cp 1 time 10613 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3
    info depth 17 nodes 757 nps 44 score cp 2 time 17325 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3
    info depth 18 nodes 1347 nps 47 score cp 4 time 28922 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3 h7h6 e1g1

    Чем больше потоков, тем заметнее эффект. Это при четырех:
    info depth 6 nodes 2 nps 8 score cp -925 time 120 pv e2e4 c7c5
    info depth 7 nodes 4 nps 11 score cp -526 time 267 pv e2e4 c7c5 c2c3 g8f6
    info depth 9 nodes 9 nps 23 score cp -277 time 346 pv e2e4 c7c5 c2c3 g8f6 e4e5
    info depth 10 nodes 17 nps 32 score cp -166 time 502 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5
    info depth 11 nodes 25 nps 37 score cp -121 time 656 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4
    info depth 12 nodes 46 nps 40 score cp -71 time 1118 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4
    info depth 13 nodes 78 nps 41 score cp -44 time 1867 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4
    info depth 14 nodes 142 nps 45 score cp -23 time 3143 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6
    info depth 15 nodes 248 nps 48 score cp -12 time 5172 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6
    info depth 16 nodes 428 nps 50 score cp -4 time 8465 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3
    info depth 17 nodes 763 nps 53 score cp 0 time 14288 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3
    info depth 18 nodes 1352 nps 56 score cp 2 time 24035 pv e2e4 c7c5 c2c3 g8f6 e4e5 f6d5 d2d4 c5d4 c3d4 d7d6 e5d6 e7e6 b1c3 f8d6 g1f3 e8g8 f1d3 h7h6
  32. Пломбир Новичок

    • Новичок
    Member Since:
    09.04.2018
    Message Count:
    35
    Likes Received:
    25
    Репутация:
    0
    Оффлайн
    Рассмотрим элементарную ничейную позицию, в которой LC0 ставит оценку +6. За этой позицией я слежу с сети N45. Оценка в разные времена скакала от +5 до +14, но адекватна никогда не была. В подобные окончания при игре против стокфиша, лила выходит постоянно у меня. Через раз. Даже сейчас на новой большой сети. Просто сливает преимущество в ничейном эндшпиле. Может отдать слона или коня, думая, что ферзь на подходе...
    оценка 6,55
    Есть еще нюанс... В зеркальных одинаковых позициях оценка LC0 разная. В зеркальных сверху вниз - в пределах погрешности, но в зеркальных слева направо бывает значительная. Например, та же самая позиция (оценка на одинаковой глубине d=18):
    оценка 5,43
    оценка 6,58
    оценка 5,49
    Я думаю, что зеркальные позиции можно сгенерировать сейчас из имеющихся (после потери рокировок). И дообучить. Мне кажется, это не сложно.
    sovaz1997 and svoitsl like this.
  33. Sergey1983 Учаcтник

    • Участник
    Member Since:
    03.04.2018
    Message Count:
    126
    Likes Received:
    14
    Репутация:
    1
    Оффлайн
    Crem, это нормально что у меня новая сетка для максимальной производительности на GPU требует параметр -t порядка 5-ти?
  34. Boroda Новичок

    • Новичок
    Member Since:
    12.01.2018
    Message Count:
    62
    Likes Received:
    8
    Репутация:
    0
    Оффлайн
    Я смотрю ЭЛО лилы растёт как на дрожжах, буквально пару дней назад был 2819, сегодня 2843!
  35. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    сменили сеть на сеть большего размера и был по началу неплохой скачек. но теперь все вернулось на круги своя и рост пока очень небольшой, а вот скорость наигрывания партий снизилась почти вдвое из-за большей сети,да и файл этой сети тоже увеличился вдвое.
    Так что следующие 10 млн игр будут не ранее конца июня.
    Boroda likes this.

Share This Page