AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.487
    Симпатии:
    3.098
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Запасаемся попкорном и следим за стартующим сегодня TCEC. Мой прогноз: одна из двух сеток в следующий дивизион выйдет...
  2. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    На тестовом сервере судя по всему ожидается существенный скачок в силе в ближайшее время, т. к. было решено более агрессивно понижать LR, из-за грядущего обновления main-сервера.
  3. nn Заблокирован

    • Заблокирован
    Рег.:
    25.03.2007
    Сообщения:
    1.455
    Симпатии:
    3.107
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    Нет никакого движка Deus X и соответственного никакого его автора. Как это обычно бывает в гадюшнике называемом компьютерными шахматами Альберт Силвер просто пытался обмануть и выдать чужую работу за свою. Deus X - это Lc0 без каких-либо изменений. Насколько я знаю, Силвер не написал вообще ни строчки. А сеть возможно его. Но как он ее получил неизвестно, верить ему нельзя. потому что лохам лапшу на уши вешает.
    А Lc0 процентов на 90 работа crema.
    Polarity и sovaz1997 нравится это.
  4. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Я написал это сообщение тогда, когда никто об этом даже не подозревал, в том числе и Вы. Статья уже переименована и в заголовке теперь написано, что Deus X - именно сама сеть (веса), а не движок. Я согласен, что это неправильно, конечно. Надо было хотя бы в интервью сказать об этом.

    Если эта нейронная сеть действительно так сильна и войдет в тройку лучших движков, то кому от этого будет хуже? Получается, что человек нашел лучший способ обучения сети. Но если эта сеть не обойдет даже Lc0, то вопрос об участии в следующем сезоне будет открыт. Все-таки, если он берет чужую работу, он должен сделать ее лучше.

    Как я понял, команда LC0 согласна на участие сети Deus X: http://www.chessdom.com/statements-by-deus-x-and-leela-chess-zero-authors/ . Но и тут вопросы: кто дал это заявление?

    Я считаю, что надо дать шанс выступить в этом тестовом сезоне, а дальше уже смотреть по ситуации.
  5. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    С этим заявлением следующая история: вышло это интервью за два дня до начала сезона, в рабочий день, когда мы все были заняты. Некоторое время мы потратили выясняя, не использовался ли наш код в DeusX (это не понятно ни из интервью, ни из объявления), потом мы поняли что что-то скорее всего позаимствовали.
    Я написал админу TCEC что вроде бы наш код используется в этом DeusX, что я считаю, что это плагиат, но чтобы не портить репутацию TCEC, мы не против участия DeusX, но требуем чтоб написали что движок наш.
    После этого мы обменялись этими "примирительными" statement'ами (часть от имени LCZero написал я), и решили так и оставить.

    Надо было решать срочно, в рабочий день, поэтому вопрос вот так вот замяли, будто бы это был "недосмотр" и о нас "забыли" упомянуть.

    Но после этого ASilver продолжил заявлять что никакой ошибки не было и он всё сделал правильно. Вдобавок, к этому времени видео посмотрело ещё больше народу и народное возмущение расло. Поэтому на данный момент многие, включая некоторых основных разработчиков, считают, что надо требовать, чтобы DeusX сняли с соревнований.

    Время что-нибудь решать почти закончилось, но:
    • С одной стороны, всем любопытно, как DeusX выступит по сравнению с Lc0 (мой прогноз — плохо выступит)
    • С другой стороны, понятно, что это никакое не недоразумение, а спланированное нечестное действие ASilver'а, в результате которого он попадёт в новости шахматных сайтов, как автор "сильного" движка и участник самого уважаемого соревнования компьютерных шахматных программ. После этого он добавит это к себе в резюме и никто не будет проверять форумы насколько он честно там участвовал.
    Я думаю, что сеть на самом деле слабая, а он просто хотел попасть в TCEC в качестве автора движка и AI-эксперта.
    И вот осталось 4 часа до момента когда он по-видимому добьётся чего хотел.
    Neo94, Sergey1983, Rom и 2 другим нравится это.
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Тут может быть 2 варианта: если его сеть находится на уровне LC0 или хуже, он вообще не должен участвовать. Если же его сеть превосходит вашу и позволит движку находится в ТОП-3, то в новостях он может быть упомянут не как создать сильного движка, а как человек, который нашел способ обучить LCZero более эффективным методом и не более того.
  7. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.157
    Симпатии:
    20.965
    Репутация:
    611
    Адрес:
    Москва, Россия
    Оффлайн
    Народы!
    Говорят, что можно использовать прогу на нейронке для персонального компа.
    См. https://en.chessbase.com/post/leela-chess-zero-alphazero-for-the-pc
    Скажите, пожалуйста, как это делается? Я начал читать статью, но увяз в непонятках.
    Есть ли русская инструкция?
  8. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Есть на нерусском, но она неполная и вообще по большей части о другом:
    https://github.com/LeelaChessZero/lc0/wiki/Getting-Started

    Если в двух словах:
    1) Скачиваете архив с программой, соответствующий вашей конфигурации компьютера (есть версии: только для центрального процессора / для видеокарт NVidia / для любой видеокарты) и распаковываете в любое удобное место:
    https://github.com/LeelaChessZero/lc0/releases
    2) Скачиваете последнюю (или какая вам больше нравится) нейросеть и кидаете в папку с программой:
    http://lczero.org/networks
    3) Далее как обычно устанавливаете программу из оболочки.

    Но вообще-то тонкостей хватает. Например,
    - если у вас видеокарта NVidia, то нужно зарегистрироваться на их сайте или скачать у них нужные файлы. Это окупится скоростью.
    - программы для видеокарт не сразу загружаются, им нужно время для внутренних тестов.
    - некоторые версии могут глючить и поэтому играть слабо.
    - чтобы Лила играла более-менее сильно ей надо давать подумать, особенно если используете версию для центрального процессора (она самая медленная).
  9. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.157
    Симпатии:
    20.965
    Репутация:
    611
    Адрес:
    Москва, Россия
    Оффлайн
    Спасибо, Rom.
    Смущает вот что:
    В чём же тогда возможна выгода по сравнению со Стокфишем и Комодо?
    То есть, стоит ли возиться?
  10. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Сейчас самые лучшие результаты получаются именно на картах от NVIDIA. Но процесс установки немного нетривиален. Старые видеокарты могут не поддерживаться.

    Если кратко, то процесс подготовки состоит из 3 частей.
    1. Установка последних драйверов для видеокарты.
    2. Установка последней версии CUDA.
    3. Регистрация на сайте https://developer.nvidia.com/cudnn и скачивание подходящей версии CUDA библиотеки cuDNN.

    Дальше остаётся всего лишь скачать Lc0, файл с неройнной сетью, скинуть всё в одну папку вместе со скачанной cuDNN и дальше использовать как обычный шахматный движок.

    Наверное имелось ввиду, что лучше всё же использовать мощную видеокарту от NVIDIA, или даже 2, чтобы было много вычислительной мощности. Ну и версий нейронных сетей очень много, Leela постоянно совершенствуется. Скачать их и можно тут: http://testserver.lczero.org/networks и тут: http://lczero.org/networks
  11. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Со Стокфишем и Комодо пока никакой. Лила пока слабее может быть пунктов на 200, даже на приличном железе. Возиться стоит, если у вас по крайней мере видеокарта нормальная или уж очень хочется погонять движок туда-сюда.
    Если хочется просто посмотреть, то менее чем через час начинается чемпионат в низшем дивизионе TCEC, там железо приличное и Лила будет играть:
    http://tcec.chessdom.com/season13/live.php
  12. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Мне кажется, что Lc0 всё же полезна для анализа, т. к. она играет по-другому, в очень агрессивном стиле. И её игра в целом более понятна человеку. Не удивлюсь, что некоторые супергроссмейстеры уже взяли её на вооружение.
    Undying нравится это.
  13. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.157
    Симпатии:
    20.965
    Репутация:
    611
    Адрес:
    Москва, Россия
    Оффлайн
    Ну, тогда нет смысла преодолевать высокие преграды.
    Шахматным аналитикам важнее всего результат и скорость.
    Вот если эти новые творения станут сравнимы по силам с обычными движками, вот тогда...
  14. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Вопросы полезности ещё требуют своего разрешения. Что лучше - программа "мыслящяя" в едином с тобой духе или программа, которая закрывает твои слабости? Вот пусть Сергей Юрьевич попробует и нам расскажет - что полезнее для гроссмейстера?
  15. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Лучше и то и другое :)
    И насчёт этих 200 ELO разницы. Всё-таки, и то, и другое - сверхчеловеческий уровень. Leela может предлагать новые интересные и пока ещё практически никому неизвестные варианты, и никто не запрещает по-прежнему использовать "традиционные" движки параллельно, для повышения надёжности.
  16. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Скоро установка упростится, нужные .dll-ки будут в комплекте. Возможно сегодня, если успею. Если нет, то скорее в понедельник.
    Sergey1983 и svoitsl нравится это.
  17. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    За что отвечает настройка движка "NN Backend to use"?
    Я почему спрашиваю, там есть пункты "Cudnn" и "Cudnn-fp 16", это что разная аррифметика 32 и 16 бит,если да то какая лучше для моей GTX 1080?
  18. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Для топовых моделей (как они там называются? Titan? Volta? Tesla?) fp16 в два раза быстрее чем 32.
    Для GTX 16 бит либо не работает вообще, либо медленней, чем 32.
  19. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    А остальные режимы для чего?
  20. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    62
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Интересно, а на основании чего, Деусу в TCEC поставили рейтинг 3200?
  21. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.487
    Симпатии:
    3.098
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Тем временем DeusEx стартовала с победы в достаточно зрелищном стиле.
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.487
    Симпатии:
    3.098
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Кстати, а как интерпретировать для LZ/DeusEx показатель depth в информации о выводе движка? Показывает depth = 4 ply, и тут же рядом PV ходов на 15-20. Странно как-то всё это.
  23. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Это кажется означало глубину, до которой были просмотрены всевозможные варианты. MCTS очень избирателен в выборе следующей позиции для анализа, поэтому глубины 5 может быть придётся ждать очень долго :)
  24. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Это просто очень хорошо. С 22-го по 26-й ход стокфиш оценивает ходы белых как 0 и только 27. Qb7 определяет как ошибку. Лила же считала все это время что у нее хорошая позиция




    [Event "TCEC Season 13 - Division 4"]
    [Date "2018.08.04"]
    [Round "2.2"]
    [White "Senpai 2.0"]
    [Black "LCZero 16.10161"]
    [Result "0-1"]
    [BlackElo "3219"]
    [ECO "A28"]
    [GameDuration "01:08:22"]
    [GameEndTime "2018-08-04T02:11:26.642 W. Europe Standard Time"]
    [GameStartTime "2018-08-04T01:03:03.841 W. Europe Standard Time"]
    [Opening "English"]
    [PlyCount "111"]
    [Termination "adjudication"]
    [TerminationDetails "TCEC win rule"]
    [TimeControl "1800+10"]
    [Variation "four knights, Nimzovich variation"]
    [WhiteElo "3062"]


    1.c4 e5 2.Nc3 Nf6 3.Nf3 Nc6 4.e4 Bb4 5.d3 d6 6.a3 Bxc3+ 7.bxc3 Nd7 8.Bg5 f6 9.Be3 Na5 10.d4 b6 11.Be2 Bb7 12.Nd2 Qe7 13.O-O c5 14.d5 Bc8 15.Nb3 O-O 16.Nxa5 bxa5 17.Qa4 Nb6 18.Qxa5 f5 19.f3 Bd7 20.Qa6 Rfb8 21.Rab1 h5 22.exf5 Bxf5 23.Rbe1 h4 24.Rf2 Qf6 25.Bf1 Qg6 26.f4 Re8 27.Qb7 h3 28.g3 exf4 29.Rxf4 Rab8 30.Qxa7 Nd7 31.Bf2 Rxe1 32.Bxe1 Bg4 33.Bd2 Re8 34.Qa4 Ne5 35.Rxg4 Nxg4 36.Qd1 Rf8 37.Qe2 Rf2 38.Qxf2 Nxf2 39.Kxf2 Qc2 40.Ke1 Qe4+ 41.Kf2 Kf7 42.Bxh3 Qxc4 43.Bg2 Qd3 44.Be1 Qc2+ 45.Kg1 Qe2 46.Bf2 Qd1+ 47.Bf1 Qxd5 48.c4 Qf3 49.a4 Qa3 50.Bg2 Qa1+ 51.Bf1 Qxa4 52.Be3 Qb3 53.Kf2 d5 54.cxd5 Qxd5 55.Be2 c4 56.Bf3
    {Black wins by adjudication: TCEC win rule}
    0-1
    Undying нравится это.
  25. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Мне вот стало интересно, как Albert Silver тренировал свою сеть на играх людей.
    Чтобы это сделать, нужен либо правильный ответ (т. е. наилучший ход, в заданной позиции), либо очень точная оценка каким-нибудь движком. Причём таких игр вообще говоря должно быть очень много. У всех этих подходов есть масса проблем. И получившаяся нейронная сеть должна играть в каком-то смысле уже известном стиле, не демонстрируя каких-то там интересных новинок.
    Если я правильно помню, ASilver занимался тем, что подбирал более удачные параметры командной строки для lc0. Не удивлюсь, если он просто обучил сеть готовыми скриптами на новых играх + подобрал немного другие параметры.
    Как кто-то сказал недавно, deusX - первая шахматная программа, участвующая в TCEC, которая не была написана программистом :)
  26. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Хе-хе, последняя партия DeusX - это нечто.

    Ранее некоторые околотоповые классические движки писались нешахматистами, а сейчас нейросетевые пишутся непрограммистами. Так что баш на баш.
  27. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Ход в партии считается за правильный ответ. Этого достаточно для вычисления перекрестной энтропии с распределением вероятностей 100-O-O-O... Разве нет? Вроде бы ходили слухи, что Сильвер использовал партии переписочников.
  28. Vladruss НедоКМС, победитель второразрядников.

    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    16.466
    Симпатии:
    8.481
    Репутация:
    530
    Нарушения:
    40
    Оффлайн
    Зашел по ссылке, а там реклама Комодо Чесс 12 с технологией АльфаЗеро, с предложением купить за 75,55 евриков. Это что за зверь такой?
  29. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Вариант Комодо с перебором методом Монте-Карло. Без нейросети. Слабее пунктов на 200, чем обычный Комодо:
    http://www.computerchess.org.uk/ccrl/4040/cgi/engine_details.cgi?print=Details&each_game=1&eng=Komodo 12.1.1 MCTS 64-bit 4CPU#Komodo_12_1_1_MCTS_64-bit_4CPU

    P.S. Плюс, по-видимому, обычный Комодо в комплекте.
    Vladruss нравится это.
  30. Vladruss НедоКМС, победитель второразрядников.

    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    16.466
    Симпатии:
    8.481
    Репутация:
    530
    Нарушения:
    40
    Оффлайн
    Жулики и хапуги, короче.
    Sergey1983, Rom и Polarity нравится это.
  31. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.487
    Симпатии:
    3.098
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    А где можно скачать все PGN турнира тем, кто по ночам спит?
  32. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Пойду свою нейросеточку обучу, за неделю думаю до уровня div4 уж точно дойдёт :D
    Rom нравится это.
  33. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    644
    Симпатии:
    275
    Репутация:
    27
    Оффлайн
    Тем, кто рано встаёт... :)

    File => Save Event PGN
    http://tcec.chessdom.com/season13/live.php
  34. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.487
    Симпатии:
    3.098
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Кончаются чернила,
    Заржавлена пила...
    Победу ЛИла слИла,
    Или ЛилА слилА?

    (к партии с Tucano)
    sovaz1997 и Vladruss нравится это.
  35. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Хорошее начало: далеко не самая последняя сеть LCZero обыграла Deus X.
    Sergey1983 нравится это.

Поделиться этой страницей