Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 9 окт 2018.

  1. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    362
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Он состоится, т. к. вряд ли Stockfish проиграет Chiron-у :)
  2. Kirill_A Новичок

    • Новичок
    Рег.:
    09.05.2018
    Сообщения:
    20
    Симпатии:
    16
    Репутация:
    0
    Оффлайн
    Думаю, что даже если Лила в этом TCEC дойдет до полуфинала и сыграет со Стокфиш, то не стоит ожидать от этой версии сети больших чудес. Объективно Стокфиш пока посильнее, хотя некоторый шанс и у этой сети Лилы есть. Если хорошо натренировать сети 20x поколения, то я думаю, через считанные месяцы может появиться сеть Лилы, которая превзойдет Стокфиш по силе.

    Дело вот в чем: AlphaZero использовала железо Гугла, так называемыe тензорные процессоры Google (TPU), причем было использовано 5000 TPU, которые вместе сгенерировали 44 миллиона игр всего лишь за 4 часа для обучения AlphaZero. А один TPU имеет вычислительную мощь примерно 10 видеокарт Nvidia GTX 1080 Ti. Так вот, чтобы на одном простом компьютере сгенерировать такое количество игр для обучения, потребуется примерно 1700 лет. У Лилы нет такого железа как у Гугла. Поэтому есть только одна возможность довольно быстро обучить Лилу: совместными усилиями добровольцев, которые указанными ранее способами могут помочь генерировать игры с помощью видеокарты своего компьютера или удаленного сервиса для обучения сетей Лилы. Сейчас согласно официальному сайту за один день благодаря помощи добровольцев генерируется около 1,7 миллионов игр для обучения сетей 20x. И тенденция обучения выглядит хорошо на графике сетей.
  3. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Если после первого круга ческомовского блиц-турнира казалось, что либо в блиц Лила играет намного лучше, чем в быстрые, либо что новая версия намного сильнее прежней. То во втором круге Лилу вновь обуяла ничейная болезнь - всего 3 победы при 7 ничьих в десяти партиях. В первом круге против этих же соперников было наоборот 7 побед при 3 ничьих.
  4. Kirill_A Новичок

    • Новичок
    Рег.:
    09.05.2018
    Сообщения:
    20
    Симпатии:
    16
    Репутация:
    0
    Оффлайн
    Впечатляющая победа черными над Fire (Эло > 3300) в четвертьфинале TCEC Cup, это игра на мой взгляд впечатляет не меньше, чем известные победы AlphaZero над Stockfish.

    sovaz1997 нравится это.
  5. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Третья партия тоже интересная получается. Белый король пришёл к чёрному в гости, на h6.
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    362
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Позиция, похоже реально сложная для движков. SF видит +4, но оценка выше не идет. Судя по всему, пути к победе не видит, а путь там, возможно, есть (за счет цугцванга). Но это очень сложно считать.
  7. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Лила применила классическую антикомпьютерную стратегию. В позиции с 16 пешками закрыла один фланг, стянула все силы на другой и катком прошлась.
  8. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    362
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    А Fire тем временем зевнул пешку :)
  9. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Лила хождением туда-сюда загнала Файр на секунды и тот не выдержал и ошибся.
  10. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Онлайн
    Мне кажется, что обрезание и оценка позиции вместо доигрывания имеет также недостатки. Например,
    LC0 — Fire 7.1

    Если ли тут вечный шах? В позиция такого рода нужно доигрывать до конца, есть ничья или нет решают варианты, а не оценка позиции. Где-то ничья, где-то есть перекрытие...
    --- добавлено: 18 окт 2018 ---
    Кстати, прошлый Грюндфельд Fire выиграл, партия может решить исход противостояния :)
  11. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Вот-вот, и я всё время о том же. Полагать, что сложную комбинаторную задачу по перебору точных вариантов можно свести к перемножению нескольких десятков (пусть даже сотен и тысяч, главное, что фиксированного количества) больших матриц - крайняя степень идеализма.
  12. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Онлайн
    А тем временем LC0 зависла в ничейной позиции (White disconnects) за ход до повторения ходов. И... теперь ей надо отыгрываться...
  13. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Да не, ничью присудили.
    Эта музыка будет вечной.
  14. Kirill_A Новичок

    • Новичок
    Рег.:
    09.05.2018
    Сообщения:
    20
    Симпатии:
    16
    Репутация:
    0
    Оффлайн
    Одержав победы в двух последних партиях белыми и черными Лила вышла в полуфинал, где сегодня сразится с монстром Stockfish.

    Очень впечатлила последняя победа черными над Fire: так как черные переиграли белых используя идеи цугцванга, а также силу "пешки-колючки", которая сильно стесняла белого короля. Таким образом черные получили лучшую позицию, имея на пешку меньше.

    Undying нравится это.
  15. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Как я и говорил с Файром Лиле играть проще, чем с Этзереалем. Плюс два в матче победила. :)

    А если серьезно, то выигрывать у Файра Лиле действительно проще, но вот проигрывала она неожиданно много.
  16. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Онлайн
    Ну... если бы присудили поражение за disconnect, то результат был бы противоположным...
  17. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    А кто пытается свести задачу к перемножению матриц? Нет такого. Нейронные движки точно также перебор используют, как и алгоритмические. На самом деле вопрос стоит по другому - окупает ли лучшая оценка позиции замедление перебора в 1000 раз. В го ответ однозначен, а в шахматах ответ пока неочевиден.
    KEV81, Rom и WinPooh нравится это.
  18. Kirill_A Новичок

    • Новичок
    Рег.:
    09.05.2018
    Сообщения:
    20
    Симпатии:
    16
    Репутация:
    0
    Оффлайн
    По словам модераторов, остановка в той партии была не из-за Лилы, а из-за проблем с сетью:
    Сегодня в партии Гудини - Andscacs тоже похоже сетевые проблемы.
  19. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    362
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    SDChess нравится это.
  20. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Результат матча оказался закономерным. Белыми Лила в принципе не проигрывает, но переиграть Стокфиш удается редко. В матче 3 ничьи. А вот черными запас прочности у Лилы не велик. Особенно в сомнительных дебютах - староиндийка и какой-то сомнительный Алапин с Фа5 закончились поражениями.
  21. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Онлайн
    Это логично, потому что при обучении позиции из этих дебютов возникают меньше, соответственно на них сеть тренируется тоже меньше.
  22. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    На самом деле староиндийка вероятно не является сомнительным дебютом для Лилы. Это позиция ее типа и, несмотря на то, что Стокфиш показывал 0.9 пешки с раздачи, Лила уверенно уравняла. Но дальше подзевнула. Стокфиш и Комодо показывали, что перед жертвой фигуры нужно промежуточный Фd8 сделать, а Лила сразу пожертвовала и быстро проиграла. То есть тут причина поражения в зевке, а не в дебюте.

    А Аляпин с Фа5 с виду просто очень плохой дебют для нейронки. Там у белых сразу мощнейшее давление, черные должны очень точно защищаться от множества угроз. В такой защите нейронка намного слабее алгоритмических движков. Собственно тут Лила просто не вышла из дебюта. Уже на 12 ходу было абсолютно проигранно.
  23. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.055
    Симпатии:
    1.373
    Репутация:
    78
    Адрес:
    Заир
    Оффлайн
    Наверное, нейросети намного комфортнее играть, когда дебют один и тот же, в нём набран богатый опыт, особенно с конкретным соперником. А когда дебюты варьируются - ну, это кидалово какое-то.
    WinPooh нравится это.
  24. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Это не особо важно. Главное, чтобы дебют был корректный. В плохих позициях нейронка защищается хуже, чем алгоритмические движки. Собственно и из человеческого опыта известно, что для такой защиты нужен счет, а не понимание. И то что алгоритмический движок перебирает в тысячи раз больше позиций становится решающим фактором.
  25. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Вообще принцип самообучения, который после успеха Альфа Го Зеро возвели в фетиш, порочен по сути. Если есть принципиальные проблемы в понимании, то самообучение их выявить не может, т.к. оба соперника такие возможности не видят. Обязательно нужно дообучать нейронные сети в играх с алгоритмическими движками. Это не только позволит нейронке понять в каких позициях она сильнее, а в каких слабее, чем алгоритмические движки. Но и просто сделать нейронную сеть сильнее, т.к. позволит закрыть многие лакуны в понимании.

    Другое дело, что в го альтернативы самообучению нет, т.к. люди и алгоритмические движки играют безнадежно слабо. Но в шахматах ситуация совершенно другая.
    WinPooh нравится это.
  26. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Пожалуйста, не называйте альфа-бета движки алгоритмическими, противопоставляя их нейронно-монтекарликовым. Лила тоже алгоритмический движок, просто алгоритм у неё другой. Неалгоритмических движков я вообще не знаю.
  27. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Речь о способе оценки позиции (ноды). Существует два подхода. При первом оценкой занимается достаточно простая функция написанная человеком. Такой подход я называю алгоритмическим. При втором подходе оценкой занимается нейронная сеть.
  28. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Довольно показательный пример иллюстрирующий проблему самообучения из второй партии матча со Стокфишем:



    Эту позицию Лила оценивает +0.85, т.е. шансы белых на победу 12%.

    Откуда берется такая оценка? Фигуры черных скованы - король в матовой сетке, ладьи привязаны к восьмой горизонтали. Видя это отвечающие за скованность нейронные связи излучают оптимизм, который и завышает оценку. Что нужно сделать, чтобы оценка стала более адекватной? Поиграть такие позиции, убедиться в их ничейности и нарастить вес связей отвечающих за малофигурность и нивелирующих законы миттельшпиля в эндшпиле. Но как это сделать, когда слабейшая сторона тоже считает подобные позиции опасными для себя и на них просто не идет?
  29. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов. Называйте их, например, "традиционные". Или "альфа-бета".
    Иначе это выглядит как "спят все звери и слоны".
    Комсюк и sovaz1997 нравится это.
  30. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Даже строго формально нейронная сеть не является алгоритмом с человеческой точки зрения:

    Алгори́тм — набор инструкций, описывающих порядок действий исполнителя для достижения некоторого результата.

    Человек не способен воспринимать нейронную сеть как набор инструкций. Нейронная сеть для человека черный ящик в чистом виде.
  31. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Дерево из миллионов узлов, которое строит при поиске хода Стокфиш, для человека такой же непостижимый чёрный ящик.
    А определение алгоритма не имеет ни малейшего отношения к тому, понятен он человеку или нет. И нейронные сети обучаются и работают именно по алгоритмам: forward- и backward-propagation, gradient descent, regularization, normalization и т. д.
  32. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Намедни выполнял задание в курсе по Deep Learning на Курсере. Надо было заставить работать нейронную распознавалку котиков. Так вот, воспринимать эту нейросеть мне пришлось именно как набор отдельных инструкций, выраженных на Питоне. Ничего, справился :)
  33. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    А самое главное, очень похожая позиция, но отличающаяся какой-то сдвинутой на одну клетку пешкой, может из ничейной превратиться в тактически проигранную. И столкнуться в обучении со всеми такими нюансами невозможно просто со статистической точки зрения, слишком много в эндшпиле возможных тонкостей.
  34. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Онлайн
    Что там непонятного? Оно объемное, но для понимания простое. А вот нейронные взаимосвязи человек в принципе воспринять не способен.

    Термины вводятся для упрощения понимания человеком. Поэтому хорошая терминология разделяет принципиально разные с точки зрения человека вещи. Плохая наоборот сваливает все в кучу.

    Мне кажется в виде набора инструкций вы воспринимали не саму нейросеть, а ее структуру.
    --- добавлено: 20 окт 2018 ---
    Это как раз не проблема. Для тактики перебор вариантов есть. Принципиально важно, чтобы нейронка статику правильно оценивала.
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    А мне кажется, что в случае Стокфиша вы воспринимаете абстрактную идею дерева и схему альфа-бета поиска, а не конкретные миллионы оценок и границ, которые по этому дереву распространяются.
    Короче, это вопрос терминологический - что значит "понимать". И к формальному общепринятому понятию "алгоритм" отношения не имеющий.
    sovaz1997 нравится это.

Поделиться этой страницей