Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 10 окт 2018.

  1. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Он состоится, т. к. вряд ли Stockfish проиграет Chiron-у :)
     
  2. Kirill_A
    Оффлайн

    Kirill_A Новичок

    Репутация:
    0
    Думаю, что даже если Лила в этом TCEC дойдет до полуфинала и сыграет со Стокфиш, то не стоит ожидать от этой версии сети больших чудес. Объективно Стокфиш пока посильнее, хотя некоторый шанс и у этой сети Лилы есть. Если хорошо натренировать сети 20x поколения, то я думаю, через считанные месяцы может появиться сеть Лилы, которая превзойдет Стокфиш по силе.

    Дело вот в чем: AlphaZero использовала железо Гугла, так называемыe тензорные процессоры Google (TPU), причем было использовано 5000 TPU, которые вместе сгенерировали 44 миллиона игр всего лишь за 4 часа для обучения AlphaZero. А один TPU имеет вычислительную мощь примерно 10 видеокарт Nvidia GTX 1080 Ti. Так вот, чтобы на одном простом компьютере сгенерировать такое количество игр для обучения, потребуется примерно 1700 лет. У Лилы нет такого железа как у Гугла. Поэтому есть только одна возможность довольно быстро обучить Лилу: совместными усилиями добровольцев, которые указанными ранее способами могут помочь генерировать игры с помощью видеокарты своего компьютера или удаленного сервиса для обучения сетей Лилы. Сейчас согласно официальному сайту за один день благодаря помощи добровольцев генерируется около 1,7 миллионов игр для обучения сетей 20x. И тенденция обучения выглядит хорошо на графике сетей.
     
  3. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Если после первого круга ческомовского блиц-турнира казалось, что либо в блиц Лила играет намного лучше, чем в быстрые, либо что новая версия намного сильнее прежней. То во втором круге Лилу вновь обуяла ничейная болезнь - всего 3 победы при 7 ничьих в десяти партиях. В первом круге против этих же соперников было наоборот 7 побед при 3 ничьих.
     
  4. Kirill_A
    Оффлайн

    Kirill_A Новичок

    Репутация:
    0
    Впечатляющая победа черными над Fire (Эло > 3300) в четвертьфинале TCEC Cup, это игра на мой взгляд впечатляет не меньше, чем известные победы AlphaZero над Stockfish.

     
    sovaz1997 нравится это.
  5. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Третья партия тоже интересная получается. Белый король пришёл к чёрному в гости, на h6.
     
  6. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Позиция, похоже реально сложная для движков. SF видит +4, но оценка выше не идет. Судя по всему, пути к победе не видит, а путь там, возможно, есть (за счет цугцванга). Но это очень сложно считать.
     
  7. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Лила применила классическую антикомпьютерную стратегию. В позиции с 16 пешками закрыла один фланг, стянула все силы на другой и катком прошлась.
     
  8. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    А Fire тем временем зевнул пешку :)
     
  9. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Лила хождением туда-сюда загнала Файр на секунды и тот не выдержал и ошибся.
     
  10. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Мне кажется, что обрезание и оценка позиции вместо доигрывания имеет также недостатки. Например,
    LC0 — Fire 7.1

    Если ли тут вечный шах? В позиция такого рода нужно доигрывать до конца, есть ничья или нет решают варианты, а не оценка позиции. Где-то ничья, где-то есть перекрытие...
    —- добавлено: 18 окт 2018 —-
    Кстати, прошлый Грюндфельд Fire выиграл, партия может решить исход противостояния :)
     
    Последнее редактирование: 18 окт 2018
  11. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Вот-вот, и я всё время о том же. Полагать, что сложную комбинаторную задачу по перебору точных вариантов можно свести к перемножению нескольких десятков (пусть даже сотен и тысяч, главное, что фиксированного количества) больших матриц - крайняя степень идеализма.
     
  12. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    А тем временем LC0 зависла в ничейной позиции (White disconnects) за ход до повторения ходов. И... теперь ей надо отыгрываться...
     
  13. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Да не, ничью присудили.
    Эта музыка будет вечной.
     
  14. Kirill_A
    Оффлайн

    Kirill_A Новичок

    Репутация:
    0
    Одержав победы в двух последних партиях белыми и черными Лила вышла в полуфинал, где сегодня сразится с монстром Stockfish.

    Очень впечатлила последняя победа черными над Fire: так как черные переиграли белых используя идеи цугцванга, а также силу "пешки-колючки", которая сильно стесняла белого короля. Таким образом черные получили лучшую позицию, имея на пешку меньше.

     
    Undying нравится это.
  15. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Как я и говорил с Файром Лиле играть проще, чем с Этзереалем. Плюс два в матче победила. :)

    А если серьезно, то выигрывать у Файра Лиле действительно проще, но вот проигрывала она неожиданно много.
     
  16. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Ну... если бы присудили поражение за disconnect, то результат был бы противоположным...
     
  17. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А кто пытается свести задачу к перемножению матриц? Нет такого. Нейронные движки точно также перебор используют, как и алгоритмические. На самом деле вопрос стоит по другому - окупает ли лучшая оценка позиции замедление перебора в 1000 раз. В го ответ однозначен, а в шахматах ответ пока неочевиден.
     
    KEV81, Rom и WinPooh нравится это.
  18. Kirill_A
    Оффлайн

    Kirill_A Новичок

    Репутация:
    0
    По словам модераторов, остановка в той партии была не из-за Лилы, а из-за проблем с сетью:
    Сегодня в партии Гудини - Andscacs тоже похоже сетевые проблемы.
     
  19. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    SDChess нравится это.
  20. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Результат матча оказался закономерным. Белыми Лила в принципе не проигрывает, но переиграть Стокфиш удается редко. В матче 3 ничьи. А вот черными запас прочности у Лилы не велик. Особенно в сомнительных дебютах - староиндийка и какой-то сомнительный Алапин с Фа5 закончились поражениями.
     
  21. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Это логично, потому что при обучении позиции из этих дебютов возникают меньше, соответственно на них сеть тренируется тоже меньше.
     
  22. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    На самом деле староиндийка вероятно не является сомнительным дебютом для Лилы. Это позиция ее типа и, несмотря на то, что Стокфиш показывал 0.9 пешки с раздачи, Лила уверенно уравняла. Но дальше подзевнула. Стокфиш и Комодо показывали, что перед жертвой фигуры нужно промежуточный Фd8 сделать, а Лила сразу пожертвовала и быстро проиграла. То есть тут причина поражения в зевке, а не в дебюте.

    А Аляпин с Фа5 с виду просто очень плохой дебют для нейронки. Там у белых сразу мощнейшее давление, черные должны очень точно защищаться от множества угроз. В такой защите нейронка намного слабее алгоритмических движков. Собственно тут Лила просто не вышла из дебюта. Уже на 12 ходу было абсолютно проигранно.
     
  23. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    Наверное, нейросети намного комфортнее играть, когда дебют один и тот же, в нём набран богатый опыт, особенно с конкретным соперником. А когда дебюты варьируются - ну, это кидалово какое-то.
     
    WinPooh нравится это.
  24. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Это не особо важно. Главное, чтобы дебют был корректный. В плохих позициях нейронка защищается хуже, чем алгоритмические движки. Собственно и из человеческого опыта известно, что для такой защиты нужен счет, а не понимание. И то что алгоритмический движок перебирает в тысячи раз больше позиций становится решающим фактором.
     
  25. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Вообще принцип самообучения, который после успеха Альфа Го Зеро возвели в фетиш, порочен по сути. Если есть принципиальные проблемы в понимании, то самообучение их выявить не может, т.к. оба соперника такие возможности не видят. Обязательно нужно дообучать нейронные сети в играх с алгоритмическими движками. Это не только позволит нейронке понять в каких позициях она сильнее, а в каких слабее, чем алгоритмические движки. Но и просто сделать нейронную сеть сильнее, т.к. позволит закрыть многие лакуны в понимании.

    Другое дело, что в го альтернативы самообучению нет, т.к. люди и алгоритмические движки играют безнадежно слабо. Но в шахматах ситуация совершенно другая.
     
    WinPooh нравится это.
  26. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Пожалуйста, не называйте альфа-бета движки алгоритмическими, противопоставляя их нейронно-монтекарликовым. Лила тоже алгоритмический движок, просто алгоритм у неё другой. Неалгоритмических движков я вообще не знаю.
     
  27. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Речь о способе оценки позиции (ноды). Существует два подхода. При первом оценкой занимается достаточно простая функция написанная человеком. Такой подход я называю алгоритмическим. При втором подходе оценкой занимается нейронная сеть.
     
  28. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Довольно показательный пример иллюстрирующий проблему самообучения из второй партии матча со Стокфишем:



    Эту позицию Лила оценивает +0.85, т.е. шансы белых на победу 12%.

    Откуда берется такая оценка? Фигуры черных скованы - король в матовой сетке, ладьи привязаны к восьмой горизонтали. Видя это отвечающие за скованность нейронные связи излучают оптимизм, который и завышает оценку. Что нужно сделать, чтобы оценка стала более адекватной? Поиграть такие позиции, убедиться в их ничейности и нарастить вес связей отвечающих за малофигурность и нивелирующих законы миттельшпиля в эндшпиле. Но как это сделать, когда слабейшая сторона тоже считает подобные позиции опасными для себя и на них просто не идет?
     
  29. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов. Называйте их, например, "традиционные". Или "альфа-бета".
    Иначе это выглядит как "спят все звери и слоны".
     
    Комсюк и sovaz1997 нравится это.
  30. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Даже строго формально нейронная сеть не является алгоритмом с человеческой точки зрения:

    Алгори́тм — набор инструкций, описывающих порядок действий исполнителя для достижения некоторого результата.

    Человек не способен воспринимать нейронную сеть как набор инструкций. Нейронная сеть для человека черный ящик в чистом виде.
     
  31. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Дерево из миллионов узлов, которое строит при поиске хода Стокфиш, для человека такой же непостижимый чёрный ящик.
    А определение алгоритма не имеет ни малейшего отношения к тому, понятен он человеку или нет. И нейронные сети обучаются и работают именно по алгоритмам: forward- и backward-propagation, gradient descent, regularization, normalization и т. д.
     
  32. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Намедни выполнял задание в курсе по Deep Learning на Курсере. Надо было заставить работать нейронную распознавалку котиков. Так вот, воспринимать эту нейросеть мне пришлось именно как набор отдельных инструкций, выраженных на Питоне. Ничего, справился :)
     
  33. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А самое главное, очень похожая позиция, но отличающаяся какой-то сдвинутой на одну клетку пешкой, может из ничейной превратиться в тактически проигранную. И столкнуться в обучении со всеми такими нюансами невозможно просто со статистической точки зрения, слишком много в эндшпиле возможных тонкостей.
     
    Последнее редактирование: 20 окт 2018
  34. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Что там непонятного? Оно объемное, но для понимания простое. А вот нейронные взаимосвязи человек в принципе воспринять не способен.

    Термины вводятся для упрощения понимания человеком. Поэтому хорошая терминология разделяет принципиально разные с точки зрения человека вещи. Плохая наоборот сваливает все в кучу.

    Мне кажется в виде набора инструкций вы воспринимали не саму нейросеть, а ее структуру.
    —- добавлено: 20 окт 2018 —-
    Это как раз не проблема. Для тактики перебор вариантов есть. Принципиально важно, чтобы нейронка статику правильно оценивала.
     
  35. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А мне кажется, что в случае Стокфиша вы воспринимаете абстрактную идею дерева и схему альфа-бета поиска, а не конкретные миллионы оценок и границ, которые по этому дереву распространяются.
    Короче, это вопрос терминологический - что значит "понимать". И к формальному общепринятому понятию "алгоритм" отношения не имеющий.
     
    sovaz1997 нравится это.