Leela Chess Zero (lc0): турниры, партии, рейтинги...

sovaz1997 · 15 окт 2018

Undying пишет: ↑

Лила Эзереаль дожала. Исторический матч со Стокфишем все ближе.
Нажмите, чтобы раскрыть...

Он состоится, т. к. вряд ли Stockfish проиграет Chiron-у

Kirill_A · 16 окт 2018

Думаю, что даже если Лила в этом TCEC дойдет до полуфинала и сыграет со Стокфиш, то не стоит ожидать от этой версии сети больших чудес. Объективно Стокфиш пока посильнее, хотя некоторый шанс и у этой сети Лилы есть. Если хорошо натренировать сети 20x поколения, то я думаю, через считанные месяцы может появиться сеть Лилы, которая превзойдет Стокфиш по силе.

Дело вот в чем: AlphaZero использовала железо Гугла, так называемыe тензорные процессоры Google (TPU), причем было использовано 5000 TPU, которые вместе сгенерировали 44 миллиона игр всего лишь за 4 часа для обучения AlphaZero. А один TPU имеет вычислительную мощь примерно 10 видеокарт Nvidia GTX 1080 Ti. Так вот, чтобы на одном простом компьютере сгенерировать такое количество игр для обучения, потребуется примерно 1700 лет. У Лилы нет такого железа как у Гугла. Поэтому есть только одна возможность довольно быстро обучить Лилу: совместными усилиями добровольцев, которые указанными ранее способами могут помочь генерировать игры с помощью видеокарты своего компьютера или удаленного сервиса для обучения сетей Лилы. Сейчас согласно официальному сайту за один день благодаря помощи добровольцев генерируется около 1,7 миллионов игр для обучения сетей 20x. И тенденция обучения выглядит хорошо на графике сетей.

Undying · 16 окт 2018

Если после первого круга ческомовского блиц-турнира казалось, что либо в блиц Лила играет намного лучше, чем в быстрые, либо что новая версия намного сильнее прежней. То во втором круге Лилу вновь обуяла ничейная болезнь - всего 3 победы при 7 ничьих в десяти партиях. В первом круге против этих же соперников было наоборот 7 побед при 3 ничьих.

Kirill_A · 18 окт 2018

Впечатляющая победа черными над Fire (Эло > 3300) в четвертьфинале TCEC Cup, это игра на мой взгляд впечатляет не меньше, чем известные победы AlphaZero над Stockfish.

WinPooh · 18 окт 2018

Третья партия тоже интересная получается. Белый король пришёл к чёрному в гости, на h6.

sovaz1997 · 18 окт 2018

Позиция, похоже реально сложная для движков. SF видит +4, но оценка выше не идет. Судя по всему, пути к победе не видит, а путь там, возможно, есть (за счет цугцванга). Но это очень сложно считать.

Undying · 18 окт 2018

Kirill_A пишет: ↑

Впечатляющая победа черными над Fire (Эло > 3300) в четвертьфинале TCEC Cup, это игра на мой взгляд впечатляет не меньше, чем известные победы AlphaZero над Stockfish.
Нажмите, чтобы раскрыть...

Лила применила классическую антикомпьютерную стратегию. В позиции с 16 пешками закрыла один фланг, стянула все силы на другой и катком прошлась.

sovaz1997 · 18 окт 2018

А Fire тем временем зевнул пешку

Undying · 18 окт 2018

sovaz1997 пишет: ↑

Позиция, похоже реально сложная для движков. SF видит +4, но оценка выше не идет. Судя по всему, пути к победе не видит, а путь там, возможно, есть (за счет цугцванга). Но это очень сложно считать.
Нажмите, чтобы раскрыть...

Лила хождением туда-сюда загнала Файр на секунды и тот не выдержал и ошибся.

Mustitz · 18 окт 2018

Мне кажется, что обрезание и оценка позиции вместо доигрывания имеет также недостатки. Например,
LC0 — Fire 7.1

Если ли тут вечный шах? В позиция такого рода нужно доигрывать до конца, есть ничья или нет решают варианты, а не оценка позиции. Где-то ничья, где-то есть перекрытие...

—- добавлено: 18 окт 2018 —-

Кстати, прошлый Грюндфельд Fire выиграл, партия может решить исход противостояния

WinPooh · 18 окт 2018

Mustitz пишет: ↑

Если ли тут вечный шах? В позиция такого рода нужно доигрывать до конца, есть ничья или нет решают варианты, а не оценка позиции. Где-то ничья, где-то есть перекрытие...
Нажмите, чтобы раскрыть...

Вот-вот, и я всё время о том же. Полагать, что сложную комбинаторную задачу по перебору точных вариантов можно свести к перемножению нескольких десятков (пусть даже сотен и тысяч, главное, что фиксированного количества) больших матриц - крайняя степень идеализма.

Mustitz · 19 окт 2018

А тем временем LC0 зависла в ничейной позиции (White disconnects) за ход до повторения ходов. И... теперь ей надо отыгрываться...

WinPooh · 19 окт 2018

Mustitz пишет: ↑

А тем временем LC0 зависла в ничейной позиции (White disconnects) за ход до повторения ходов. И... теперь ей надо отыгрываться...
Нажмите, чтобы раскрыть...

Да не, ничью присудили.
Эта музыка будет вечной.

Kirill_A · 19 окт 2018

Одержав победы в двух последних партиях белыми и черными Лила вышла в полуфинал, где сегодня сразится с монстром Stockfish.

Очень впечатлила последняя победа черными над Fire: так как черные переиграли белых используя идеи цугцванга, а также силу "пешки-колючки", которая сильно стесняла белого короля. Таким образом черные получили лучшую позицию, имея на пешку меньше.

Undying · 19 окт 2018

Как я и говорил с Файром Лиле играть проще, чем с Этзереалем. Плюс два в матче победила.

А если серьезно, то выигрывать у Файра Лиле действительно проще, но вот проигрывала она неожиданно много.

Mustitz · 19 окт 2018

Undying пишет: ↑

А если серьезно, то выигрывать у Файра Лиле действительно проще, но вот проигрывала она неожиданно много.
Нажмите, чтобы раскрыть...

Ну... если бы присудили поражение за disconnect, то результат был бы противоположным...

Undying · 19 окт 2018

WinPooh пишет: ↑

Вот-вот, и я всё время о том же. Полагать, что сложную комбинаторную задачу по перебору точных вариантов можно свести к перемножению нескольких десятков (пусть даже сотен и тысяч, главное, что фиксированного количества) больших матриц - крайняя степень идеализма.
Нажмите, чтобы раскрыть...

А кто пытается свести задачу к перемножению матриц? Нет такого. Нейронные движки точно также перебор используют, как и алгоритмические. На самом деле вопрос стоит по другому - окупает ли лучшая оценка позиции замедление перебора в 1000 раз. В го ответ однозначен, а в шахматах ответ пока неочевиден.

Kirill_A · 19 окт 2018

Mustitz пишет: ↑

Ну... если бы присудили поражение за disconnect, то результат был бы противоположным...
Нажмите, чтобы раскрыть...

По словам модераторов, остановка в той партии была не из-за Лилы, а из-за проблем с сетью:

Game #17 of Leela - Fire match is declared to be a draw due to network outage and position being a perpetual check from Fire.
Нажмите, чтобы раскрыть...

Сегодня в партии Гудини - Andscacs тоже похоже сетевые проблемы.

sovaz1997 · 20 окт 2018

Stockfish - LCZero стартовал: http://tcec.chessdom.com/live.html

Undying · 20 окт 2018

Результат матча оказался закономерным. Белыми Лила в принципе не проигрывает, но переиграть Стокфиш удается редко. В матче 3 ничьи. А вот черными запас прочности у Лилы не велик. Особенно в сомнительных дебютах - староиндийка и какой-то сомнительный Алапин с Фа5 закончились поражениями.

Mustitz · 20 окт 2018

Undying пишет: ↑

Особенно в сомнительных дебютах - староиндийка и какой-то сомнительный Алапин с Фа5 закончились поражениями.
Нажмите, чтобы раскрыть...

Это логично, потому что при обучении позиции из этих дебютов возникают меньше, соответственно на них сеть тренируется тоже меньше.

Undying · 20 окт 2018

Mustitz пишет: ↑

Это логично, потому что при обучении позиции из этих дебютов возникают меньше, соответственно на них сеть тренируется тоже меньше.
Нажмите, чтобы раскрыть...

На самом деле староиндийка вероятно не является сомнительным дебютом для Лилы. Это позиция ее типа и, несмотря на то, что Стокфиш показывал 0.9 пешки с раздачи, Лила уверенно уравняла. Но дальше подзевнула. Стокфиш и Комодо показывали, что перед жертвой фигуры нужно промежуточный Фd8 сделать, а Лила сразу пожертвовала и быстро проиграла. То есть тут причина поражения в зевке, а не в дебюте.

А Аляпин с Фа5 с виду просто очень плохой дебют для нейронки. Там у белых сразу мощнейшее давление, черные должны очень точно защищаться от множества угроз. В такой защите нейронка намного слабее алгоритмических движков. Собственно тут Лила просто не вышла из дебюта. Уже на 12 ходу было абсолютно проигранно.

Мобуту · 20 окт 2018

Наверное, нейросети намного комфортнее играть, когда дебют один и тот же, в нём набран богатый опыт, особенно с конкретным соперником. А когда дебюты варьируются - ну, это кидалово какое-то.

Undying · 20 окт 2018

Мобуту пишет: ↑

Наверное, нейросети намного комфортнее играть, когда дебют один и тот же, в нём набран богатый опыт, особенно с конкретным соперником. А когда дебюты варьируются - ну, это кидалово какое-то.
Нажмите, чтобы раскрыть...

Это не особо важно. Главное, чтобы дебют был корректный. В плохих позициях нейронка защищается хуже, чем алгоритмические движки. Собственно и из человеческого опыта известно, что для такой защиты нужен счет, а не понимание. И то что алгоритмический движок перебирает в тысячи раз больше позиций становится решающим фактором.

Undying · 20 окт 2018

Вообще принцип самообучения, который после успеха Альфа Го Зеро возвели в фетиш, порочен по сути. Если есть принципиальные проблемы в понимании, то самообучение их выявить не может, т.к. оба соперника такие возможности не видят. Обязательно нужно дообучать нейронные сети в играх с алгоритмическими движками. Это не только позволит нейронке понять в каких позициях она сильнее, а в каких слабее, чем алгоритмические движки. Но и просто сделать нейронную сеть сильнее, т.к. позволит закрыть многие лакуны в понимании.

Другое дело, что в го альтернативы самообучению нет, т.к. люди и алгоритмические движки играют безнадежно слабо. Но в шахматах ситуация совершенно другая.

WinPooh · 20 окт 2018

Undying пишет: ↑

Мобуту пишет: ↑

Наверное, нейросети намного комфортнее играть, когда дебют один и тот же, в нём набран богатый опыт, особенно с конкретным соперником. А когда дебюты варьируются - ну, это кидалово какое-то.
Нажмите, чтобы раскрыть...

Это не особо важно. Главное, чтобы дебют был корректный. В плохих позициях нейронка защищается хуже, чем алгоритмические движки. Собственно и из человеческого опыта известно, что для такой защиты нужен счет, а не понимание. И то что алгоритмический движок перебирает в тысячи раз больше позиций становится решающим фактором.
Нажмите, чтобы раскрыть...

Пожалуйста, не называйте альфа-бета движки алгоритмическими, противопоставляя их нейронно-монтекарликовым. Лила тоже алгоритмический движок, просто алгоритм у неё другой. Неалгоритмических движков я вообще не знаю.

Undying · 20 окт 2018

WinPooh пишет: ↑

Пожалуйста, не называйте альфа-бета движки алгоритмическими, противопоставляя их нейронно-монтекарликовым. Лила тоже алгоритмический движок, просто алгоритм у неё другой. Неалгоритмических движков я вообще не знаю.
Нажмите, чтобы раскрыть...

Речь о способе оценки позиции (ноды). Существует два подхода. При первом оценкой занимается достаточно простая функция написанная человеком. Такой подход я называю алгоритмическим. При втором подходе оценкой занимается нейронная сеть.

Undying · 20 окт 2018

Undying пишет: ↑

Вообще принцип самообучения, который после успеха Альфа Го Зеро возвели в фетиш, порочен по сути. Если есть принципиальные проблемы в понимании, то самообучение их выявить не может, т.к. оба соперника такие возможности не видят.
Нажмите, чтобы раскрыть...

Довольно показательный пример иллюстрирующий проблему самообучения из второй партии матча со Стокфишем:

Эту позицию Лила оценивает +0.85, т.е. шансы белых на победу 12%.

Откуда берется такая оценка? Фигуры черных скованы - король в матовой сетке, ладьи привязаны к восьмой горизонтали. Видя это отвечающие за скованность нейронные связи излучают оптимизм, который и завышает оценку. Что нужно сделать, чтобы оценка стала более адекватной? Поиграть такие позиции, убедиться в их ничейности и нарастить вес связей отвечающих за малофигурность и нивелирующих законы миттельшпиля в эндшпиле. Но как это сделать, когда слабейшая сторона тоже считает подобные позиции опасными для себя и на них просто не идет?

WinPooh · 20 окт 2018

Undying пишет: ↑

WinPooh пишет: ↑

Пожалуйста, не называйте альфа-бета движки алгоритмическими, противопоставляя их нейронно-монтекарликовым. Лила тоже алгоритмический движок, просто алгоритм у неё другой. Неалгоритмических движков я вообще не знаю.
Нажмите, чтобы раскрыть...

Речь о способе оценки позиции (ноды). Существует два подхода. При первом оценкой занимается достаточно простая функция написанная человеком. Такой подход я называю алгоритмическим. При втором подходе оценкой занимается нейронная сеть.
Нажмите, чтобы раскрыть...

Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов. Называйте их, например, "традиционные". Или "альфа-бета".
Иначе это выглядит как "спят все звери и слоны".

Undying · 20 окт 2018

WinPooh пишет: ↑

Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов.
Нажмите, чтобы раскрыть...

Даже строго формально нейронная сеть не является алгоритмом с человеческой точки зрения:

Алгори́тм — набор инструкций, описывающих порядок действий исполнителя для достижения некоторого результата.

Человек не способен воспринимать нейронную сеть как набор инструкций. Нейронная сеть для человека черный ящик в чистом виде.

WinPooh · 20 окт 2018

Undying пишет: ↑

WinPooh пишет: ↑

Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов.
Нажмите, чтобы раскрыть...

Даже строго формально нейронная сеть не является алгоритмом с человеческой точки зрения:

Алгори́тм — набор инструкций, описывающих порядок действий исполнителя для достижения некоторого результата.

Человек не способен воспринимать нейронную сеть как набор инструкций. Нейронная сеть для человека черный ящик в чистом виде.
Нажмите, чтобы раскрыть...

Дерево из миллионов узлов, которое строит при поиске хода Стокфиш, для человека такой же непостижимый чёрный ящик.
А определение алгоритма не имеет ни малейшего отношения к тому, понятен он человеку или нет. И нейронные сети обучаются и работают именно по алгоритмам: forward- и backward-propagation, gradient descent, regularization, normalization и т. д.

WinPooh · 20 окт 2018

Undying пишет: ↑

WinPooh пишет: ↑

Я прекрасно понимаю, какие бывают методы оценки и поиска, и могу сам прочитать на эту тему лекцию. Я всего лишь прошу быть точнее в классификации и не называть общим термином "алгоритмические" узкое частное подмножество алгоритмических же подходов.
Нажмите, чтобы раскрыть...

Даже строго формально нейронная сеть не является алгоритмом с человеческой точки зрения:

Алгори́тм — набор инструкций, описывающих порядок действий исполнителя для достижения некоторого результата.

Человек не способен воспринимать нейронную сеть как набор инструкций. Нейронная сеть для человека черный ящик в чистом виде.
Нажмите, чтобы раскрыть...

Намедни выполнял задание в курсе по Deep Learning на Курсере. Надо было заставить работать нейронную распознавалку котиков. Так вот, воспринимать эту нейросеть мне пришлось именно как набор отдельных инструкций, выраженных на Питоне. Ничего, справился

WinPooh · 20 окт 2018

Undying пишет: ↑

Undying пишет: ↑

Вообще принцип самообучения, который после успеха Альфа Го Зеро возвели в фетиш, порочен по сути. Если есть принципиальные проблемы в понимании, то самообучение их выявить не может, т.к. оба соперника такие возможности не видят.
Нажмите, чтобы раскрыть...

Довольно показательный пример иллюстрирующий проблему самообучения из второй партии матча со Стокфишем:

Эту позицию Лила оценивает +0.85, т.е. шансы белых на победу 12%.

Откуда берется такая оценка? Фигуры черных скованы - король в матовой сетке, ладьи привязаны к восьмой горизонтали. Видя это отвечающие за скованность нейронные связи излучают оптимизм, который и завышает оценку. Что нужно сделать, чтобы оценка стала более адекватной? Поиграть такие позиции, убедиться в их ничейности и нарастить вес связей отвечающих за малофигурность и нивелирующих законы миттельшпиля в эндшпиле. Но как это сделать, когда слабейшая сторона тоже считает подобные позиции опасными для себя и на них просто не идет?
Нажмите, чтобы раскрыть...

А самое главное, очень похожая позиция, но отличающаяся какой-то сдвинутой на одну клетку пешкой, может из ничейной превратиться в тактически проигранную. И столкнуться в обучении со всеми такими нюансами невозможно просто со статистической точки зрения, слишком много в эндшпиле возможных тонкостей.

Undying · 20 окт 2018

WinPooh пишет: ↑

Дерево из миллионов узлов, которое строит при поиске хода Стокфиш, для человека такой же непостижимый чёрный ящик.
Нажмите, чтобы раскрыть...

Что там непонятного? Оно объемное, но для понимания простое. А вот нейронные взаимосвязи человек в принципе воспринять не способен.

WinPooh пишет: ↑

А определение алгоритма не имеет ни малейшего отношения к тому, понятен он человеку или нет.
Нажмите, чтобы раскрыть...

Термины вводятся для упрощения понимания человеком. Поэтому хорошая терминология разделяет принципиально разные с точки зрения человека вещи. Плохая наоборот сваливает все в кучу.

WinPooh пишет: ↑

Надо было заставить работать нейронную распознавалку котиков. Так вот, воспринимать эту нейросеть мне пришлось именно как набор отдельных инструкций, выраженных на Питоне. Ничего, справился
Нажмите, чтобы раскрыть...

Мне кажется в виде набора инструкций вы воспринимали не саму нейросеть, а ее структуру.

—- добавлено: 20 окт 2018 —-

WinPooh пишет: ↑

А самое главное, очень похожая позиция, но отличающаяся какой-то сдвинутой на одну клетку пешкой, может из ничейной превратиться в тактически проигранную.
Нажмите, чтобы раскрыть...

Это как раз не проблема. Для тактики перебор вариантов есть. Принципиально важно, чтобы нейронка статику правильно оценивала.

WinPooh · 20 окт 2018

Undying пишет: ↑

WinPooh пишет: ↑

Дерево из миллионов узлов, которое строит при поиске хода Стокфиш, для человека такой же непостижимый чёрный ящик.
Нажмите, чтобы раскрыть...

Что там непонятного? Оно объемное, но для понимания простое. А вот нейронные взаимосвязи человек в принципе воспринять не способен.

WinPooh пишет: ↑

А определение алгоритма не имеет ни малейшего отношения к тому, понятен он человеку или нет.
Нажмите, чтобы раскрыть...

Термины вводятся для упрощения понимания человеком. Поэтому хорошая терминология разделяет принципиально разные с точки зрения человека вещи. Плохая наоборот сваливает все в кучу.

WinPooh пишет: ↑

Надо было заставить работать нейронную распознавалку котиков. Так вот, воспринимать эту нейросеть мне пришлось именно как набор отдельных инструкций, выраженных на Питоне. Ничего, справился
Нажмите, чтобы раскрыть...

Мне кажется в виде набора инструкций вы воспринимали не саму нейросеть, а ее структуру.

—- добавлено: 20 окт 2018 —-

WinPooh пишет: ↑

А самое главное, очень похожая позиция, но отличающаяся какой-то сдвинутой на одну клетку пешкой, может из ничейной превратиться в тактически проигранную.
Нажмите, чтобы раскрыть...

Это как раз не проблема. Для тактики перебор вариантов есть. Принципиально важно, чтобы нейронка статику правильно оценивала.
Нажмите, чтобы раскрыть...

А мне кажется, что в случае Стокфиша вы воспринимаете абстрактную идею дерева и схему альфа-бета поиска, а не конкретные миллионы оценок и границ, которые по этому дереву распространяются.
Короче, это вопрос терминологический - что значит "понимать". И к формальному общепринятому понятию "алгоритм" отношения не имеющий.

Войти или зарегистрироваться

Leela Chess Zero (lc0): турниры, партии, рейтинги...

sovaz1997 Учаcтник

Kirill_A Новичок

Undying Учаcтник

Kirill_A Новичок

WinPooh В.М.

sovaz1997 Учаcтник

Undying Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

Mustitz Заслуженный

WinPooh В.М.

Mustitz Заслуженный

WinPooh В.М.

Kirill_A Новичок

Undying Учаcтник

Mustitz Заслуженный

Undying Учаcтник

Kirill_A Новичок

sovaz1997 Учаcтник

Undying Учаcтник

Mustitz Заслуженный

Undying Учаcтник

Мобуту спаситель нации

Undying Учаcтник

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

WinPooh В.М.

WinPooh В.М.

WinPooh В.М.

Undying Учаcтник

WinPooh В.М.

Поделиться этой страницей