Leela Chess Zero (lc0): турниры, партии, рейтинги...

vasa · 10 Oct 2018

Kirill_A said: ↑

Не могли бы вы, пожалуйста, в "Машинном отделении" создать тему Нейронная сеть Leela Chess Zero (lc0)? Уже имеющаяся там тема для настройки и установки Лилы не подходит для моего сообщения по контексту.
Click to expand...

Kirill_A · 10 Oct 2018

Обсуждаем нейронную сеть Leela Chess Zero (lc0) в этой отдельной теме.

Сейчас идет турнир движков TCEC Cup 2018 (нокаут система, 32 движка, контроль времени 30 минут + 10 секунд добавка на ход), в котором Лила (Lc0 18.11248) вчера играла с сильным движком Laser (Elo 3241). В каждом матче программы играют друг с другом по 8 партий (4 дебюта белыми и черными). Лила выиграла 5 - 3 (4 ничьих и две победы) и попала в 1/8 финала. Со Стокфиш она может встретиться в полуфинале (судя по турнирной сетке).

Победа черными во французской защите очень впечатлила: здесь Лила увидела инициативу и возрастающее преимущество черных раньше чем СFish (клон Стокфиша, работающий там для анализа на 88 ядрах и использующий базы семифигурных окончаний).

—- добавлено: 10 Oct 2018, опубликовано: 10 Oct 2018 —-

А здесь впечатляющая победа белыми: тоже во французской защите.

Kirill_A · 14 Oct 2018

В блиц-турнире среди движков от Chess.com: CCC 2: Blitz Battle (5|2) Лила одержала сегодня впечатляющую победу черными на над очень сильным движком Ethereal в сицилианской защите.

sovaz1997 · 14 Oct 2018

Не переоценивайте Ethereal
Да, это сильный движок. Но он все еще слабее Fire. И, понятное дело, слабее большой тройки. А вот большую тройку Лила тоже регулярно обыгрывает. Вот совсем недавно:

WinPooh · 14 Oct 2018

sovaz1997 · 14 Oct 2018

WinPooh, мы знаем, что Лила зевает тактику
Но в дебюте Лила играет лучше всех. Увы, нельзя просто взять и обойти AB-движки, развивающиеся с 50-х годов прошлого века по всем параметрам за год.

Kirill_A · 14 Oct 2018

sovaz1997 said: ↑

Но в дебюте Лила играет лучше всех.
Click to expand...

Скорее в миттельшпиле. Хотя наверно еще рано говорить о "лучше всех", но уже почти на самом высоком уровне уровне сильнейших программ, на развитие приципа игры которых ушло более 40 лет. А недостатки в эндшпиле (как этот грубый эндшпильный зевок в партии с Stockfish в равной позиции) - как я понимаю, могут быть устранены благодаря дальнейшей тренировке в игре сама с собой. Сейчас для тренировки нейросети 20x играется более миллиона партий в день (благодаря помощи людей, которые решили помочь обучению). Чем больше партий играется для обучения, тем скорее нейросеть сможет стать сильнее, но конечно для этого нужны большие мощности. И каждый человек может помочь процессу обучения нейросети совершенно бесплатно, для этого можно, следуя указаниям по ссылке ниже, либо дать Лиле играть тренировочные партии на своем компьютере с хорошей видеокартой (GPU), либо, что еще лучше и быстрее - с помощью удаленного вычислительного сервиса Google Collab (бесплатно, но видиокарта слабее чем доступные в Google Cloud) или Google Cloud (бесплатно в течении около 20 дней, где можно выбрать мощную видеокарту Tesla V100, которая может генерировать около 15000 игр для обучения Лилы в день.)

Здесь все написано подробно и с инструкциями, как можно бесплатно помочь развитию Лилы: http://blog.lczero.org/2018/10/contributing-to-leela-chess-zero.html

А здесь можно смотреть на результаты процесса обучения: http://lczero.org/

Undying · 14 Oct 2018

sovaz1997 said: ↑

Не переоценивайте Ethereal
Да, это сильный движок. Но он все еще слабее Fire. И, понятное дело, слабее большой тройки. А вот большую тройку Лила тоже регулярно обыгрывает. Вот совсем недавно:
Click to expand...

Эзереаль для Лилы более неудобный соперник, чем Файр. А Комодо в блиц неожиданно слабо играет. Намного хуже Эзереаля.

sovaz1997 · 14 Oct 2018

Не знаю, почему Komodo так играет в CCCC, но в блице он должен быть как минимум на 50-100 пунктов сильнее, чем Fire. Еще успеет на 4-3 места выбраться, если нет багов в новой версии, конечно)

Undying · 14 Oct 2018

sovaz1997 said: ↑

Не знаю, почему Komodo так играет в CCCC, но в блице он должен быть как минимум на 50-100 пунктов сильнее, чем Fire. Еще успеет на 4-3 места выбраться, если нет багов в новой версии, конечно)
Click to expand...

Откуда уверенность что сильнее? Комодо когда-то демонстрировал хорошую игру в блиц? Комодо занимает свое место. Принципиально оно за второй круг не изменится.

Скорей всего проблема в том, что Комодо склонен к авантюрной игре. А в блиц не успевает досчитать последствий, поэтому много некорректных жертв делает. И сильные движки его за это наказывают - 1 очко из 8 против первой восьмерки набрал.

sovaz1997 · 14 Oct 2018

Undying, откуда уверенность?

http://fastgm.de/60-0.60.html
http://www.ipmanchess.yolasite.com/i9-7980xe.php
http://fastgm.de/10min.html
http://fastgm.de/60min.html

Во всяком случае, ыся большая тройка вместе с Komodo во всех рейтинг—листах обходит Ethereal, Fire и других движков из десятки.

А склонен он к некорректным жертвам или нет - показывают тесты. Думаю, либо Komodo имеет баг в CCCC, либо баг с отображением таблицы мест, либо просто пока не везёт.

Undying · 15 Oct 2018

sovaz1997 said: ↑

Во всяком случае, ыся большая тройка вместе с Komodo во всех рейтинг—листах обходит Ethereal, Fire и других движков из десятки.
Click to expand...

Значит что-то в последней версии испортили. Играет Комодо просто слабо.

Мобуту · 15 Oct 2018

То есть пока получается, что в честном бою нейросеть играет на 200 пунктов слабее Стокфиша. А громить и крушить получалось только в условиях, когда Стокфиш сидел без дебютной книжки, с отключённой рандомностью выбора, на слабом железе против суперкомпьютера и в отсутствие внешних наблюдателей за матчем.

Rom · 15 Oct 2018

sovaz1997 said: ↑

Не знаю, почему Komodo так играет в CCCC,
Click to expand...

talkchess.com

lkaufman said:

The problem seems to be that Komodo takes a few minutes to reach full speed on giant hardware with large hash tables. In TCEC this only costs a few elo, but in a blitz game it is fatal. So it's not a buggy version, it's just an unresolved problem on expensive hardware.
Click to expand...

Undying · 15 Oct 2018

Мобуту said: ↑

То есть пока получается, что в честном бою нейросеть играет на 200 пунктов слабее Стокфиша. А громить и крушить получалось только в условиях, когда Стокфиш сидел без дебютной книжки, с отключённой рандомностью выбора, на слабом железе против суперкомпьютера и в отсутствие внешних наблюдателей за матчем.
Click to expand...

200 пунктов разницы откуда взялись? Для такой разницы Стокфиш должен 1 партию из 2 у Лилы выигрывать. А в реальности счет со Стокфишем у Лилы почти равный. Плюс к этому Лила намного хуже оптимизирована под тензорные процессоры, чем Альфа Зеро - 30 тысяч против 80 тысяч нод в секунду. И не факт, что нейронка Лилы уже достигла уровня нейронки Альфа Зеро.

Rom · 15 Oct 2018

Согласно,
https://docs.google.com/spreadsheet...XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729
разница от 60 до 130 пунктов на достаточно комплиментарном для Лилы соотношении железа. Прошу только учесть, что вопрос масштабирования на большие контроли в настоящий момент недостаточно прояснен, вследствие наличия противоречивых данных.

WinPooh · 15 Oct 2018

Тут дело не в масштабировании, а в алгоритмике. Что такое вечный шах, понимал движок Фриц-2 на однопоточном Пентиуме-166 МГц. А Лила не понимает... Продолжаю утверждать, что поиск в ширину имеет фундаментальные недостатки, которые не позволяют точно играть в эндшпиле. Пока алгоритм UCT не будет модернизирован, так и будем наблюдать комедии, как в 14-партии с Ethereal из TCEC Cup.
В отличие от Го, шахматы гораздо чаще требуют игры единственными ходами. Что совершенно не укладывается в парадигму UCT "взять и всё усреднить".

WinPooh · 15 Oct 2018

Проблема ещё в том, что обучением это не лечится.
"Здесь вечный шах!" - скажет нейросеть.
"Ерунда, он только в одном варианте, сейчас усредним!" - скажет UCT-поиск.

Undying · 15 Oct 2018

Rom said: ↑

Тут дело не в масштабировании, а в алгоритмике. Что такое вечный шах, понимал движок Фриц-2 на однопоточном Пентиуме-166 МГц. А Лила не понимает...
Click to expand...

С вечными шахами похоже принципиальная проблема. Нейронка вечный шах понять не может, а в голом счете нейронный движок слаб, т.к. считает в 1000 раз меньше позиций, чем алгоритмический движок. Поэтому кентавр с добавлением даже маломощного алгоритмического движка имеет смысл.

Другой путь использовать разные нейронки для разных стадий партии. Возможно если пообучать нейронку на ферзевых эндшпилях, то проблема решится. Тут возникает технический вопрос. Есть ли какие-то проблемы с переключением с одной нейронной сети на другую по ходу счета вариантов.

Kirill_A · 15 Oct 2018

Мобуту said: ↑

То есть пока получается, что в честном бою нейросеть играет на 200 пунктов слабее Стокфиша. А громить и крушить получалось только в условиях, когда Стокфиш сидел без дебютной книжки, с отключённой рандомностью выбора, на слабом железе против суперкомпьютера и в отсутствие внешних наблюдателей за матчем.
Click to expand...

Не так. Во-первых AlphaZero тренировалась на гораздо большем количестве партий, Лила пока не достигла этого уровня тренировки.
Во-вторых в случае Лилы нужно различать версии сетей:

Версия сети, которая сейчас играет в турнирах: 11248. Она относится к поколению сетей 10x (тест 10x).
Ее протестированный уровень игры Ело отстает от уровня Stockfish 9 на 25 очков. См. здесь:
https://docs.google.com/spreadsheet...XUSx1jyUrgVEcj8DNLKA7-urBw/edit#gid=763519729

Но это - старая сеть 10x, ее уже не обучают больше.
Теперь тренируют сети поколения 20x, в которых исправлены некоторые ошибки и введены некоторые изменения для обучения. Ожидается, что в будущем после достаточного обучения уровень игры Стокфиш будет превзойден. Но даже старая 10x сеть 11248 впечатляет своими результатами в турнирах несмотря на свои недостатки и ошибки.

Undying · 15 Oct 2018

WinPooh said: ↑

"Здесь вечный шах!" - скажет нейросеть.
"Ерунда, он только в одном варианте, сейчас усредним!" - скажет UCT-поиск.
Click to expand...

Мне кажется не в усреднении проблема. А именно в том, что нейронке кажется, что если у короля много пространства, то вечного шаха не будет.

Rom · 15 Oct 2018

WinPooh said: ↑

Тут дело не в масштабировании, а в алгоритмике.
Click to expand...

Я думаю одно другому не противоречит. Масштабирование можно и за счет алгоритмики улучшать.

WinPooh said: ↑

Проблема ещё в том, что обучением это не лечится.
"Здесь вечный шах!" - скажет нейросеть.
"Ерунда, он только в одном варианте, сейчас усредним!" - скажет UCT-поиск.
Click to expand...

Интересно, не поможет ли использование хэш-таблиц. У Лилы их сейчас нет. В своё время и обычные движки отвратительно играли эндшпили, но после введения хэш-таблиц, в 70-е годы, очень сильно подтянули свою игру в окончаниях. Оно и понятно, ведь в эндшпилях позиций в общем-то немного, потому что позиции очень часто повторяются.

Undying · 15 Oct 2018

Kirill_A said: ↑

Теперь тренируют сети поколения 20x, в которых исправлены некоторые ошибки и введены некоторые изменения для обучения. Ожидается, что в будущем после достаточного обучения уровень игры Стокфиш будет превзойден. Но даже старая 10x сеть 11248 впечатляет своими результатами в турнирах несмотря на свои недостатки и ошибки.
Click to expand...

Помню, что при обучении Альфа Зеро выяснилось, что после какого-то количества партий прогресс останавливается. Количество партий на котором обучается Лила с этим пороговым значением как соотносится?

Rom · 15 Oct 2018

Undying said: ↑

Другой путь использовать разные нейронки для разных стадий партии. Возможно если пообучать нейронку на ферзевых эндшпилях, то проблема решится. Тут возникает технический вопрос. Есть ли какие-то проблемы с переключением с одной нейронной сети на другую по ходу счета вариантов.
Click to expand...

Интересно, что a/b движки используют плавный (сглаженный) переход между миттельшпильной и эндшпильной оценкой.

Undying · 15 Oct 2018

Rom said: ↑

Интересно, не поможет ли использование хэш-таблиц. У Лилы их сейчас нет.
Click to expand...

У Лилы нет хэш-таблиц? Серьезно? Казалось бы это первым делом надо добавлять. У алгоритмических движков хэш-таблицы не так эффективны, слишком много рассчитанных позиций и все они просто не влазят в память. А Лила считает настолько мало вариантов, что там даже чистить хэш особо не надо. Все влазит в память с большим запасом.

WinPooh · 15 Oct 2018

Rom said: ↑

Undying said: ↑

Другой путь использовать разные нейронки для разных стадий партии. Возможно если пообучать нейронку на ферзевых эндшпилях, то проблема решится. Тут возникает технический вопрос. Есть ли какие-то проблемы с переключением с одной нейронной сети на другую по ходу счета вариантов.
Click to expand...

Интересно, что a/b движки используют плавный (сглаженный) переход между миттельшпильной и эндшпильной оценкой.
Click to expand...

Нейросетевые люди обычно считают, что универсальная сеть размера A+B будет лучше, чем две сети для частных случаев размеров A и B. Она должна сама придумать внутри себя правильное сглаживание, и получить более разнообразный набор паттернов для распознавания.
Классический пример - разные диалекты английского в распознавалках речевого ввода. Обычно строят сразу одну сеть на все варианты произношения (включая также мужчин, женщин и шепелявых).

Rom · 15 Oct 2018

Undying said: ↑

У Лилы нет хэш-таблиц? Серьезно?
Click to expand...

Я читал об этом в чате, кажется от кого-то из разработчиков, так что клясться не буду .

Undying said: ↑

У алгоритмических движков хэш-таблицы не так эффективны, слишком много рассчитанных позиций и все они просто не влазят в память.
Click to expand...

У обычных движков хэш-таблицы черезвычайно эффективны. В своё время авторы программы Chess, после добавления хэш-таблиц, получили 5-кратную прибавку в скорости набора глубины в эндшпильных позициях (возможно это одна из причин, почему они обошли программу Каисса, у которой хэш-таблиц не было до конца 80-х).

У современных a/b движков хэш-таблицы помогают как минимум в трёх случаях. Во-первых, как очевидно, при повторении позиции. Во-вторых при сортировке - ходы из хэш-таблицы рассматриваются в первую очередь. В третьих, при распараллеливании - именно через хэш-таблицу треды обмениваются информацией.

a/b движкам не нужно хранить все позиции в памяти, поскольку они всё рано не хранят в памяти всё дерево перебора, а только цепочку лучших ходов. А вот при использовании MCTS, напротив, нужно хранить в оперативке всё дерево перебора. Именно поэтому Лиле требуется 40 гигабайт оперативки для часового анализа.

—- добавлено: 15 Oct 2018 —-

WinPooh said: ↑

Нейросетевые люди обычно считают, что универсальная сеть размера A+B будет лучше, чем две сети для частных случаев размеров A и B. Она должна сама придумать внутри себя правильное сглаживание, и получить более разнообразный набор паттернов для распознавания.
Click to expand...

Ох, не знаю... Не купим ли мы подобную универсальность за счет уменьшения общего максимума силы игры в каждой стадии партии по отдельности. Нужны эксперименты.

Undying · 15 Oct 2018

WinPooh said: ↑

Нейросетевые люди обычно считают, что универсальная сеть размера A+B будет лучше, чем две сети для частных случаев размеров A и B. Она должна сама придумать внутри себя правильное сглаживание, и получить более разнообразный набор паттернов для распознавания.
Классический пример - разные диалекты английского в распознавалках речевого ввода. Обычно строят сразу одну сеть на все варианты произношения (включая также мужчин, женщин и шепелявых).
Click to expand...

Сильно спорно. Универсальная сеть будет лучше, когда нет строго формальных критериев для разделения. В случае распознавания речи это так. Нет простого способа определить говорит ли это мужчина или женщина, нормальный это голос или шепелявый. А вот в шахматах совсем не так. Легко предложить строго формальные и очень простые критерии для отличия скажем миттельшпиля от эндшпиля.

Мобуту · 15 Oct 2018

Undying said: ↑

200 пунктов разницы откуда взялись? Для такой разницы Стокфиш должен 1 партию из 2 у Лилы выигрывать. А в реальности счет со Стокфишем у Лилы почти равный.
Click to expand...

А где можно увидеть полноценный матч Лилы со Стокфишем на TCEC или ещё в каком-нибудь независимом месте? Пока что вижу, что Лила на равных борется с неким движком Ethereal. А он слабее Стокфиша на 200 пунктов.

Rom · 15 Oct 2018

Мобуту said: ↑

Пока что вижу, что Лила на равных борется с неким движком Ethereal. А он слабее Стокфиша на 200 пунктов.
Click to expand...

Есть данные, что Лила играет сильнее против сильных соперников, а со слабыми не очень. Своеобразный contempt наоборот. С другой стороны есть данные, что Лила плохо играет на длинных контролях. Так что давайте просто подождем следующего сезона TCEC и посмотрим.

Undying · 15 Oct 2018

Rom said: ↑

С другой стороны есть данные, что Лила плохо играет на длинных контролях.
Click to expand...

У Лилы тайминг очень плохой. В дебюте и раннем миттельшпиле она играет очень быстро, тратя в разы меньше времени, чем соперник. Возможно проблема в этом.

—- добавлено: 15 Oct 2018 —-

Rom said: ↑

Так что давайте просто подождем следующего сезона TCEC и посмотрим.
Click to expand...

Лиле надо дожать Эзереаль и тогда следующего сезона ждать не нужно будет. Файр Лила должна обыграть более уверенно. А в полуфинале как раз матч со Стокфишем будет.

WinPooh · 15 Oct 2018

Undying said: ↑

Rom said: ↑

С другой стороны есть данные, что Лила плохо играет на длинных контролях.
Click to expand...

У Лилы тайминг очень плохой. В дебюте и раннем миттельшпиле она играет очень быстро, тратя в разы меньше времени, чем соперник. Возможно проблема в этом.

—- добавлено: 15 Oct 2018 —-

Rom said: ↑

Так что давайте просто подождем следующего сезона TCEC и посмотрим.
Click to expand...

Лиле надо дожать Эзереаль и тогда следующего сезона ждать не нужно будет. Файр Лила должна обыграть более уверенно. А в полуфинале как раз матч со Стокфишем будет.
Click to expand...

Да был же только что микро-матч со Стокфишем в рапид на CCC.
+0-2=6, если я правильно помню.

Undying · 15 Oct 2018

WinPooh said: ↑

Да был же только что микро-матч со Стокфишем в рапид на CCC.
+0-2=6, если я правильно помню.
Click to expand...

12 партий было (2 на предварительном этапе, 10 на втором). Лила дважды проиграла. Плюс один раз не выиграла из-за неумения пользоваться эндшпильными таблицами. Чему новая версия уже научилась.

Rom · 15 Oct 2018

Undying said: ↑

Rom said: ↑

С другой стороны есть данные, что Лила плохо играет на длинных контролях.
Click to expand...

У Лилы тайминг очень плохой. В дебюте и раннем миттельшпиле она играет очень быстро, тратя в разы меньше времени, чем соперник. Возможно проблема в этом.
Click to expand...

В тестах по ссылке используется фиксированное время на ход.

Undying · 15 Oct 2018

Лила Эзереаль дожала. Исторический матч со Стокфишем все ближе.

Log in or Sign up

Leela Chess Zero (lc0): турниры, партии, рейтинги...

vasa Опытный перворазрядник

Kirill_A Новичок

Kirill_A Новичок

sovaz1997 Учаcтник

WinPooh В.М.

sovaz1997 Учаcтник

Kirill_A Новичок

Undying Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

sovaz1997 Учаcтник

Undying Учаcтник

Мобуту спаситель нации

Rom Старожил

Undying Учаcтник

Rom Старожил

WinPooh В.М.

WinPooh В.М.

Undying Учаcтник

Kirill_A Новичок

Undying Учаcтник

Rom Старожил

Undying Учаcтник

Rom Старожил

Undying Учаcтник

WinPooh В.М.

Rom Старожил

Undying Учаcтник

Мобуту спаситель нации

Rom Старожил

Undying Учаcтник

WinPooh В.М.

Undying Учаcтник

Rom Старожил

Undying Учаcтник

Share This Page