Leela Chess Zero (lc0): турниры, партии, рейтинги...

Kirill_A · 10 дек 2018

WinPooh пишет: ↑

Я правильно понимаю, что сейчас в TCEC играет все та же давнишняя-предавнишняя версия сети конца июля-начала августа, и за три месяца ничего сильнее так и не появилось?
Нажмите, чтобы раскрыть...

Обучение сетей 40x начинается очень скоро (думаю, самое позднее в январе) - ожидается, что она со временем сможет значительно превзойти по силю эту старенькую (но все же сильную) версию сети 10x, которая участвует в турнирах. 30x тоже может превзойти в скором времени, но вряд ли на много (40x будет оснащена технологическими усилениями нейросети + оправдавшие себя параметры тренировки).

WinPooh · 10 дек 2018

Ничейность разноцвета понимать так и не научилась. В партии с Нирваной рисует себе плюс 5...

FlashNeo · 10 дек 2018

Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
Наука и искусственный интеллект-с!

WinPooh · 10 дек 2018

FlashNeo пишет: ↑

Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
Наука и искусственный интеллект-с!
Нажмите, чтобы раскрыть...

Это отметил и "китайский друг" - например, изменение т.н. "температуры" при обучении происходит в шахматах после 30-го хода. А почему не после 40-го или 50-го? Тот самый domain knowledge, выгнанный из оценки и поиска, проявляется в другом месте.

svoitsl · 10 дек 2018

WinPooh пишет: ↑

Я правильно
Нажмите, чтобы раскрыть...

да, правильно, сети новой нет (пока), но движок сейчас играет новый, даже не зарелизиный ещё
сеть 2х пошла как некоторые говорят "коту под хвост" (хотя отрицательный результат - тоже результат)
сеть 3х имеет неопределенные перспективы, пока идет только рост силы самоигры, а вот по сравнению со Скокфишем или сетью 11248 особого роста не наблюдается, по причине роста самоЭло параметр LR пока не снижют (хотя число учебных игр уже перевалило за 40 млн.)

Undying · 10 дек 2018

FlashNeo пишет: ↑

Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
Наука и искусственный интеллект-с!
Нажмите, чтобы раскрыть...

А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?

FlashNeo · 10 дек 2018

Undying пишет: ↑

А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?
Нажмите, чтобы раскрыть...

Типа круто, самообучение с нуля. Программа в теории не будет копировать чужие ошибки, а только плодить свои.

WinPooh · 10 дек 2018

Undying пишет: ↑

А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?
Нажмите, чтобы раскрыть...

В Го попробовали - оказалось, что играет гораздо сильнее, чем если использовать накопленный опыт. Видимо, опыт накопился какой-то неправильный.
Потом решили повторить в шахматах и в сёги.

Jadn · 10 дек 2018

Undying пишет: ↑

А в чем сакральный смысл обучения с нуля?
Нажмите, чтобы раскрыть...

В универсальности. Что бы там ни фантазировали конспирологи, основная цель Гугла вовсе не обыграть Стокфиш. И не пиар. Ну, то есть, пиар, конечно, лишним не бывает, но пиар без реальных результатов корпорации типа Гугла точно не нужен.
Основная цель - создать универсальный способ решения подобных задач. Чтобы его можно было применить в шахматах, сёги, го, Старкрафте, реальной войне с помощью дронов... Соответственно, добавления любых чисто шахматных знаний кроме правил игры эту цель только отдаляет.
Ну, и по опыту с го выяснилось, что обучение на человеческих партиях может загнать сеть в локальный максимум.

Undying · 11 дек 2018

WinPooh пишет: ↑

В Го попробовали - оказалось, что играет гораздо сильнее, чем если использовать накопленный опыт. Видимо, опыт накопился какой-то неправильный.
Потом решили повторить в шахматах и в сёги.
Нажмите, чтобы раскрыть...

Восхваление самообучения это случайный момент. Следствие того, что люди в сравнении с нейронными движками играют в го настолько слабо, что опыт человеческих партий оказался бесполезен. Понятно, что человеку с талантом гроссмейстера бессмысленно и даже вредно обучаться на партиях безразрядников. Гораздо полезнее играть с другим человеком с талантом гроссмейстера. Но использовать при этом опыт состоявшихся гроссмейстеров еще полезнее. С обучением нейронных сетей все тоже самое. Самообучение позволяет достигнуть довольно высокого уровня, но чтобы двигаться дальше нужно дополнять его накопленным другими опытом.

—- добавлено: 11 дек 2018 —-

Jadn пишет: ↑

Основная цель - создать универсальный способ решения подобных задач. Чтобы его можно было применить в шахматах, сёги, го, Старкрафте, реальной войне с помощью дронов... Соответственно, добавления любых чисто шахматных знаний кроме правил игры эту цель только отдаляет.
Нажмите, чтобы раскрыть...

Это маниловщина. Нет в нейронной сети ничего универсального. Нейронная сеть способна выявлять пространственные закономерности и не более того. А чтобы свести задачу к пространственной требуется добавление знаний об игре. Хотя пока речь идет о пространственных по своей природе играх как го и шахматы это не так заметно.

WinPooh · 11 дек 2018

Undying пишет: ↑

Следствие того, что люди в сравнении с нейронными движками играют в го настолько слабо, что опыт человеческих партий оказался бесполезен.
Нажмите, чтобы раскрыть...

А самое смешное, что даже в самой первой версии АльфаГо, которая играла с Фаном, для обучения использовались только несколько сотен тысяч партий людей, и десятки миллионов наигранных уже против самой себя. То есть доля человеческих партий в обучении была порядка единиц процентов, или меньше.

WinPooh · 11 дек 2018

Undying пишет: ↑

Гораздо полезнее играть с другим человеком с талантом гроссмейстера. Но использовать при этом опыт состоявшихся гроссмейстеров еще полезнее.
Нажмите, чтобы раскрыть...

Проблема в том, что достаточно скоро после начала обучения программы подходящие (то есть более сильные) гроссмейстеры кончаются.

Undying · 11 дек 2018

WinPooh пишет: ↑

А самое смешное, что даже в самой первой версии АльфаГо, которая играла с Фаном, для обучения использовались только несколько сотен тысяч партий людей, и десятки миллионов наигранных уже против самой себя. То есть доля человеческих партий в обучении была порядка единиц процентов, или меньше.
Нажмите, чтобы раскрыть...

В человеческом обучении аналогично. Вера в неправильные авторитеты выбранные изначально может не дать раскрыть талант в дальнейшем. Сколько времени потом не трать.

Поэтому дополнение самообучения накопленным опытом может иметь как положительный, так и негативный эффект. И искусство разработчика состоит в том, чтобы накопленный опыт влиял положительно.

WinPooh пишет: ↑

Проблема в том, что достаточно скоро после начала обучения программы подходящие (то есть более сильные) гроссмейстеры кончаются.
Нажмите, чтобы раскрыть...

Только когда впервые выходим на принципиально новый уровень. В дальнейшем у нас как минимум есть предыдущая версия нейронного движка. В шахматах есть алгоритмические движки сопоставимой силы. И т.д.

Jadn · 11 дек 2018

Undying пишет: ↑

Это маниловщина.
Нажмите, чтобы раскрыть...

Странно называть маниловщиной цель, которая по сути достигнута (в шахматах, сёги и го).

Undying пишет: ↑

Нет в нейронной сети ничего универсального. Нейронная сеть способна выявлять пространственные закономерности и не более того.
Нажмите, чтобы раскрыть...

Это где написано?

Undying пишет: ↑

А чтобы свести задачу к пространственной требуется добавление знаний об игре.
Нажмите, чтобы раскрыть...

В смысле, правил? Ну, да, без правил играть не выйдет.

Undying · 11 дек 2018

Jadn пишет: ↑

Странно называть маниловщиной цель, которая по сути достигнута (в шахматах, сёги и го).
Нажмите, чтобы раскрыть...

Что значит достигнута? Универсальный Альфа-Зеро это идеал, который невозможно превзойти по силе игры?

Jadn · 11 дек 2018

Undying пишет: ↑

Что значит достигнута? Универсальный Альфа-Зеро это идеал, который невозможно превзойти по силе игры?
Нажмите, чтобы раскрыть...

Почему невозможно? Можно. Тем не менее, он решает все три задачи очень хорошо. При минимуме начальных знаний.

Undying · 11 дек 2018

Jadn пишет: ↑

Почему невозможно? Можно. Тем не менее, он решает все три задачи очень хорошо. При минимуме начальных знаний.
Нажмите, чтобы раскрыть...

А зачем нужен универсальный способ решения задач, если специализированные способы будут давать лучшие результаты?

Jadn · 11 дек 2018

Undying пишет: ↑

А зачем нужен универсальный способ решения задач, если специализированные способы будут давать лучшие результаты?
Нажмите, чтобы раскрыть...

Затем, что специализированные методы надо каждый раз выдумывать. Это долго и дорого.

Undying · 11 дек 2018

WinPooh пишет: ↑

Ничейность разноцвета понимать так и не научилась. В партии с Нирваной рисует себе плюс 5...
Нажмите, чтобы раскрыть...

Это естественно. Сетка же та же самая. Интересно было бы эту позицию в третью сетку загнать. А также в DeusX. Кажется странным, что Лила не понимает такие простые блокады в эндшпилях. Может что-то с обучением было не то и в других сетках такой проблемы нет.

upd
У DeusX такие же проблемы с разноцветом. Тоже блокаду не понимает.

Mustitz · 11 дек 2018

Undying пишет: ↑

У DeusX такие же проблемы с разноцветом.
Нажмите, чтобы раскрыть...

Надо чтобы в нейросети белопольный слон и чёрнопольный считались разными фигурами. А так концепцию польности слона нейросети сложно вывести (имхо).

SKY · 12 дек 2018

А каким примерно должна быть минимальная разница в ЭЛО чтобы чистый движок выигрывал все 100% партий у другого движка любыми фигурами из любых адекватных дебютов?

WinPooh · 12 дек 2018

SKY пишет: ↑

А каким примерно должна быть минимальная разница в ЭЛО чтобы чистый движок выигрывал все 100% партий у другого движка любыми фигурами из любых адекватных дебютов?
Нажмите, чтобы раскрыть...

Плюс бесконечность, очевидно. См. формулу, определяющую рейтинг Эло:

И да, Эло - это фамилия автора методики, а не аббревиатура. Всё буквы прописными в ней делать не надо.

pavelgttfj8 · 12 дек 2018

Лила опять проиграла в совершенно закрытой позиции, в которой получить любой исход кроме ничьей крайне сложно. Это ее первое поражение в этом турнире (cccc rapid redux)
Она дважды обнуляла счетчик 50-ти ходов по своей инициативе, но на 3-й раз что-то не фартануло.

Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон. Просто элементарная вещь, не понимаю как она этого не увидела.

WinPooh · 12 дек 2018

А в TCEC какое-то совершенно необязательное поражение от Booot. Что, впрочем, не мешает лидировать с отрывом в три очка за круг с лишним до финиша.

sovaz1997 · 12 дек 2018

pavelgttfj8, у Лилы могут быть такие казусы. Она действительно может (очень редко, конечно) не видеть даже то, что видит человек.

Mustitz · 12 дек 2018

pavelgttfj8 пишет: ↑

Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон.
Нажмите, чтобы раскрыть...

Скорее всего играла уже на добавленных секундах, времени мало и просто зевок.

Undying · 13 дек 2018

pavelgttfj8 пишет: ↑

Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон. Просто элементарная вещь, не понимаю как она этого не увидела.
Нажмите, чтобы раскрыть...

Лилу что-то приглючило. Bh8 она похоже просто не видела и после 162 ... Bg8 считала свою позицию абсолютно проигранной (-7).

А в TCEC похожую партию Booot'у проиграла. Тоже в закрытой позицию долго катала. А через 60 ходов неожиданно выяснилось, что прорыв соперника b5 выигрывает.

По уму надо в движке подправить, чтобы в подобных ситуациях Лила сама себя в цейтнот не загоняла. Проигрывает она из-за этого намного чаще, чем выигрывает.

Michael-13 · 13 дек 2018

Deathmatch: Leela vs. Stockfish
https://lichess.org/blog/XA7juREAAC4AxZsR/deathmatch-leela-vs.-stockfish

Undying · 14 дек 2018

Похоже у Лилы формируется самосознание. В TCEC, решив задачу выхода в следующий дивизион, Лила по гроссмейстерски не стала напрягаться и все партии в последнем круге свела в ничью. В первых трех кругах было минимум 4 победы за круг.
Искусственный интеллект наступает!

WinPooh · 14 дек 2018

Undying пишет: ↑

Похоже у Лилы формируется самосознание. В TCEC, решив задачу выхода в следующий дивизион, Лила по гроссмейстерски не стала напрягаться и все партии в последнем круге свела в ничью. В первых трех кругах было минимум 4 победы за круг.

Искусственный интеллект наступает!
Нажмите, чтобы раскрыть...

А Комодо решило поддержать интригу, и сделало вид, что может уступить второе место какому-то Ксифосу. Даже последнюю партию в турнире сделало "решающей" - впрочем, без труда её выиграло.

Undying · 14 дек 2018

WinPooh пишет: ↑

А Комодо решило поддержать интригу, и сделало вид, что может уступить второе место какому-то Ксифосу. Даже последнюю партию в турнире сделало "решающей" - впрочем, без труда её выиграло.
Нажмите, чтобы раскрыть...

И так можно считать доказанным, что MCTS разумнее чем Альфа-Бета!

WinPooh · 15 дек 2018

Что-то в первом дивизионе Лила стартовала не очень лихо...

sovaz1997 · 15 дек 2018

WinPooh пишет: ↑

Что-то в первом дивизионе Лила стартовала не очень лихо...
Нажмите, чтобы раскрыть...

Станет опять первой по закону больших чисел
Правда, числа в TCEC не очень большие, может и не стать))

Undying · 15 дек 2018

WinPooh пишет: ↑

Что-то в первом дивизионе Лила стартовала не очень лихо...
Нажмите, чтобы раскрыть...

Дебюты в белых партиях открытые попались - шотландка и французская с Kd2. В открытых позициях тяжело алгоритмический движок перекатать.

WinPooh · 16 дек 2018

Undying пишет: ↑

WinPooh пишет: ↑

Что-то в первом дивизионе Лила стартовала не очень лихо...
Нажмите, чтобы раскрыть...

Дебюты в белых партиях открытые попались - шотландка и французская с Kd2. В открытых позициях тяжело алгоритмический движок перекатать.
Нажмите, чтобы раскрыть...

Придётся научиться, если на топ-1 в мире претендует.

Войти или зарегистрироваться

Leela Chess Zero (lc0): турниры, партии, рейтинги...

Kirill_A Новичок

WinPooh В.М. Команда форума

FlashNeo Учаcтник

WinPooh В.М. Команда форума

svoitsl Учаcтник

Undying Учаcтник

FlashNeo Учаcтник

WinPooh В.М. Команда форума

Jadn баннер

Undying Учаcтник

WinPooh В.М. Команда форума

WinPooh В.М. Команда форума

Undying Учаcтник

Jadn баннер

Undying Учаcтник

Jadn баннер

Undying Учаcтник

Jadn баннер

Undying Учаcтник

Mustitz баннер

SKY Учаcтник

WinPooh В.М. Команда форума

pavelgttfj8 Учаcтник

WinPooh В.М. Команда форума

sovaz1997 Учаcтник

Mustitz баннер

Undying Учаcтник

Michael-13 Господин

Undying Учаcтник

WinPooh В.М. Команда форума

Undying Учаcтник

WinPooh В.М. Команда форума

sovaz1997 Учаcтник

Undying Учаcтник

WinPooh В.М. Команда форума