Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 9 окт 2018.

  1. Kirill_A Новичок

    • Новичок
    Рег.:
    09.05.2018
    Сообщения:
    31
    Симпатии:
    21
    Репутация:
    0
    Оффлайн
    Обучение сетей 40x начинается очень скоро (думаю, самое позднее в январе) - ожидается, что она со временем сможет значительно превзойти по силю эту старенькую (но все же сильную) версию сети 10x, которая участвует в турнирах. 30x тоже может превзойти в скором времени, но вряд ли на много (40x будет оснащена технологическими усилениями нейросети + оправдавшие себя параметры тренировки).
    sovaz1997 нравится это.
  2. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Ничейность разноцвета понимать так и не научилась. В партии с Нирваной рисует себе плюс 5...
  3. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    119
    Симпатии:
    83
    Репутация:
    1
    Оффлайн
    Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
    Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
    Наука и искусственный интеллект-с!
    WinPooh нравится это.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Это отметил и "китайский друг" - например, изменение т.н. "температуры" при обучении происходит в шахматах после 30-го хода. А почему не после 40-го или 50-го? Тот самый domain knowledge, выгнанный из оценки и поиска, проявляется в другом месте.
  5. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    144
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    да, правильно, сети новой нет (пока), но движок сейчас играет новый, даже не зарелизиный ещё
    сеть 2х пошла как некоторые говорят "коту под хвост" (хотя отрицательный результат - тоже результат)
    сеть 3х имеет неопределенные перспективы, пока идет только рост силы самоигры, а вот по сравнению со Скокфишем или сетью 11248 особого роста не наблюдается, по причине роста самоЭло параметр LR пока не снижют (хотя число учебных игр уже перевалило за 40 млн.)
  6. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?
  7. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    119
    Симпатии:
    83
    Репутация:
    1
    Оффлайн
    Типа круто, самообучение с нуля. Программа в теории не будет копировать чужие ошибки, а только плодить свои.
  8. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    В Го попробовали - оказалось, что играет гораздо сильнее, чем если использовать накопленный опыт. Видимо, опыт накопился какой-то неправильный.
    Потом решили повторить в шахматах и в сёги.
    Ечетырник нравится это.
  9. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    3.002
    Симпатии:
    865
    Репутация:
    33
    Оффлайн
    В универсальности. Что бы там ни фантазировали конспирологи, основная цель Гугла вовсе не обыграть Стокфиш. И не пиар. Ну, то есть, пиар, конечно, лишним не бывает, но пиар без реальных результатов корпорации типа Гугла точно не нужен.
    Основная цель - создать универсальный способ решения подобных задач. Чтобы его можно было применить в шахматах, сёги, го, Старкрафте, реальной войне с помощью дронов... Соответственно, добавления любых чисто шахматных знаний кроме правил игры эту цель только отдаляет.
    Ну, и по опыту с го выяснилось, что обучение на человеческих партиях может загнать сеть в локальный максимум.
    4547 и sovaz1997 нравится это.
  10. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Восхваление самообучения это случайный момент. Следствие того, что люди в сравнении с нейронными движками играют в го настолько слабо, что опыт человеческих партий оказался бесполезен. Понятно, что человеку с талантом гроссмейстера бессмысленно и даже вредно обучаться на партиях безразрядников. Гораздо полезнее играть с другим человеком с талантом гроссмейстера. Но использовать при этом опыт состоявшихся гроссмейстеров еще полезнее. С обучением нейронных сетей все тоже самое. Самообучение позволяет достигнуть довольно высокого уровня, но чтобы двигаться дальше нужно дополнять его накопленным другими опытом.
    —- добавлено: 10 дек 2018 —-
    Это маниловщина. Нет в нейронной сети ничего универсального. Нейронная сеть способна выявлять пространственные закономерности и не более того. А чтобы свести задачу к пространственной требуется добавление знаний об игре. Хотя пока речь идет о пространственных по своей природе играх как го и шахматы это не так заметно.
  11. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    А самое смешное, что даже в самой первой версии АльфаГо, которая играла с Фаном, для обучения использовались только несколько сотен тысяч партий людей, и десятки миллионов наигранных уже против самой себя. То есть доля человеческих партий в обучении была порядка единиц процентов, или меньше.
  12. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Проблема в том, что достаточно скоро после начала обучения программы подходящие (то есть более сильные) гроссмейстеры кончаются.
  13. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    В человеческом обучении аналогично. Вера в неправильные авторитеты выбранные изначально может не дать раскрыть талант в дальнейшем. Сколько времени потом не трать.

    Поэтому дополнение самообучения накопленным опытом может иметь как положительный, так и негативный эффект. И искусство разработчика состоит в том, чтобы накопленный опыт влиял положительно.

    Только когда впервые выходим на принципиально новый уровень. В дальнейшем у нас как минимум есть предыдущая версия нейронного движка. В шахматах есть алгоритмические движки сопоставимой силы. И т.д.
  14. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    3.002
    Симпатии:
    865
    Репутация:
    33
    Оффлайн
    Странно называть маниловщиной цель, которая по сути достигнута (в шахматах, сёги и го).

    Это где написано?

    В смысле, правил? Ну, да, без правил играть не выйдет.
  15. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Что значит достигнута? Универсальный Альфа-Зеро это идеал, который невозможно превзойти по силе игры?
  16. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    3.002
    Симпатии:
    865
    Репутация:
    33
    Оффлайн
    Почему невозможно? Можно. Тем не менее, он решает все три задачи очень хорошо. При минимуме начальных знаний.
  17. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    А зачем нужен универсальный способ решения задач, если специализированные способы будут давать лучшие результаты?
  18. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    3.002
    Симпатии:
    865
    Репутация:
    33
    Оффлайн
    Затем, что специализированные методы надо каждый раз выдумывать. Это долго и дорого.
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Это естественно. Сетка же та же самая. Интересно было бы эту позицию в третью сетку загнать. А также в DeusX. Кажется странным, что Лила не понимает такие простые блокады в эндшпилях. Может что-то с обучением было не то и в других сетках такой проблемы нет.

    upd
    У DeusX такие же проблемы с разноцветом. Тоже блокаду не понимает.
  20. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.920
    Симпатии:
    363
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Надо чтобы в нейросети белопольный слон и чёрнопольный считались разными фигурами. А так концепцию польности слона нейросети сложно вывести (имхо).
    Undying нравится это.
  21. SKY Новичок

    • Новичок
    Рег.:
    05.11.2018
    Сообщения:
    46
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    А каким примерно должна быть минимальная разница в ЭЛО чтобы чистый движок выигрывал все 100% партий у другого движка любыми фигурами из любых адекватных дебютов?
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Плюс бесконечность, очевидно. См. формулу, определяющую рейтинг Эло:

    [​IMG]

    И да, Эло - это фамилия автора методики, а не аббревиатура. Всё буквы прописными в ней делать не надо.
    SKY нравится это.
  23. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    140
    Симпатии:
    47
    Репутация:
    2
    Оффлайн
    Лила опять проиграла в совершенно закрытой позиции, в которой получить любой исход кроме ничьей крайне сложно. Это ее первое поражение в этом турнире (cccc rapid redux)
    Она дважды обнуляла счетчик 50-ти ходов по своей инициативе, но на 3-й раз что-то не фартануло.



    Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон. Просто элементарная вещь, не понимаю как она этого не увидела.
  24. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    А в TCEC какое-то совершенно необязательное поражение от Booot. Что, впрочем, не мешает лидировать с отрывом в три очка за круг с лишним до финиша.
  25. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    550
    Симпатии:
    79
    Репутация:
    3
    Оффлайн
    pavelgttfj8, у Лилы могут быть такие казусы. Она действительно может (очень редко, конечно) не видеть даже то, что видит человек.
  26. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.920
    Симпатии:
    363
    Репутация:
    21
    Адрес:
    Киев
    Оффлайн
    Скорее всего играла уже на добавленных секундах, времени мало и просто зевок.
  27. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Лилу что-то приглючило. Bh8 она похоже просто не видела и после 162 ... Bg8 считала свою позицию абсолютно проигранной (-7).

    А в TCEC похожую партию Booot'у проиграла. Тоже в закрытой позицию долго катала. А через 60 ходов неожиданно выяснилось, что прорыв соперника b5 выигрывает.

    По уму надо в движке подправить, чтобы в подобных ситуациях Лила сама себя в цейтнот не загоняла. Проигрывает она из-за этого намного чаще, чем выигрывает.
  28. Michael-13 Господин

    • Участник
    Рег.:
    18.11.2011
    Сообщения:
    2.742
    Симпатии:
    869
    Репутация:
    24
    Оффлайн
  29. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Похоже у Лилы формируется самосознание. :) В TCEC, решив задачу выхода в следующий дивизион, Лила по гроссмейстерски не стала напрягаться и все партии в последнем круге свела в ничью. В первых трех кругах было минимум 4 победы за круг.
    Искусственный интеллект наступает! :dance:
    Edwards нравится это.
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    А Комодо решило поддержать интригу, и сделало вид, что может уступить второе место какому-то Ксифосу. Даже последнюю партию в турнире сделало "решающей" - впрочем, без труда её выиграло.
  31. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    И так можно считать доказанным, что MCTS разумнее чем Альфа-Бета! :)
  32. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Что-то в первом дивизионе Лила стартовала не очень лихо...
  33. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    550
    Симпатии:
    79
    Репутация:
    3
    Оффлайн
    Станет опять первой по закону больших чисел :)
    Правда, числа в TCEC не очень большие, может и не стать))
  34. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    858
    Симпатии:
    383
    Репутация:
    9
    Оффлайн
    Дебюты в белых партиях открытые попались - шотландка и французская с Kd2. В открытых позициях тяжело алгоритмический движок перекатать.
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.872
    Симпатии:
    2.061
    Репутация:
    84
    Адрес:
    Москва
    Оффлайн
    Придётся научиться, если на топ-1 в мире претендует.

Поделиться этой страницей