Leela Chess Zero (lc0): турниры, партии, рейтинги...

Тема в разделе "Машинное отделение", создана пользователем vasa, 10 окт 2018.

  1. Kirill_A
    Оффлайн

    Kirill_A Новичок

    Репутация:
    0
    Обучение сетей 40x начинается очень скоро (думаю, самое позднее в январе) - ожидается, что она со временем сможет значительно превзойти по силю эту старенькую (но все же сильную) версию сети 10x, которая участвует в турнирах. 30x тоже может превзойти в скором времени, но вряд ли на много (40x будет оснащена технологическими усилениями нейросети + оправдавшие себя параметры тренировки).
     
    sovaz1997 нравится это.
  2. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Ничейность разноцвета понимать так и не научилась. В партии с Нирваной рисует себе плюс 5...
     
  3. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
    Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
    Наука и искусственный интеллект-с!
     
    WinPooh нравится это.
  4. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Это отметил и "китайский друг" - например, изменение т.н. "температуры" при обучении происходит в шахматах после 30-го хода. А почему не после 40-го или 50-го? Тот самый domain knowledge, выгнанный из оценки и поиска, проявляется в другом месте.
     
  5. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    да, правильно, сети новой нет (пока), но движок сейчас играет новый, даже не зарелизиный ещё
    сеть 2х пошла как некоторые говорят "коту под хвост" (хотя отрицательный результат - тоже результат)
    сеть 3х имеет неопределенные перспективы, пока идет только рост силы самоигры, а вот по сравнению со Скокфишем или сетью 11248 особого роста не наблюдается, по причине роста самоЭло параметр LR пока не снижют (хотя число учебных игр уже перевалило за 40 млн.)
     
  6. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?
     
  7. FlashNeo
    Оффлайн

    FlashNeo Учаcтник

    Репутация:
    2
    Типа круто, самообучение с нуля. Программа в теории не будет копировать чужие ошибки, а только плодить свои.
     
  8. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    В Го попробовали - оказалось, что играет гораздо сильнее, чем если использовать накопленный опыт. Видимо, опыт накопился какой-то неправильный.
    Потом решили повторить в шахматах и в сёги.
     
    Ечетырник нравится это.
  9. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    В универсальности. Что бы там ни фантазировали конспирологи, основная цель Гугла вовсе не обыграть Стокфиш. И не пиар. Ну, то есть, пиар, конечно, лишним не бывает, но пиар без реальных результатов корпорации типа Гугла точно не нужен.
    Основная цель - создать универсальный способ решения подобных задач. Чтобы его можно было применить в шахматах, сёги, го, Старкрафте, реальной войне с помощью дронов... Соответственно, добавления любых чисто шахматных знаний кроме правил игры эту цель только отдаляет.
    Ну, и по опыту с го выяснилось, что обучение на человеческих партиях может загнать сеть в локальный максимум.
     
    4547 и sovaz1997 нравится это.
  10. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Восхваление самообучения это случайный момент. Следствие того, что люди в сравнении с нейронными движками играют в го настолько слабо, что опыт человеческих партий оказался бесполезен. Понятно, что человеку с талантом гроссмейстера бессмысленно и даже вредно обучаться на партиях безразрядников. Гораздо полезнее играть с другим человеком с талантом гроссмейстера. Но использовать при этом опыт состоявшихся гроссмейстеров еще полезнее. С обучением нейронных сетей все тоже самое. Самообучение позволяет достигнуть довольно высокого уровня, но чтобы двигаться дальше нужно дополнять его накопленным другими опытом.
    —- добавлено: 11 дек 2018 —-
    Это маниловщина. Нет в нейронной сети ничего универсального. Нейронная сеть способна выявлять пространственные закономерности и не более того. А чтобы свести задачу к пространственной требуется добавление знаний об игре. Хотя пока речь идет о пространственных по своей природе играх как го и шахматы это не так заметно.
     
    Последнее редактирование: 11 дек 2018
  11. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А самое смешное, что даже в самой первой версии АльфаГо, которая играла с Фаном, для обучения использовались только несколько сотен тысяч партий людей, и десятки миллионов наигранных уже против самой себя. То есть доля человеческих партий в обучении была порядка единиц процентов, или меньше.
     
  12. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Проблема в том, что достаточно скоро после начала обучения программы подходящие (то есть более сильные) гроссмейстеры кончаются.
     
  13. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    В человеческом обучении аналогично. Вера в неправильные авторитеты выбранные изначально может не дать раскрыть талант в дальнейшем. Сколько времени потом не трать.

    Поэтому дополнение самообучения накопленным опытом может иметь как положительный, так и негативный эффект. И искусство разработчика состоит в том, чтобы накопленный опыт влиял положительно.

    Только когда впервые выходим на принципиально новый уровень. В дальнейшем у нас как минимум есть предыдущая версия нейронного движка. В шахматах есть алгоритмические движки сопоставимой силы. И т.д.
     
  14. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Странно называть маниловщиной цель, которая по сути достигнута (в шахматах, сёги и го).

    Это где написано?

    В смысле, правил? Ну, да, без правил играть не выйдет.
     
  15. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Что значит достигнута? Универсальный Альфа-Зеро это идеал, который невозможно превзойти по силе игры?
     
  16. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Почему невозможно? Можно. Тем не менее, он решает все три задачи очень хорошо. При минимуме начальных знаний.
     
  17. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А зачем нужен универсальный способ решения задач, если специализированные способы будут давать лучшие результаты?
     
  18. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Затем, что специализированные методы надо каждый раз выдумывать. Это долго и дорого.
     
  19. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Это естественно. Сетка же та же самая. Интересно было бы эту позицию в третью сетку загнать. А также в DeusX. Кажется странным, что Лила не понимает такие простые блокады в эндшпилях. Может что-то с обучением было не то и в других сетках такой проблемы нет.

    upd
    У DeusX такие же проблемы с разноцветом. Тоже блокаду не понимает.
     
    Последнее редактирование: 11 дек 2018
  20. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Надо чтобы в нейросети белопольный слон и чёрнопольный считались разными фигурами. А так концепцию польности слона нейросети сложно вывести (имхо).
     
    Undying нравится это.
  21. SKY
    Оффлайн

    SKY Учаcтник

    Репутация:
    1
    А каким примерно должна быть минимальная разница в ЭЛО чтобы чистый движок выигрывал все 100% партий у другого движка любыми фигурами из любых адекватных дебютов?
     
  22. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Плюс бесконечность, очевидно. См. формулу, определяющую рейтинг Эло:

    [​IMG]

    И да, Эло - это фамилия автора методики, а не аббревиатура. Всё буквы прописными в ней делать не надо.
     
    Последнее редактирование: 12 дек 2018
    SKY нравится это.
  23. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Лила опять проиграла в совершенно закрытой позиции, в которой получить любой исход кроме ничьей крайне сложно. Это ее первое поражение в этом турнире (cccc rapid redux)
    Она дважды обнуляла счетчик 50-ти ходов по своей инициативе, но на 3-й раз что-то не фартануло.



    Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон. Просто элементарная вещь, не понимаю как она этого не увидела.
     
    Последнее редактирование: 12 дек 2018
  24. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А в TCEC какое-то совершенно необязательное поражение от Booot. Что, впрочем, не мешает лидировать с отрывом в три очка за круг с лишним до финиша.
     
  25. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    pavelgttfj8, у Лилы могут быть такие казусы. Она действительно может (очень редко, конечно) не видеть даже то, что видит человек.
     
  26. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Скорее всего играла уже на добавленных секундах, времени мало и просто зевок.
     
  27. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Лилу что-то приглючило. Bh8 она похоже просто не видела и после 162 ... Bg8 считала свою позицию абсолютно проигранной (-7).

    А в TCEC похожую партию Booot'у проиграла. Тоже в закрытой позицию долго катала. А через 60 ходов неожиданно выяснилось, что прорыв соперника b5 выигрывает.

    По уму надо в движке подправить, чтобы в подобных ситуациях Лила сама себя в цейтнот не загоняла. Проигрывает она из-за этого намного чаще, чем выигрывает.
     
  28. Michael-13
    Оффлайн

    Michael-13 Господин

    Репутация:
    29
  29. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Похоже у Лилы формируется самосознание. :) В TCEC, решив задачу выхода в следующий дивизион, Лила по гроссмейстерски не стала напрягаться и все партии в последнем круге свела в ничью. В первых трех кругах было минимум 4 победы за круг.
    Искусственный интеллект наступает! :dance:
     
    Последнее редактирование: 14 дек 2018
    Edwards нравится это.
  30. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    А Комодо решило поддержать интригу, и сделало вид, что может уступить второе место какому-то Ксифосу. Даже последнюю партию в турнире сделало "решающей" - впрочем, без труда её выиграло.
     
  31. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    И так можно считать доказанным, что MCTS разумнее чем Альфа-Бета! :)
     
  32. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Что-то в первом дивизионе Лила стартовала не очень лихо...
     
  33. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Станет опять первой по закону больших чисел :)
    Правда, числа в TCEC не очень большие, может и не стать))
     
  34. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Дебюты в белых партиях открытые попались - шотландка и французская с Kd2. В открытых позициях тяжело алгоритмический движок перекатать.
     
  35. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Придётся научиться, если на топ-1 в мире претендует.