Leela Chess Zero (lc0): турниры, партии, рейтинги...

Discussion in 'Машинное отделение' started by vasa, 10 Oct 2018.

  1. Kirill_A Новичок

    • Новичок
    Member Since:
    10.05.2018
    Message Count:
    37
    Likes Received:
    22
    Репутация:
    0
    Оффлайн
    Обучение сетей 40x начинается очень скоро (думаю, самое позднее в январе) - ожидается, что она со временем сможет значительно превзойти по силю эту старенькую (но все же сильную) версию сети 10x, которая участвует в турнирах. 30x тоже может превзойти в скором времени, но вряд ли на много (40x будет оснащена технологическими усилениями нейросети + оправдавшие себя параметры тренировки).
    sovaz1997 likes this.
  2. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Ничейность разноцвета понимать так и не научилась. В партии с Нирваной рисует себе плюс 5...
  3. FlashNeo Учаcтник

    • Участник
    Member Since:
    23.11.2018
    Message Count:
    587
    Likes Received:
    309
    Репутация:
    2
    Оффлайн
    Стоит обратить внимание, что Leela Chess Zero, Alpha Zero - формально обучение с нуля.
    Но при этом на это обучение влияет несколько десятков параметров, которые подбираются по желанию левой пятки потому, что человек считает именно эти параметры оптимальными.
    Наука и искусственный интеллект-с!
    WinPooh likes this.
  4. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Это отметил и "китайский друг" - например, изменение т.н. "температуры" при обучении происходит в шахматах после 30-го хода. А почему не после 40-го или 50-го? Тот самый domain knowledge, выгнанный из оценки и поиска, проявляется в другом месте.
  5. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    да, правильно, сети новой нет (пока), но движок сейчас играет новый, даже не зарелизиный ещё
    сеть 2х пошла как некоторые говорят "коту под хвост" (хотя отрицательный результат - тоже результат)
    сеть 3х имеет неопределенные перспективы, пока идет только рост силы самоигры, а вот по сравнению со Скокфишем или сетью 11248 особого роста не наблюдается, по причине роста самоЭло параметр LR пока не снижют (хотя число учебных игр уже перевалило за 40 млн.)
  6. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А в чем сакральный смысл обучения с нуля? Для обучения человека вон школы создают, университеты, учебники пишут. Почему при обучении компьютерных программ должно быть по другому? В чем смысл не использовать накопленный опыт и каждый раз учиться с нуля?
  7. FlashNeo Учаcтник

    • Участник
    Member Since:
    23.11.2018
    Message Count:
    587
    Likes Received:
    309
    Репутация:
    2
    Оффлайн
    Типа круто, самообучение с нуля. Программа в теории не будет копировать чужие ошибки, а только плодить свои.
  8. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    В Го попробовали - оказалось, что играет гораздо сильнее, чем если использовать накопленный опыт. Видимо, опыт накопился какой-то неправильный.
    Потом решили повторить в шахматах и в сёги.
    Ечетырник likes this.
  9. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    В универсальности. Что бы там ни фантазировали конспирологи, основная цель Гугла вовсе не обыграть Стокфиш. И не пиар. Ну, то есть, пиар, конечно, лишним не бывает, но пиар без реальных результатов корпорации типа Гугла точно не нужен.
    Основная цель - создать универсальный способ решения подобных задач. Чтобы его можно было применить в шахматах, сёги, го, Старкрафте, реальной войне с помощью дронов... Соответственно, добавления любых чисто шахматных знаний кроме правил игры эту цель только отдаляет.
    Ну, и по опыту с го выяснилось, что обучение на человеческих партиях может загнать сеть в локальный максимум.
    4547 and sovaz1997 like this.
  10. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Восхваление самообучения это случайный момент. Следствие того, что люди в сравнении с нейронными движками играют в го настолько слабо, что опыт человеческих партий оказался бесполезен. Понятно, что человеку с талантом гроссмейстера бессмысленно и даже вредно обучаться на партиях безразрядников. Гораздо полезнее играть с другим человеком с талантом гроссмейстера. Но использовать при этом опыт состоявшихся гроссмейстеров еще полезнее. С обучением нейронных сетей все тоже самое. Самообучение позволяет достигнуть довольно высокого уровня, но чтобы двигаться дальше нужно дополнять его накопленным другими опытом.
    —- добавлено: 11 Dec 2018 —-
    Это маниловщина. Нет в нейронной сети ничего универсального. Нейронная сеть способна выявлять пространственные закономерности и не более того. А чтобы свести задачу к пространственной требуется добавление знаний об игре. Хотя пока речь идет о пространственных по своей природе играх как го и шахматы это не так заметно.
  11. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    А самое смешное, что даже в самой первой версии АльфаГо, которая играла с Фаном, для обучения использовались только несколько сотен тысяч партий людей, и десятки миллионов наигранных уже против самой себя. То есть доля человеческих партий в обучении была порядка единиц процентов, или меньше.
  12. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Проблема в том, что достаточно скоро после начала обучения программы подходящие (то есть более сильные) гроссмейстеры кончаются.
  13. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    В человеческом обучении аналогично. Вера в неправильные авторитеты выбранные изначально может не дать раскрыть талант в дальнейшем. Сколько времени потом не трать.

    Поэтому дополнение самообучения накопленным опытом может иметь как положительный, так и негативный эффект. И искусство разработчика состоит в том, чтобы накопленный опыт влиял положительно.

    Только когда впервые выходим на принципиально новый уровень. В дальнейшем у нас как минимум есть предыдущая версия нейронного движка. В шахматах есть алгоритмические движки сопоставимой силы. И т.д.
  14. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    Странно называть маниловщиной цель, которая по сути достигнута (в шахматах, сёги и го).

    Это где написано?

    В смысле, правил? Ну, да, без правил играть не выйдет.
  15. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Что значит достигнута? Универсальный Альфа-Зеро это идеал, который невозможно превзойти по силе игры?
  16. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    Почему невозможно? Можно. Тем не менее, он решает все три задачи очень хорошо. При минимуме начальных знаний.
  17. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А зачем нужен универсальный способ решения задач, если специализированные способы будут давать лучшие результаты?
  18. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    Затем, что специализированные методы надо каждый раз выдумывать. Это долго и дорого.
  19. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Это естественно. Сетка же та же самая. Интересно было бы эту позицию в третью сетку загнать. А также в DeusX. Кажется странным, что Лила не понимает такие простые блокады в эндшпилях. Может что-то с обучением было не то и в других сетках такой проблемы нет.

    upd
    У DeusX такие же проблемы с разноцветом. Тоже блокаду не понимает.
  20. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Надо чтобы в нейросети белопольный слон и чёрнопольный считались разными фигурами. А так концепцию польности слона нейросети сложно вывести (имхо).
    Undying likes this.
  21. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    А каким примерно должна быть минимальная разница в ЭЛО чтобы чистый движок выигрывал все 100% партий у другого движка любыми фигурами из любых адекватных дебютов?
  22. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Плюс бесконечность, очевидно. См. формулу, определяющую рейтинг Эло:

    [​IMG]

    И да, Эло - это фамилия автора методики, а не аббревиатура. Всё буквы прописными в ней делать не надо.
    SKY likes this.
  23. pavelgttfj8 Учаcтник

    • Участник
    Member Since:
    07.12.2017
    Message Count:
    290
    Likes Received:
    90
    Репутация:
    3
    Оффлайн
    Лила опять проиграла в совершенно закрытой позиции, в которой получить любой исход кроме ничьей крайне сложно. Это ее первое поражение в этом турнире (cccc rapid redux)
    Она дважды обнуляла счетчик 50-ти ходов по своей инициативе, но на 3-й раз что-то не фартануло.



    Хотя дело даже не в этом, после открытия позиции наверное была ничья, но 163. Bh6 абсолютно тупейший ход с тактической точки зрения, ибо с помощью вскрытого шаха теряется слон. Просто элементарная вещь, не понимаю как она этого не увидела.
  24. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    А в TCEC какое-то совершенно необязательное поражение от Booot. Что, впрочем, не мешает лидировать с отрывом в три очка за круг с лишним до финиша.
  25. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    pavelgttfj8, у Лилы могут быть такие казусы. Она действительно может (очень редко, конечно) не видеть даже то, что видит человек.
  26. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Скорее всего играла уже на добавленных секундах, времени мало и просто зевок.
  27. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Лилу что-то приглючило. Bh8 она похоже просто не видела и после 162 ... Bg8 считала свою позицию абсолютно проигранной (-7).

    А в TCEC похожую партию Booot'у проиграла. Тоже в закрытой позицию долго катала. А через 60 ходов неожиданно выяснилось, что прорыв соперника b5 выигрывает.

    По уму надо в движке подправить, чтобы в подобных ситуациях Лила сама себя в цейтнот не загоняла. Проигрывает она из-за этого намного чаще, чем выигрывает.
  28. Michael-13 Господин

    • Участник
    • Старожил
    Member Since:
    18.11.2011
    Message Count:
    3.068
    Likes Received:
    1.098
    Репутация:
    29
    Оффлайн
  29. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Похоже у Лилы формируется самосознание. :) В TCEC, решив задачу выхода в следующий дивизион, Лила по гроссмейстерски не стала напрягаться и все партии в последнем круге свела в ничью. В первых трех кругах было минимум 4 победы за круг.
    Искусственный интеллект наступает! :dance:
    Edwards likes this.
  30. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    А Комодо решило поддержать интригу, и сделало вид, что может уступить второе место какому-то Ксифосу. Даже последнюю партию в турнире сделало "решающей" - впрочем, без труда её выиграло.
  31. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    И так можно считать доказанным, что MCTS разумнее чем Альфа-Бета! :)
  32. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Что-то в первом дивизионе Лила стартовала не очень лихо...
  33. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Станет опять первой по закону больших чисел :)
    Правда, числа в TCEC не очень большие, может и не стать))
  34. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Дебюты в белых партиях открытые попались - шотландка и французская с Kd2. В открытых позициях тяжело алгоритмический движок перекатать.
  35. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Придётся научиться, если на топ-1 в мире претендует.

Share This Page