AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Neo94 Учаcтник

    • Участник
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    144
    Репутация:
    -10
    Оффлайн
  2. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    А что не так-то? У Houdini с Komodo результат даже хуже чем у LCZero сейчас против Stockfish. И это последняя версия SF. Ethereal бы сидел как минимум с 5 поражениями в 10 партиях. А я напомню, что недавно Ethereal играл наравне с LCZero в условиях TCEC. Пока никто не говорит, что LCZero обогнал последнюю версию Stockfish. Меня просто удивляет такое отношение к силе игры LCZero разработчика GreKo. Вы ведь наверняка понимаете, что по 10 партиям нельзя делать выводы о силе игры. И по 50 даже нельзя. Так что ваш тест Greko может показать как завышенный, так и заниженный результат: +39-28=53 (+29 Elo). Но я готов его уточнить :)

    Я даже думаю добавить ваш движок сюда, если вы не против: https://sites.google.com/view/ethereal-testing/ , т. к. он один из сильнейших развивающихся российских движков.
  3. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    По поводу споров, сект alpha-beta и секты нейросетей. Мне на самом деле непонятно это: возвышение одного подхода над другим. Очевидно, что оба подхода имеют свои достоинства и недостатки. Разработчики Stockfish проделали невероятно огромную работу. Молодцы и те, кто придумал новый подход, который позволил получить новок направление в развитии шахматных программ. И если подход нейросетей обгонит подход alpha-beta, меня это не удивит. От этого никому хуже не станет (если только тем, кто не в той "секте"). Не удивительно потому, что мы видим скорость развития. Но если брать тактику, то здесь вряд ли найдется альтернатива ab-движкам.
    —- добавлено: 31 авг 2018 —-
    Я добавляю не российские движки, а движки, интересные лично мне. Есть хороший тест FastGM, который я не заменю. Но в нем нет beta-версий движков. Я также думаю и свой добавить туда в будущем.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Давайте я на первый раз ваше хамство проигнорирую, как будто его не было.
    А на второй раз уж не обессудьте. Но там будет молча и без комментариев.
  5. Michael-13 Господин

    • Участник
    • Старожил
    Рег.:
    18.11.2011
    Сообщения:
    3.068
    Симпатии:
    1.098
    Репутация:
    29
    Оффлайн
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Последняя тестовая сборка имеет еще 60 пунктов сверху :)
    В длинном контроле, возможно, немного меньше.
  7. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Не к силе игры, а к хайпу: "номер три в мире через неделю, номер два через две, номер один через три". А потом очередной пшик в официальном турнире.
    А сам проект мне безумно интересен, слежу за ним все внимательнее.
    sovaz1997 нравится это.
  8. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Сайт CCCC очень тяжёлый, смотреть с телефона на слабом канале практически нереально. В отличие от TCEC, где все летает.
  9. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    А, ну здесь согласен. Некоторые уже месяц назад говорили, что LCZero - сильнейший движок, и их оценка былп осеоснов на каких-то тестах против одноядерных движков))
    —- добавлено: 31 авг 2018 —-
    Раньше сайт TCEC даже на ПК очень долго грузится. Bets-версия намного лучше сейчас. Сайт CCCC в горизонтальном режиме вообще не оптимизирован под мобильные устройства.
  10. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    chess.com идиоты. Их не лучший дизайн, тяжеловесность сайта и куча багов некоторые из которых заменяются другими постоянно - был всегда. Скорее всего у них нет шанса поумнеть, хоть бы у личесс учились.
    Алсо выиграл сегодня впервые у Лилы на хардкоре. Партия ниже

  11. Vladruss НедоКМС, победитель второразрядников.

    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    16.124
    Симпатии:
    8.173
    Репутация:
    520
    Нарушения:
    31
    Оффлайн
    Шо это было? :confused::confused::confused::facepalm2:
  12. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    Впрочем она уже стала сильней.
    http://play.lczero.org/
  13. Vladruss НедоКМС, победитель второразрядников.

    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    16.124
    Симпатии:
    8.173
    Репутация:
    520
    Нарушения:
    31
    Оффлайн
    То есть, при царе Горохе?
  14. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.484
    Симпатии:
    1.210
    Репутация:
    29
    Адрес:
    Киев
    Оффлайн
    Это Easy уровень, Nodes = 1, как я понимаю это ходы, которые рекомендует нейросеть без MCTS, чисто понимание без перебора :)
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Выводить первым ходом коня на край доски, а следующим ходом не брать незащищенную фигуру противника - превосходный образец именно что понимания шахматной позиции.
    Vladruss нравится это.
  16. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Это не easy. Это hardcore-уровень. Сеть была сброшена.
  17. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    464
    Симпатии:
    35
    Репутация:
    11
    Оффлайн
    Да ето наверное запустили какое то новое обучение. И учат сеть сначала. Сиграл несколько партий на разних уровнях ето уровень 800 ело
  18. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    Уже стала значительно умнее. Прогрессирует на глазах. В центр королем не выходит
    ID 20100 Hardcore

  19. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Сейчас в партии с Чайкой в окончании ладья против слона себе плюс три упорно рисовала, аж до самого присуждения. Да, я понимаю, что это артефакт монте-карловского поиска. Значит, это говорит о качестве этого самого поиска, если она умудряется у самой себя регулярно в этом окончании выигрывать.
  20. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Кстати, почему-то партия с Чайкой была сыграна два раза, в первый раз тоже ничья, но чуть по-другому (там в ладейнике пешку g пыталась провести, при чёрном короле на g8).
    В общем, ничьи делать умеет. Дао шахмат - теоретически ничейной игры - постигла.
  21. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    643
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    Лила вроде бы и первую партию два раза играла. Какие-то проблемы были с сервером. Сейчас модеры проснутся, будут решать, и возможно присудят Лиле две победы вместо ничьих.
  22. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Кстати, почему у LCZero 2 победы, когда по факту 2 ничьи? Кто-то видел игры?
  23. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    643
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    https://blog.lczero.org/

    Вложения:

    • games.pgn
      Размер файла:
      825,6 КБ
      Просмотров:
      732
    sovaz1997 нравится это.
  24. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    Все, хардкор уже дается очень сложно. Скоро толку играть с ней мне не будет. Долго думал над каждым ходом и в итоге обыграл ее
    Leela ID 20124 Hardcore

    sovaz1997 нравится это.
  25. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    Как же эта сволочь любит ладьями забираться во всякие неожиданные места. Причем зачастую не испытывает никаких проблем при этом.
    Leela ID 20175 Hardcore

  26. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    286
    Симпатии:
    89
    Репутация:
    3
    Оффлайн
    Так в этом и смысл, зачем мне с ней играть когда она обучится.
  27. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Что за ад начался в концовке партии Комодо - Лила? Комодо упорно подставлял слона под бой. Лила не забирала. Они там вместо шахмат в поддавки что ли начали играть?
  28. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Наверное, Komodo хотел побыстрее партию завершить, а Лила поиграть подольше хотела. Она ведь любит изматывать соперников))
  29. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Вообще, Лила хорошо пока идёт, в группе лидеров уверенно держится. Вот так бы и сразу, а то развели балаган в TCEC.
    Shredder тоже радует, не ожидал от него такого возрождения.
  30. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Видать в трансляции был какой-то сбой. Сейчас по тексту партии нормально все.
  31. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.468
    Симпатии:
    3.056
    Репутация:
    94
    Адрес:
    Москва
    Оффлайн
    Кто-нибудь в курсе, когда стартует высший дивизион TCEC?
  32. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    643
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    WinPooh нравится это.
  33. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Сделал партию в ChessMaster между лилой net 20687 и Бак 2497 Эло



    На 50 ходу белые почему-то сделали ладью и матовали ещё 3 хода, Brainfish практически мгновенно видит в этом месте ферзя и мат в 3 хода
  34. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Ряд выводов по игре Лилы в cccc:

    - Плохая оптимизация под тензорные процессоры. Потенциал 4 V100 Лила использует примерно на 10%.

    - Плохое понимание малофигурных эндшпилей. Лила излишне оптимистично оценивает шансы сильнейшей стороны. Вероятно это просто недостаток наигрыша и возможно стоит просто Лилу потренировать на таких эндшпилях.

    - Похоже есть какие ошибки, приводящие в некоторых случаях к неправильной оценке пата. На первом этапе cccc в партии №597 с Педоном Лила на 91 ходу показывает оценку -17. При этом в принципиальном варианте, который она показывает, стоит пат на доске. Возможно плохое понимание малофигурных эндшпилей связано с этой же проблемой.

    - Нерациональное использование времени. В миттельшпиле Лила как правило играет очень быстро, тратя в разы меньше времени, чем соперник.

    - Большой разрыв в результатах белыми и черными. У Альфа Зеро разница была порядка 200 пунктов Эло, у Лилы примерно также. Вероятно это принципиальная особенность нейронных движков. В чуть лучших позициях играть значительно проще, чем в чуть худших. В худшем положении нужно защищаться от множества угроз соперника и как бы хорошо ни было понимание нейронной сети, все равно что-то подзевывается. Но также возможно это следствие самообучения. Против равного соперника черными сушить позицию самая эффективная тактика. А при самообучении Лила только с равным соперником и играет. Первый этап cccc показал, что Лиле трудно обыграть черными даже слабые движки с силой менее 3100 Эло.

    Было бы интересно попробовать обучить нейронную сеть на играх с переборными движками. Это может быть прорывом. Превосходство нейронной сети в понимании наиболее критично в стратегических позициях. Но играя сама с собой Лила этого естественно понять не может и в играх с переборными движками к таким позициям не стремится. А вообще в принципе стоит на входе нейронной сети задавать силу и вид (переборный, нейронный) соперника. Тогда в зависимости от соперника Лила сможет играть по разному, например, агрессивнее против слабых движков.
  35. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    В играх с переборными движками LCzero научиться лишь тому что умеют они об этом уже писалось.

Поделиться этой страницей