AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
  2. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    А что не так-то? У Houdini с Komodo результат даже хуже чем у LCZero сейчас против Stockfish. И это последняя версия SF. Ethereal бы сидел как минимум с 5 поражениями в 10 партиях. А я напомню, что недавно Ethereal играл наравне с LCZero в условиях TCEC. Пока никто не говорит, что LCZero обогнал последнюю версию Stockfish. Меня просто удивляет такое отношение к силе игры LCZero разработчика GreKo. Вы ведь наверняка понимаете, что по 10 партиям нельзя делать выводы о силе игры. И по 50 даже нельзя. Так что ваш тест Greko может показать как завышенный, так и заниженный результат: +39-28=53 (+29 Elo). Но я готов его уточнить :)

    Я даже думаю добавить ваш движок сюда, если вы не против: https://sites.google.com/view/ethereal-testing/ , т. к. он один из сильнейших развивающихся российских движков.
     
  3. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    По поводу споров, сект alpha-beta и секты нейросетей. Мне на самом деле непонятно это: возвышение одного подхода над другим. Очевидно, что оба подхода имеют свои достоинства и недостатки. Разработчики Stockfish проделали невероятно огромную работу. Молодцы и те, кто придумал новый подход, который позволил получить новок направление в развитии шахматных программ. И если подход нейросетей обгонит подход alpha-beta, меня это не удивит. От этого никому хуже не станет (если только тем, кто не в той "секте"). Не удивительно потому, что мы видим скорость развития. Но если брать тактику, то здесь вряд ли найдется альтернатива ab-движкам.
    —- добавлено: 31 авг 2018 —-
    Я добавляю не российские движки, а движки, интересные лично мне. Есть хороший тест FastGM, который я не заменю. Но в нем нет beta-версий движков. Я также думаю и свой добавить туда в будущем.
     
    Последнее редактирование: 31 авг 2018
  4. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Давайте я на первый раз ваше хамство проигнорирую, как будто его не было.
    А на второй раз уж не обессудьте. Но там будет молча и без комментариев.
     
    Последнее редактирование: 1 сен 2018
  5. Michael-13
    Оффлайн

    Michael-13 Господин

    Репутация:
    29
  6. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Последняя тестовая сборка имеет еще 60 пунктов сверху :)
    В длинном контроле, возможно, немного меньше.
     
  7. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Не к силе игры, а к хайпу: "номер три в мире через неделю, номер два через две, номер один через три". А потом очередной пшик в официальном турнире.
    А сам проект мне безумно интересен, слежу за ним все внимательнее.
     
    sovaz1997 нравится это.
  8. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Сайт CCCC очень тяжёлый, смотреть с телефона на слабом канале практически нереально. В отличие от TCEC, где все летает.
     
  9. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    А, ну здесь согласен. Некоторые уже месяц назад говорили, что LCZero - сильнейший движок, и их оценка былп осеоснов на каких-то тестах против одноядерных движков))
    —- добавлено: 31 авг 2018 —-
    Раньше сайт TCEC даже на ПК очень долго грузится. Bets-версия намного лучше сейчас. Сайт CCCC в горизонтальном режиме вообще не оптимизирован под мобильные устройства.
     
  10. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    chess.com идиоты. Их не лучший дизайн, тяжеловесность сайта и куча багов некоторые из которых заменяются другими постоянно - был всегда. Скорее всего у них нет шанса поумнеть, хоть бы у личесс учились.
    Алсо выиграл сегодня впервые у Лилы на хардкоре. Партия ниже

     
  11. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Шо это было? :confused::confused::confused::facepalm2:
     
  12. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Впрочем она уже стала сильней.
    http://play.lczero.org/
     
  13. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    То есть, при царе Горохе?
     
  14. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Это Easy уровень, Nodes = 1, как я понимаю это ходы, которые рекомендует нейросеть без MCTS, чисто понимание без перебора :)
     
  15. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Выводить первым ходом коня на край доски, а следующим ходом не брать незащищенную фигуру противника - превосходный образец именно что понимания шахматной позиции.
     
    Vladruss нравится это.
  16. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Это не easy. Это hardcore-уровень. Сеть была сброшена.
     
  17. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    Да ето наверное запустили какое то новое обучение. И учат сеть сначала. Сиграл несколько партий на разних уровнях ето уровень 800 ело
     
  18. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Уже стала значительно умнее. Прогрессирует на глазах. В центр королем не выходит
    ID 20100 Hardcore

     
  19. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Сейчас в партии с Чайкой в окончании ладья против слона себе плюс три упорно рисовала, аж до самого присуждения. Да, я понимаю, что это артефакт монте-карловского поиска. Значит, это говорит о качестве этого самого поиска, если она умудряется у самой себя регулярно в этом окончании выигрывать.
     
  20. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Кстати, почему-то партия с Чайкой была сыграна два раза, в первый раз тоже ничья, но чуть по-другому (там в ладейнике пешку g пыталась провести, при чёрном короле на g8).
    В общем, ничьи делать умеет. Дао шахмат - теоретически ничейной игры - постигла.
     
  21. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Лила вроде бы и первую партию два раза играла. Какие-то проблемы были с сервером. Сейчас модеры проснутся, будут решать, и возможно присудят Лиле две победы вместо ничьих.
     
  22. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Кстати, почему у LCZero 2 победы, когда по факту 2 ничьи? Кто-то видел игры?
     
  23. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    https://blog.lczero.org/
     

    Вложения:

    • games.pgn
      Размер файла:
      825,6 КБ
      Просмотров:
      757
    sovaz1997 нравится это.
  24. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Все, хардкор уже дается очень сложно. Скоро толку играть с ней мне не будет. Долго думал над каждым ходом и в итоге обыграл ее
    Leela ID 20124 Hardcore

     
    sovaz1997 нравится это.
  25. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Как же эта сволочь любит ладьями забираться во всякие неожиданные места. Причем зачастую не испытывает никаких проблем при этом.
    Leela ID 20175 Hardcore

     
  26. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Так в этом и смысл, зачем мне с ней играть когда она обучится.
     
  27. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Что за ад начался в концовке партии Комодо - Лила? Комодо упорно подставлял слона под бой. Лила не забирала. Они там вместо шахмат в поддавки что ли начали играть?
     
  28. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Наверное, Komodo хотел побыстрее партию завершить, а Лила поиграть подольше хотела. Она ведь любит изматывать соперников))
     
  29. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Вообще, Лила хорошо пока идёт, в группе лидеров уверенно держится. Вот так бы и сразу, а то развели балаган в TCEC.
    Shredder тоже радует, не ожидал от него такого возрождения.
     
  30. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Видать в трансляции был какой-то сбой. Сейчас по тексту партии нормально все.
     
  31. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Кто-нибудь в курсе, когда стартует высший дивизион TCEC?
     
  32. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    WinPooh нравится это.
  33. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Сделал партию в ChessMaster между лилой net 20687 и Бак 2497 Эло



    На 50 ходу белые почему-то сделали ладью и матовали ещё 3 хода, Brainfish практически мгновенно видит в этом месте ферзя и мат в 3 хода
     
  34. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Ряд выводов по игре Лилы в cccc:

    - Плохая оптимизация под тензорные процессоры. Потенциал 4 V100 Лила использует примерно на 10%.

    - Плохое понимание малофигурных эндшпилей. Лила излишне оптимистично оценивает шансы сильнейшей стороны. Вероятно это просто недостаток наигрыша и возможно стоит просто Лилу потренировать на таких эндшпилях.

    - Похоже есть какие ошибки, приводящие в некоторых случаях к неправильной оценке пата. На первом этапе cccc в партии №597 с Педоном Лила на 91 ходу показывает оценку -17. При этом в принципиальном варианте, который она показывает, стоит пат на доске. Возможно плохое понимание малофигурных эндшпилей связано с этой же проблемой.

    - Нерациональное использование времени. В миттельшпиле Лила как правило играет очень быстро, тратя в разы меньше времени, чем соперник.

    - Большой разрыв в результатах белыми и черными. У Альфа Зеро разница была порядка 200 пунктов Эло, у Лилы примерно также. Вероятно это принципиальная особенность нейронных движков. В чуть лучших позициях играть значительно проще, чем в чуть худших. В худшем положении нужно защищаться от множества угроз соперника и как бы хорошо ни было понимание нейронной сети, все равно что-то подзевывается. Но также возможно это следствие самообучения. Против равного соперника черными сушить позицию самая эффективная тактика. А при самообучении Лила только с равным соперником и играет. Первый этап cccc показал, что Лиле трудно обыграть черными даже слабые движки с силой менее 3100 Эло.

    Было бы интересно попробовать обучить нейронную сеть на играх с переборными движками. Это может быть прорывом. Превосходство нейронной сети в понимании наиболее критично в стратегических позициях. Но играя сама с собой Лила этого естественно понять не может и в играх с переборными движками к таким позициям не стремится. А вообще в принципе стоит на входе нейронной сети задавать силу и вид (переборный, нейронный) соперника. Тогда в зависимости от соперника Лила сможет играть по разному, например, агрессивнее против слабых движков.
     
  35. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    В играх с переборными движками LCzero научиться лишь тому что умеют они об этом уже писалось.