AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    547
    Симпатии:
    132
    Репутация:
    1
    Оффлайн
    А почему рейтинг не может быть отрицательным?
  2. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    116
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Если не брать в расчет почти 200к партий, когда все сломалось, то рост второй тестовой сети проходит быстрее чем первой, за 200к игр в первой сети она добралась до 1650 Эло, а во второй до 2000 Эло. осталось только проверить вторую сеть что это за Эло :)
  3. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Этому рейтингу ELO не стоит особо доверять, от запуска к запуску он ведёт себя немного по-разному. Провели тест с id7, и оказалась, что старая всё-таки сильнее.
  4. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Старая не оказалась сильнее (посмотрите на счёт). Этот тест не шел в копилку просто.
  5. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Старая оказалась сильнее, примерно на 86 ELO. В реальных ELO скорее даже больше. Вроде бы внимательно всё рассмотрел :)
    sovaz1997 нравится это.
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    367
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    А, не туда посмотрел. Да, действительно старая сильнее. Извините :)
  7. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    547
    Симпатии:
    132
    Репутация:
    1
    Оффлайн
    а что такое ELO?
  8. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    116
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Скорее всего имелся в виду обычный Эло
  9. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Вот сейчас последняя версия показывает 3003 Эло, это примерно сколько реальных?
  10. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    116
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    ну вот когда кто нибудь где нибудь проведет тест - вот тогда и узнаем
    Я сейчас такой возможности не имею
    Кстати она побольше стала 10х128
  11. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Вечером было 3000, утром стало 2600, вообщем ни чо не понятно!
  12. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    116
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Это наверное очередная калибровка прошла и уточнение каких нибудь коэффициентов,
    Но особого эффекта от устранение последнего бага что то не очень заметно.
    А вот саморейтинг при 6х64 даже снизился


    .
    Boroda нравится это.
  13. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Вообщем ни какого избиения Стокфиша, в этом году ждать не приходится, максимум на что можно надеяться, так это на выход в 3 дивизион на ТСЕС, или, если быть совсем отъявленным оптимистом, то на выход во второй! И то если там разрешат играть на GPU. Хотя, что говорить это всё равно будет круто!
    Но учтите, господа разработчики, в 2019г, мы ждём от вас убедительно превосходства Лилы над всеми грандами компьютерных шахмат!
  14. xmuzaax Начинающий

    • Начинающий
    Рег.:
    12.06.2018
    Сообщения:
    1
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    а вот объясните мне, непонимающему, как в MCTS работает этап симуляции (выиграшная позиция или нет):
    если в альфазеро (ну или в более простом варианте) нейросеть определяет качество текущей позиции играя партию до конца, то почему не использовать этот метод для всей партии и тогда вообще зачем MCTS? Почему тогда играя партию до конца не запоминаются эти позиции в деверо с соответсвующим результатом?
  15. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Партии до конца не играются. Доигрывание узла дерева до конца называется роллаутом. Так делали раньше. Минус такого подхода - большая дисперсия оценки и она может быть сильно смещена.
    С MCTS всё очень просто. Это алгоритм поиска. Он улучшает оценку нейросети, т. к. она очевидно работает не идеально.
    Что делать в конце, если доигрывания нет? Просто берётся выход нейросети, отвечающий за качество позиции и всё.
  16. Сергей63 Новичок

    • Новичок
    Рег.:
    17.06.2018
    Сообщения:
    24
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    А где Стиль?
  17. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Что то как то тихо в лесу... Кто нить знает, когда окончательно перезапустят обучение? Неужели не все баги еще исправили?
  18. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Мне это тоже интересно.
  19. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    LcZero(вроде Cuda версия) сыграла две ничьи со Stockfish 9

  20. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Пытались долгое время повторить результат самого первого теста.
    Недавно нашли баг, который мог сильно повлиять на все тесты со 2 по 7.
    В 8 тесте выбрали не совсем удачную стратегию понижения LR, поэтому она видимо скатилась в локальный минимум, из которого уже не смогла выбраться.
    А вот тест 9 уже вышел сравнимым по силе с тестом 1, так что дальше прогресс я думаю пойдёт намного быстрее. Судя по тому, как в последнее время всё движется, мне кажется, что стоит ожидать относительно скоро выхода 20x256 сети в основной пайплайн.

    Ну и ничья со стокфишем - это давно уже пройденный этап.
    Вот примеры ничейных результатов разных версий Leela с dev версией стокфиша на 20 ядрах:
    https://lichess.org/P2GRf7Y3
    https://lichess.org/Lxh7LwcD
    https://lichess.org/JhlZDEBx
    https://lichess.org/zrGroCM5
  21. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Как сеть 20x256, они же собирались перезапускать обучение?
  22. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Ещё рано говорить о перезапуске, нужно отладить параметры и убедиться что всё работает хорошо. Но полноценный перезапуск уже не за горами.
    Совсем недавно перезапустили тест, теперь там 20x256 сеть. Отслеживать прогресс можно тут:http://testserver.lczero.org/
  23. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    116
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Пока только известно что не на этой ни на следующей недели его не будет

    отслеживать придется долго, из за большой сети скорость наигрывания существенно упала
    (всего 2 с небольшим тысячи игр в сутки,то есть на 3 порядка, кажется )
  24. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Как это две тысячи, если сегодня только уже 40000 с лишним тысяч наиграли?
  25. pavelgttfj8 Новичок

    • Новичок
    Рег.:
    07.12.2017
    Сообщения:
    87
    Симпатии:
    26
    Репутация:
    2
    Оффлайн
    21.Bc4 Норм
    https://www.youtube.com/watch?v=2m5oXlZ_e_A

    Zayats нравится это.
  26. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Здесь в 6 пункте http://blog.lczero.org/2018/07/02/project-update/
    пишется что осуществляется переход на 16 битную арифметику, но поддержка будет только на видеокартах Titan, это что же все владельцы видеокарт GTX остаются за "бортом", или же для них будет какая-то альтернатива на GPU?
  27. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    493
    Симпатии:
    180
    Репутация:
    21
    Оффлайн
    Просто у владельцев Титанов скорость стала в два раза выше. Остальных это не коснулось. Сравнить скорости до и после можно здесь:
    https://docs.google.com/spreadsheet...7Vul4DpRNfn6K8oeCjBILe6uA/edit#gid=1508569046

    P.S. Насколько я знаю 1080 Ti поддерживает int8, так что и для владельцев таких карт ещё не всё потеряно.
  28. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    То есть, будут сетки и в старой арифметике? Если так, то хорошо.
  29. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    493
    Симпатии:
    180
    Репутация:
    21
    Оффлайн
    Не исключено, что они все будут в старой арифметике, просто на Титанах будет производится округление. Впрочем, деталей я не знаю.
    Sergey1983 нравится это.
  30. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Народ подскажите, а можно в арене задать условия турнира, чтобы движок,
    (например Лила) играла с несколькими противниками, а они между собой не играли? А то решил протестировать Лилу с разными движками, но неохота каждый раз создавать новый турнир.
  31. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    10.613
    Симпатии:
    3.505
    Репутация:
    344
    Оффлайн
    Видимо, надо делать так:


    [​IMG]

    Хотя я не люблю Арену и тоже в ней плохо разбираюсь.
    Boroda нравится это.
  32. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Спасибо попробую!
  33. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
  34. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Crem, а нельзя ли после перезапуска сервера добавить поддержку шахмат Фишера?
  35. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.815
    Симпатии:
    291
    Репутация:
    20
    Адрес:
    Киев
    Оффлайн
    А кто будет тренировать нейросеть?

Поделиться этой страницей