AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. KEV81 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    06.03.2017
    Сообщения:
    418
    Симпатии:
    106
    Репутация:
    -3
    Нарушения:
    36
    Оффлайн
    А почему рейтинг не может быть отрицательным?
  2. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    87
    Симпатии:
    12
    Репутация:
    0
    Оффлайн
    Если не брать в расчет почти 200к партий, когда все сломалось, то рост второй тестовой сети проходит быстрее чем первой, за 200к игр в первой сети она добралась до 1650 Эло, а во второй до 2000 Эло. осталось только проверить вторую сеть что это за Эло :)
  3. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    21
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    Этому рейтингу ELO не стоит особо доверять, от запуска к запуску он ведёт себя немного по-разному. Провели тест с id7, и оказалась, что старая всё-таки сильнее.
  4. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    218
    Симпатии:
    24
    Репутация:
    1
    Оффлайн
    Старая не оказалась сильнее (посмотрите на счёт). Этот тест не шел в копилку просто.
  5. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    21
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    Старая оказалась сильнее, примерно на 86 ELO. В реальных ELO скорее даже больше. Вроде бы внимательно всё рассмотрел :)
    sovaz1997 нравится это.
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    218
    Симпатии:
    24
    Репутация:
    1
    Оффлайн
    А, не туда посмотрел. Да, действительно старая сильнее. Извините :)
  7. KEV81 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    06.03.2017
    Сообщения:
    418
    Симпатии:
    106
    Репутация:
    -3
    Нарушения:
    36
    Оффлайн
    а что такое ELO?
  8. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    87
    Симпатии:
    12
    Репутация:
    0
    Оффлайн
    Скорее всего имелся в виду обычный Эло
  9. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    38
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    Вот сейчас последняя версия показывает 3003 Эло, это примерно сколько реальных?
  10. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    87
    Симпатии:
    12
    Репутация:
    0
    Оффлайн
    ну вот когда кто нибудь где нибудь проведет тест - вот тогда и узнаем
    Я сейчас такой возможности не имею
    Кстати она побольше стала 10х128
  11. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    38
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    Вечером было 3000, утром стало 2600, вообщем ни чо не понятно!
  12. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    87
    Симпатии:
    12
    Репутация:
    0
    Оффлайн
    Это наверное очередная калибровка прошла и уточнение каких нибудь коэффициентов,
    Но особого эффекта от устранение последнего бага что то не очень заметно.
    А вот саморейтинг при 6х64 даже снизился


    .
    Boroda нравится это.
  13. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    38
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    Вообщем ни какого избиения Стокфиша, в этом году ждать не приходится, максимум на что можно надеяться, так это на выход в 3 дивизион на ТСЕС, или, если быть совсем отъявленным оптимистом, то на выход во второй! И то если там разрешат играть на GPU. Хотя, что говорить это всё равно будет круто!
    Но учтите, господа разработчики, в 2019г, мы ждём от вас убедительно превосходства Лилы над всеми грандами компьютерных шахмат!
  14. xmuzaax Начинающий

    • Начинающий
    Рег.:
    12.06.2018
    Сообщения:
    1
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    а вот объясните мне, непонимающему, как в MCTS работает этап симуляции (выиграшная позиция или нет):
    если в альфазеро (ну или в более простом варианте) нейросеть определяет качество текущей позиции играя партию до конца, то почему не использовать этот метод для всей партии и тогда вообще зачем MCTS? Почему тогда играя партию до конца не запоминаются эти позиции в деверо с соответсвующим результатом?
  15. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    21
    Симпатии:
    1
    Репутация:
    0
    Оффлайн
    Партии до конца не играются. Доигрывание узла дерева до конца называется роллаутом. Так делали раньше. Минус такого подхода - большая дисперсия оценки и она может быть сильно смещена.
    С MCTS всё очень просто. Это алгоритм поиска. Он улучшает оценку нейросети, т. к. она очевидно работает не идеально.
    Что делать в конце, если доигрывания нет? Просто берётся выход нейросети, отвечающий за качество позиции и всё.
  16. Сергей63 Новичок

    • Новичок
    Рег.:
    17.06.2018
    Сообщения:
    9
    Симпатии:
    2
    Репутация:
    0
    Оффлайн

Поделиться этой страницей