AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Её хоть так хоть так тренируют(и я в том числе), а шахматы фишера это лишь новые позиции которые улучшат понимание шахмат LcZero.
    подобная идея уже была https://groups.google.com/forum/#!topic/lczero/C2PY8Lm8GMA
  2. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    На основном сервере, новым сетям наконец то удалось обыграть 390 сеть, для этого понадбилось почти 100 поколений сети!
    Sergey1983 и Rom нравится это.
  3. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.850
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Ещё и другие ходы - рокировки нетривиального вида. Насколько они хорошо лягут на существующую архитектуру сети?
  4. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Но, если ляжет почему бы не сделать?По ссылке выше писали что позиции во многом похожие поэтому замедление обучения не должно быть таким уж большим, кроме того я в том числе спрашиваю мнение других хотя окончательно прояснит ситуацию пожалуй лишь Crem.
  5. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Я согласен, что для анализа позиций это может быть полезным. Но для игры - скорее всего, нет, т. к. это уменьшает capacity нейронной сети для ходов из реальной игры.
  6. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Оффлайн
    В любом случае для анализа позиций куда более полезны позиции из классических шахмат. Если у нас король с b8 может рокировать на g8, то эта особенность может быть надо будет учитывать в шахматах Фишера, но для классических шахмат она более чем бесполезна.

    Я просто не сильно владею на тему того, как именно используются тестовые партии в обучении. И насколько велика вероятность, что сеть будет стремится к тому, чтобы глубоко знать небольшое количество дебютов. А это вполне себе локальный максимум, который использует большинство белковых шахматистов — иметь свой дебютный репертуар. В принципе, чтобы проверить это, надо просто посмотреть на статистику по дебютам в тестовых партиях. Если дебюты однообразны — сеть будет настроена на узкий дебютный репертуар.

    Но этого вполне можно избежать, если наигрывание тестовых партий реализовывать как большой MCTS где в UCT увеличить коэффициент исследования. Тогда в тестовых партиях будут разыгрываться самые разные дебюты, сеть будет учиться на большом количестве разнообразных позиций.
  7. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    С одной стороны специализация на одной начальной расстановке должна дать результаты "глубже", чем необходимость разбрасываться по разным расстановкам шахмат Фишера, невозможным в реальной партии. С другой стороны, не возникает ли в классической расстановке некоторый аналог переобучения нейросети, из-за ограниченного количества позиций в начальной стадии партии, что в итоге даже снизит общую силу игры. (Вопросы рокировки в шахматах Фишера при обучении можно как-нибудь решить.)
    --- добавлено: 12 июл 2018, опубликовано: 12 июл 2018 ---
    Кстати, к вопросу о вариативности. Уж коли мы не можем раздавать некоторым не столь продвинутым видеокартам данные для самоигры в половинной точности (см. обсуждение на предыдущей странице), и поскольку половинная точность не слишком сказывается на качестве игры, то нельзя ли раздавать таким видеокартам для самоигры нейросетки с рандомными значениями последних значащих цифр? А мастер-сеть хранить только на сервере для обучения? Не знаю правда, не трудно ли это с точки зрения реализации и даст ли необходимую вариативность?
  8. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Переобучение возникает, когда данных недостаточно. Тут данные можно генерировать бесконечно.
  9. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    В начале партии количество позиций ограничено. То есть дебютные позиции нейросеть по сути запоминает, вместо того, чтобы заниматься обобщением.
  10. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.850
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Так против запоминания есть всякие специальные техники, типа дропаута, добавления случайного шума и т.д.
  11. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Я считаю что переобучение возникает когда мал не абсолютный, а относительный(% от максимально возможного) набор данных, если же % велик то сеть будет просто превосходно адаптирована под данные(ИМХО).
  12. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    400 позиций первого хода не расширить никакими методами. Скорее всего сеть их просто запомнит. И потеряет гибкость "мышления" в начальной стадии партии. На следующих ходах вариантов больше, но тоже проще запомнить. Таким образом часть нейросети быстро проучивается и костенеет, по сути превращаясь в курс дебютов, и таким образом оказывает сдерживающее влияние на гибкость обучения остальной части нейросети.

    ...Или не оказывает. Это просто гипотеза, в достоверности которой я и сам не убежден.
  13. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    LcZero обыграла Stockfish 180614:
    Vladruss нравится это.
  14. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    10.584
    Симпатии:
    3.479
    Репутация:
    342
    Оффлайн
    Невероятная игра!
  15. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    544
    Симпатии:
    131
    Репутация:
    1
    Онлайн
    По-другому стокфиш не обыграть.
  16. pavelgttfj8 Новичок

    • Новичок
    Рег.:
    07.12.2017
    Сообщения:
    80
    Симпатии:
    26
    Репутация:
    2
    Оффлайн
    А вот тут лила с сайта проигрывает в абсолютно закрытой позиции стокфишу 8-го уровня

  17. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    639
    Симпатии:
    283
    Репутация:
    7
    Оффлайн
    Интересно жертву на f5 Лила просто не видела или расценивала получающуюся позицию оптимистично?
  18. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    А есть эта игра в каком нибудь шахматном редакторе?
  19. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.801
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Оффлайн
    А в Будапешстский гамбит Стокфиш сам пошёл или его заставили?
  20. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    544
    Симпатии:
    131
    Репутация:
    1
    Онлайн
    Когда "сам" пошел в Будапештский гамбит...
    [​IMG]
  21. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Vladruss нравится это.
  22. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    125
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
  23. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Версия на сайте чрезвычайно слаба, по сравнению с той, что используется в TCEC.
    И Лила только учится. Как справедливо было отмечено в видео, из 22 матчей, ей удалось выиграть всего лишь 1 раз, а проиграть - 15.
  24. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    10.584
    Симпатии:
    3.479
    Репутация:
    342
    Оффлайн
    Что вы имеете в виду? Я первый раз слышу про шахматные редакторы.
  25. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    388
    Симпатии:
    12
    Репутация:
    11
    Оффлайн
    Наверное человек имел ввиду Есть ли данная партия в каком то текстовом формате, допустим pgn.
  26. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    Пардон, я имел ввиду, чтобы её можно было посмотреть как например здесь https://lichess.org/P2GRf7Y3
  27. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    10.584
    Симпатии:
    3.479
    Репутация:
    342
    Оффлайн
    С Личесса можно скопировать тест партии и вставить в любую шахматную оболочку и потом эту партию посмотреть. Если потребуется, то можно свои комментарии присовокупить. В этом смысле - это и есть шахматный редактор. Но изначально надо просто иметь текст партии, иначе вставлять нечего и редактировать нечего.
    Лично я пользуюсь оболочкой Фритц, мне она наиболее удобная. Можно здесь на форуме партию вставить, чтобы на вьюере можно было посмотреть.
    Boroda нравится это.
  28. pavelgttfj8 Новичок

    • Новичок
    Рег.:
    07.12.2017
    Сообщения:
    80
    Симпатии:
    26
    Репутация:
    2
    Оффлайн
    https://lichess.org/paste
    1. d4 Nf6 2. c4 e5 3. dxe5 Ng4 4. Bf4 Bb4+ 5. Nc3 Bxc3+ 6. bxc3 Nc6 7. Nf3 Qe7 8. Qd5 f6 9. exf6 Nxf6 10. Qd3 d6 11. g3 O-O 12. Bg2 Bg4 13. O-O Rae8 14. Rfe1 b6 15. h3 Bh5 16. Bg5 Bf7 17. Bxf6 Qxf6 18. Ng5 Bg6 19. Qd5+ Kh8 20. Qxc6 Qxg5 21. Qd5 Re5 22. Qd4 Be4 23. Bxe4 Rf4 24. Bxh7 Rxd4 25. cxd4 Ra5 26. Bd3 Ra3 27. Rac1 Rxa2 28. h4 Qa5 29. Kg2 Rd2 30. h5 Kg8 31. Rh1 Qg5 32. Rb1 a5 33. Rb5 Qe7 34. h6 Rxe2 35. Rf5 Re4 36. Rf3 gxh6 37. Rxh6 Rxd4 38. Bf5 Qe8 39. Be6+ Kg7 40. Rhf6 Qh8 41. Rf7+ Kg6 42. R7f5 a4 43. Bf7+ Kg7 44. Rg5+ Kf8 45. Bd5+ Ke7 46. Rf7+ Kd8 47. Rfg7 Qxg7 48. Rxg7 a3 49. Rg8+ Kd7 50. Ra8 b5 51. Rxa3 bxc4 52. Bf3 Rd2 53. Kf1 Rb2 54. Rc3 Rb4 55. Bd5 c6 56. Bxc4 d5 57. Be2 Rb1+ 58. Kg2 Rb2
    Boroda нравится это.
  29. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    363
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    Небольшой инсайд. В следующем сезоне TCEC будут играть 2 NN-движка, один из которых Leela, о другом пока вообще нет информации в сети. Возможно, его сила игры примерно на уровне Stockfish. Железо такое: стандартные 43 ядра TCEC (CPU) для обычных движков и 2x GTX 1080 Ti для NN-движков. Примерная дата старта - 1 Августа.

    Из чата Twitch:
    noobpwnftw: I can tell you this secret NN engine is very strong
    noobpwnftw: I got my channels
    sovaz19972: Stronger than SF?
    noobpwnftw: probably on-par
    Boroda и Vladruss нравится это.
  30. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    50
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    мб это бот от фейсбука?
  31. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    363
    Симпатии:
    44
    Репутация:
    3
    Оффлайн
    От кого угодно может быть этот движок :)
    Полную информацию мы увидим в анонсе, надеюсь. Сначала он будет в 4-м дивизионе и постепенно будет продвигаться (если он играет действительно на уровне Stockfish, проблем добраться до Премьер-дивизиона у него не будет).
  32. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    10.584
    Симпатии:
    3.479
    Репутация:
    342
    Оффлайн
    Если сделать вот так:

    [​IMG]

    то получится вот так:

    [​IMG]

    И в итоге будет так:

    Boroda нравится это.
  33. pavelgttfj8 Новичок

    • Новичок
    Рег.:
    07.12.2017
    Сообщения:
    80
    Симпатии:
    26
    Репутация:
    2
    Оффлайн
    Vladruss, а как бы он тогда скопировал нотацию и закинул ее в личес? Я специально так сделал
  34. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.570
    Симпатии:
    1.850
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    А что это за Leela Chess 0.10 64-bit w323, которая в рейтинг-листе CCRL 40/40 соседствует с GreKo (2647 и 2646, соответственно)?
    На каком железе она играет, что за версия?
  35. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    544
    Симпатии:
    131
    Репутация:
    1
    Онлайн
    Та самая, на ССRL-ном железе.

    http://www.computerchess.org.uk/ccr...0.10 64-bit w323#Leela_Chess_0_10_64-bit_w323

    гляди авторов и ссылки

Поделиться этой страницей