AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    он фигуру отдал за 2 пешки в начале партии... и будет играть любую позу, пока не станет -10
    Ему пофиг на правильные оценки :)

    мне надо 7 выигранных Вяленым партий в Паульсене
    —- добавлено: 11 дек 2017 —-
    эту позу я смотрел, там Кс4
    —- добавлено: 11 дек 2017, опубликовано: 11 дек 2017 —-
    Пока на данный момент известно:
    1. играл Стокфиш 8
    2. проиграл менее 100 Эло
    3. фора в книгу подарила Альфе 160 Эло

    Итого:
    в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

    Опровергайте!
    MS и Challenger Spy нравится это.
  2. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    843
    Симпатии:
    768
    Репутация:
    466
    Оффлайн
    Предлагаю усиления игры в партии (указанные на скрине): рисунок_4.jpg
  3. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.916
    Симпатии:
    3.969
    Репутация:
    141
    Адрес:
    Заир
    Оффлайн
    Я про другое. В этих позициях Стокфиш даже на небольшой глубине ставит разумные оценки. То есть нет той картинки, которую про него пытаются намалевать: мол, Стокфиш не понимает невыгод позиции ферзя на h8 или что фигура может быть сильнее четырёх пешек. Причина проигрыша не в этом.
  4. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Круто! Стокфиш, оказывается, сильнее АльфыЗеры играет.
  5. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Vladruss, арифметика не врёт
    А то тут все рассуждают про нейросети с умным видом, а суть в другом
    Альфа ПОКА слабее
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Комсюк, а у вас какая глубина была? У меня он тоже Kc4 долго показывал. Но там и так, и так проиграно было.
  7. vsvor Новичок

    • Новичок
    Рег.:
    09.12.2017
    Сообщения:
    9
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.
    Undying нравится это.
  8. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Теоретически. А фактически мы наблюдаем уверенную игру Зерушки.
    Анекдот напомнить про теоретическую вероятность и фактическую реальность?
  9. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF. Да и не у каждого сейчас есть мощная видеокарта. Но то, что нейросети для шахматных движков будут актуальны - это точно. Также, возможно, нейросети помогут просчитать 8-фигурные базы, используя хитрое сжатие похожих позиций. Я, конечно, не уверен здесь.
  10. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    42 вроде, у тебя комп мощней, тебе не надо полчаса держать
    —- добавлено: 11 дек 2017 —-
    я бы тебя послал подальше, но ты давний приятель...
    Пойди ближе, к "лунатикам" - отведи душу
  11. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Комсюк, у меня ещё компиляция собственная. Обычный SF медленнее работает. Хеш 4 Гб поставил. Но если бы я ещё оставил его думать, он бы мог опять к Kc4 вернуться. Так что разменивание фигуры на 2 пешки было плохим решением.
  12. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    "Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.
  13. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    sovaz1997, неправильно :facepalm2:
    Ставь Стокфиш 8 официальный!

    Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
    Хотя для меня очевидно, что его
    Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?
  14. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
    Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы). Но вот на сколько - неизвестно. Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.
  15. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    а ты трубой этого Костю из-за угла... и фактически ты выиграл
    А пока он будет лежать в коме, ты ему анек расскажи
    Vladruss нравится это.
  16. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    N1mTzo, sovaz1997 и Gridnev нравится это.
  17. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    я это знаю..
    Это был гротеск :)
    Предложите умный перенос
    —- добавлено: 11 дек 2017 —-
    Если не во французской, то в этом же варианте новоиндийки, в этом уверен на 99%
    Рандомность у Стока есть, но она проявится уже тогда, когда поза "готова" и игра идёт на два результата
    —- добавлено: 11 дек 2017 —-
    Там много партий-близнецов, поэтому легко объяснить, что выложили только 10
  18. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Все совпадает. Если несовпадает, я проверяю 8-й версией :).
  19. vsvor Новичок

    • Новичок
    Рег.:
    09.12.2017
    Сообщения:
    9
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает. Так было с го: против Седоля играли на 64 TPU, но новая версия победила всухую предыдущую, обходясь 4 TPU.

    Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

    Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. :gigi: И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено. :gigi:
  20. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Но ход Rf8 был слабый (там, где ферзь загнан в угол). Думаю, это все коллизии хеша.
    —- добавлено: 11 дек 2017 —-
    Уже в SF пытаются это внедрять. Думаю, нас ждут изменения в движках. Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.
  21. Neo94 Учаcтник

    • Участник
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    144
    Репутация:
    -10
    Оффлайн
    Для такого и дают адекватный контроль времени - ну там час на партию, хотя бы.
    А не минута на ход...
  22. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Rf8
    sovaz1997 нравится это.
  23. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Это только тесты могут показать.
    В общем, это не имеет большого значения. Альфа-бета нормально не масштабируется на много потоков. Нейросети - масштабируются очень хорошо. А учитывая, что гигагерцы в ближайшее время расти не будут (в отличие от количества ядер), ясно, какое направление перспективней, и Гугл показал, что успех возможен. Значит через месяц или через год появится версия для обычных видеокарт, которые в магазине можно купить. Может от Гугл, может от кого-нибудь другого.
    Любитель_, MS, Gridnev и ещё 1-му нравится это.
  24. FIBM Учаcтник

    • Участник
    Рег.:
    27.05.2011
    Сообщения:
    395
    Симпатии:
    312
    Репутация:
    7
    Оффлайн
    Вы работаете в науке, или так лишь бы с апломбом что-нибудь написать? Эта работа слишком серьезная, чтобы ее публиковать в левом журнале, а в "приличном журнале" должна пройти рецензии специалистов. Так что проблем нет.
    —- добавлено: 11 дек 2017 —-
    Понял, вы вообще в этом ничего НЕ понимаете.
  25. N1mTzo Учаcтник

    • Участник
    Рег.:
    17.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Не стал бы в лоб сравнивать перебор разных движков (если A0 можно к ним отнести), использующих разные алгоритмы. Тем более после той истории с Райлихом и его Рыбкой, которая считала одно кол-во позиций, а выводила на экран совсем другое. Да и смысл этих цифр какой? Важна ИМХО эффективность, масштабируемость и , самое главное, сила игры в шахматы У Вяленого большАя часть этих пресловутых "килоноденсов"- это по сути мусор из-за особенностей алгоритма при распараллеливании потоков. А у А0 что "под капотом" мало кто знает, реально не хватает человека, который бы "разложил" по полочкам особенности архитектуры А0 (и всего остального) для простого смертного.

    Для этого придется как минимум переписывать регламент (по сути создать новый), т.к. там все правила под обычное железо заточены.
  26. Baron Учаcтник

    • Участник
    Рег.:
    08.02.2008
    Сообщения:
    2.351
    Симпатии:
    237
    Репутация:
    11
    Оффлайн
    ...И он таки проиграл, даже на "том" компе. Стокфишу однозначно надо дать фору по времени, ибо нейросеть за 1 минуту находит исключительно глубокие идеи, недоступные для терминатора Т-100.
    Самое забавное, что если поменять соперников местами после дебюта, то Альфазеро, скорее всего, все равно будет уделывать Стокфиша. Грубая аналогия - мастер черными в латышском гамбите обыграет кандидата в мастера. И кстати это идея:) заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки. А с лишним конем даже я обыграл бы боженьку (правда не уверен, но с лишним ферзем - это точно).:)
  27. N1mTzo Учаcтник

    • Участник
    Рег.:
    17.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Полистал твиттер Демиса и убедился, что даже победа над Седолем в го такого резонанса (при всем пиаре того матча) не вызвала ( такого количества ретвитов и комментариев) из-за, казалось бы, одной статьи на arxiv.org с десятком шахматных партий.
  28. vsvor Новичок

    • Новичок
    Рег.:
    09.12.2017
    Сообщения:
    9
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Не обязательно плохие. Белыми у SF был приличный счет в сицилианке.[​IMG]
  29. FIBM Учаcтник

    • Участник
    Рег.:
    27.05.2011
    Сообщения:
    395
    Симпатии:
    312
    Репутация:
    7
    Оффлайн
    А зачем нам "оценки железяки"? Мы что сами не видим, что стокфиш проигрывал всегда по одной и той же схеме: не развитость фигур . Если не знать, что играет машина, то любой тренер бы сказал: "Мальчик, фигуры нужно развивать!".:)
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Есть 7 (семь!) проигранных вашим богом партий в одном варианте сицилианки
    Но мы их не увидим
  31. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры. Возможно, где-то в тактике проссчитывался? Жалко, не дали нам эти партии.
  32. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Вы неправильно трактуете таблицу... там победа Альфы 8-2
    А вот в Паульсене 7-3 в пользу Стока
  33. vsvor Новичок

    • Новичок
    Рег.:
    09.12.2017
    Сообщения:
    9
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Да, я уже вспомнил.

    Ну, если посмотреть в статье, при обучении сицилианки было немного. Возможно, не хватало понимания дебюта, даже против SF без книги.
    sovaz1997 и Комсюк нравится это.
  34. Mellio Новичок

    • Новичок
    Рег.:
    11.12.2017
    Сообщения:
    16
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Хотелось бы напомнить уважаемой аудитории, которая тут до хрипоты спорит как дебютная книга даёт +9000 ELO стокфишу, что в препринте приведена статистика по 10 самым популярным человеческим дебютам и в каждом из них A0 сыграла по 100 партий с вяленным (50 белыми и черными, то есть всего 1100 партий включая 100 партий матча со свободным дебютом). И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения. Более интересно, что эти 10 дебютов составляли не более 30 % партий в конце самообучения, то есть еще 70 % игр тренировалось что-то другое.

    И ELO рейтинг в шахматах "сжимается" при высоком уровне игры, так как ничейные тенденции все сильнее проявляются (это кстати в препринте отмечено). Такого например нет в Го, так как там нет ничьих в принципе.
    Gridnev нравится это.
  35. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    а Стокфиш не играл вообще
    -4 Альфы чёрными это просто уничтожение, да :)
    —- добавлено: 11 дек 2017 —-
    ладно, пустое это... я ушёл

Поделиться этой страницей