AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    он фигуру отдал за 2 пешки в начале партии... и будет играть любую позу, пока не станет -10
    Ему пофиг на правильные оценки :)

    мне надо 7 выигранных Вяленым партий в Паульсене
    —- добавлено: 11 Dec 2017 —-
    эту позу я смотрел, там Кс4
    —- добавлено: 11 Dec 2017, опубликовано: 11 Dec 2017 —-
    Пока на данный момент известно:
    1. играл Стокфиш 8
    2. проиграл менее 100 Эло
    3. фора в книгу подарила Альфе 160 Эло

    Итого:
    в матче с книгой Стокфиш бы выиграл 60 Эло на ЭТОМ ЖЕ ЖЕЛЕЗЕ

    Опровергайте!
     
    Last edited: 11 Dec 2017
    MS and Challenger Spy like this.
  2. hornet
    Оффлайн

    hornet Учаcтник

    Репутация:
    490
    Предлагаю усиления игры в партии (указанные на скрине): рисунок_4.jpg
     
  3. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    142
    Я про другое. В этих позициях Стокфиш даже на небольшой глубине ставит разумные оценки. То есть нет той картинки, которую про него пытаются намалевать: мол, Стокфиш не понимает невыгод позиции ферзя на h8 или что фигура может быть сильнее четырёх пешек. Причина проигрыша не в этом.
     
  4. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Круто! Стокфиш, оказывается, сильнее АльфыЗеры играет.
     
  5. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    Vladruss, арифметика не врёт
    А то тут все рассуждают про нейросети с умным видом, а суть в другом
    Альфа ПОКА слабее
     
  6. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Комсюк, а у вас какая глубина была? У меня он тоже Kc4 долго показывал. Но там и так, и так проиграно было.
     
  7. vsvor
    Оффлайн

    vsvor Новичок

    Репутация:
    0
    Еще раз: графические процессоры _уже_ неплохо работают с нейросетями. Лучший массовый графический чип в несколько раз слабее тензорного, но это потому, что графика затачивается под 32-битовые числа, а чипы для машинного обучения - под 16 бит, и потому, что конвееры GPU устроены намного сложнее. Адаптированный вариант AZ вряд ли сможет играть в такую же силу на машине с 1080 Ti (хотя кто знает), но и 64 ядер на массовых компьютерах пока еще нет. А вот через пару поколений графических чипов, весьма вероятно, жить станет проще.
     
    Undying likes this.
  8. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Теоретически. А фактически мы наблюдаем уверенную игру Зерушки.
    Анекдот напомнить про теоретическую вероятность и фактическую реальность?
     
  9. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    если в несколько раз слабее, этого будет достаточно, чтобы проигрывать SF. Да и не у каждого сейчас есть мощная видеокарта. Но то, что нейросети для шахматных движков будут актуальны - это точно. Также, возможно, нейросети помогут просчитать 8-фигурные базы, используя хитрое сжатие похожих позиций. Я, конечно, не уверен здесь.
     
  10. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    42 вроде, у тебя комп мощней, тебе не надо полчаса держать
    —- добавлено: 11 Dec 2017 —-
    я бы тебя послал подальше, но ты давний приятель...
    Пойди ближе, к "лунатикам" - отведи душу
     
  11. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Комсюк, у меня ещё компиляция собственная. Обычный SF медленнее работает. Хеш 4 Гб поставил. Но если бы я ещё оставил его думать, он бы мог опять к Kc4 вернуться. Так что разменивание фигуры на 2 пешки было плохим решением.
     
  12. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    "Боксера каждый обидеть может. Но не каждый успеет извиниться" © Костя Дзю.
     
  13. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    sovaz1997, неправильно :facepalm2:
    Ставь Стокфиш 8 официальный!

    Мы же не улучшаем его игру в матче, а проверяем, его ли ходы
    Хотя для меня очевидно, что его
    Какой смысл палиться Гуглу, выставляя ослабленную версию, если куча народу будет проверять партии?
     
  14. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Нельзя бездумно переносить преимущество от книги при игре против своих копий на игры против других программ (особенно сильно отличающихся). Так же как и лишнее ядро, книга особенно полезна в первом случае.
    Вообще, я тоже думаю, что с книгой Стокфиш выиграл бы (иначе ее не отнимали бы). Но вот на сколько - неизвестно. Многое бы прояснили не выложенные партии. Если там, например, из оставшихся 18 побед 15 во французкой с небольшими вариациями, это один разговор, если все партии разные - другой.
     
  15. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    а ты трубой этого Костю из-за угла... и фактически ты выиграл
    А пока он будет лежать в коме, ты ему анек расскажи
     
    Vladruss likes this.
  16. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    N1mTzo, sovaz1997 and Gridnev like this.
  17. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    я это знаю..
    Это был гротеск :)
    Предложите умный перенос
    —- добавлено: 11 Dec 2017 —-
    Если не во французской, то в этом же варианте новоиндийки, в этом уверен на 99%
    Рандомность у Стока есть, но она проявится уже тогда, когда поза "готова" и игра идёт на два результата
    —- добавлено: 11 Dec 2017 —-
    Там много партий-близнецов, поэтому легко объяснить, что выложили только 10
     
    Last edited: 11 Dec 2017
  18. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Все совпадает. Если несовпадает, я проверяю 8-й версией :).
     
  19. vsvor
    Оффлайн

    vsvor Новичок

    Репутация:
    0
    Не факт. До сих пор классическим движкам уделялось на порядки больше внимания. Как оно будет, когда фокус сместится на нейросети, и когда их заоптимизируют - кто его знает. Так было с го: против Седоля играли на 64 TPU, но новая версия победила всухую предыдущую, обходясь 4 TPU.

    Конечно, проблема еще в том, что _для игры_ может быть достаточно видеокарты, но для обучения потребуется как минимум программа распределенных вычислений.

    Есть другая причина. Возможно, создателям хотелось посмотреть на шахматы без какого-либо предварительного знания о дебютах с обеих сторон и проверить, не появится ли что-нибудь вовсе неизвестное. Типа выгодной вариации в дебюте Гроба. :gigi: И нет бы найти вариант новоиндийской до того, как он стал модным - теперь многие не верят, что это не было подстроено. :gigi:
     
  20. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Но ход Rf8 был слабый (там, где ферзь загнан в угол). Думаю, это все коллизии хеша.
    —- добавлено: 11 Dec 2017 —-
    Уже в SF пытаются это внедрять. Думаю, нас ждут изменения в движках. Надеюсь, что в следующем TCEC будет хоть какой-то движок на основе нейросети. Пусть он будет и не самым сильным, не важно.
     
    Last edited: 11 Dec 2017
  21. Neo94
    Оффлайн

    Neo94 Учаcтник

    Репутация:
    -10
    Для такого и дают адекватный контроль времени - ну там час на партию, хотя бы.
    А не минута на ход...
     
  22. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    Rf8
     
    sovaz1997 likes this.
  23. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Это только тесты могут показать.
    В общем, это не имеет большого значения. Альфа-бета нормально не масштабируется на много потоков. Нейросети - масштабируются очень хорошо. А учитывая, что гигагерцы в ближайшее время расти не будут (в отличие от количества ядер), ясно, какое направление перспективней, и Гугл показал, что успех возможен. Значит через месяц или через год появится версия для обычных видеокарт, которые в магазине можно купить. Может от Гугл, может от кого-нибудь другого.
     
  24. FIBM
    Оффлайн

    FIBM Учаcтник

    Репутация:
    7
    Вы работаете в науке, или так лишь бы с апломбом что-нибудь написать? Эта работа слишком серьезная, чтобы ее публиковать в левом журнале, а в "приличном журнале" должна пройти рецензии специалистов. Так что проблем нет.
    —- добавлено: 11 Dec 2017 —-
    Понял, вы вообще в этом ничего НЕ понимаете.
     
  25. N1mTzo
    Оффлайн

    N1mTzo Учаcтник

    Репутация:
    1
    Не стал бы в лоб сравнивать перебор разных движков (если A0 можно к ним отнести), использующих разные алгоритмы. Тем более после той истории с Райлихом и его Рыбкой, которая считала одно кол-во позиций, а выводила на экран совсем другое. Да и смысл этих цифр какой? Важна ИМХО эффективность, масштабируемость и , самое главное, сила игры в шахматы У Вяленого большАя часть этих пресловутых "килоноденсов"- это по сути мусор из-за особенностей алгоритма при распараллеливании потоков. А у А0 что "под капотом" мало кто знает, реально не хватает человека, который бы "разложил" по полочкам особенности архитектуры А0 (и всего остального) для простого смертного.

    Для этого придется как минимум переписывать регламент (по сути создать новый), т.к. там все правила под обычное железо заточены.
     
  26. Baron
    Оффлайн

    Baron Учаcтник

    Репутация:
    11
    ...И он таки проиграл, даже на "том" компе. Стокфишу однозначно надо дать фору по времени, ибо нейросеть за 1 минуту находит исключительно глубокие идеи, недоступные для терминатора Т-100.
    Самое забавное, что если поменять соперников местами после дебюта, то Альфазеро, скорее всего, все равно будет уделывать Стокфиша. Грубая аналогия - мастер черными в латышском гамбите обыграет кандидата в мастера. И кстати это идея:) заставить Альфу играть плохие варианты в дебюте. Посмотрел бы как нового бога опускают на землю обычные железяки. А с лишним конем даже я обыграл бы боженьку (правда не уверен, но с лишним ферзем - это точно).:)
     
  27. N1mTzo
    Оффлайн

    N1mTzo Учаcтник

    Репутация:
    1
    Полистал твиттер Демиса и убедился, что даже победа над Седолем в го такого резонанса (при всем пиаре того матча) не вызвала ( такого количества ретвитов и комментариев) из-за, казалось бы, одной статьи на arxiv.org с десятком шахматных партий.
     
  28. vsvor
    Оффлайн

    vsvor Новичок

    Репутация:
    0
    Не обязательно плохие. Белыми у SF был приличный счет в сицилианке.[​IMG]
     
  29. FIBM
    Оффлайн

    FIBM Учаcтник

    Репутация:
    7
    А зачем нам "оценки железяки"? Мы что сами не видим, что стокфиш проигрывал всегда по одной и той же схеме: не развитость фигур . Если не знать, что играет машина, то любой тренер бы сказал: "Мальчик, фигуры нужно развивать!".:)
     
  30. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    Есть 7 (семь!) проигранных вашим богом партий в одном варианте сицилианки
    Но мы их не увидим
     
  31. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Интересно, почему Alpha Zero вообще проигрывал с таким уровнем позиционной игры. Возможно, где-то в тактике проссчитывался? Жалко, не дали нам эти партии.
     
  32. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    Вы неправильно трактуете таблицу... там победа Альфы 8-2
    А вот в Паульсене 7-3 в пользу Стока
     
  33. vsvor
    Оффлайн

    vsvor Новичок

    Репутация:
    0
    Да, я уже вспомнил.

    Ну, если посмотреть в статье, при обучении сицилианки было немного. Возможно, не хватало понимания дебюта, даже против SF без книги.
     
    sovaz1997 and Комсюк like this.
  34. Mellio
    Оффлайн

    Mellio Новичок

    Репутация:
    0
    Хотелось бы напомнить уважаемой аудитории, которая тут до хрипоты спорит как дебютная книга даёт +9000 ELO стокфишу, что в препринте приведена статистика по 10 самым популярным человеческим дебютам и в каждом из них A0 сыграла по 100 партий с вяленным (50 белыми и черными, то есть всего 1100 партий включая 100 партий матча со свободным дебютом). И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения. Более интересно, что эти 10 дебютов составляли не более 30 % партий в конце самообучения, то есть еще 70 % игр тренировалось что-то другое.

    И ELO рейтинг в шахматах "сжимается" при высоком уровне игры, так как ничейные тенденции все сильнее проявляются (это кстати в препринте отмечено). Такого например нет в Го, так как там нет ничьих в принципе.
     
    Gridnev likes this.
  35. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.266
    а Стокфиш не играл вообще
    -4 Альфы чёрными это просто уничтожение, да :)
    —- добавлено: 11 Dec 2017 —-
    ладно, пустое это... я ушёл