AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Что-то подобное MCTS появилось ещё лет десять назад, во времена третьей Рыбки и первых версий Аквариума. Рандомизированный анализ. Но для игры по каким-то причинам эти алгоритмы не очень подошли...
    Ещё вспоминается Берлинер с его Hitech, B*-search, а также семейство алгоритмов conspiracy search. Это всё 80-е...
    MS нравится это.
  2. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Valium Secret:
    Если забить в анализ на чесскоме любую партию из "Лондон чесс классик 2017", то неточностей и ошибок намного меньше чем сделал Стокфиш против АльфаЗеро.
    Получается что с такими настройками у стофиша любой толковый гроссмейстер выиграл бы...
  3. Котэ Восьмикратный чемпион подъезда

    • Участник
    • Старожил
    Рег.:
    30.04.2010
    Сообщения:
    987
    Симпатии:
    393
    Репутация:
    12
    Оффлайн
    А есть где-нибудь информация о железе на котором играл вяленый? А то некоторые его ходы и правда смотрятся так себе...
    А с другой стороны компания компания выпустившая alphazero весьма серьезна. У них сильнейшая в мире прога для го. Для них было бы неосмотрительно и даже попросту глупо запускать сток на чем-то откровенно слабом...
  4. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.903
    Симпатии:
    30.162
    Репутация:
    673
    Оффлайн
    Интересно, насколько вырос курс акций из-за этой "неосмотрительности и глупости"
  5. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Толстый намек на то, что они старый Сток по косточкам разбирали не один месяц и нашли в нем конкретные дыры :)
  6. Котэ Восьмикратный чемпион подъезда

    • Участник
    • Старожил
    Рег.:
    30.04.2010
    Сообщения:
    987
    Симпатии:
    393
    Репутация:
    12
    Оффлайн
    Ответить на этот вопрос не сложно. alphazero разрабатывала компания DeepMind. DeepMind с 2014 года принадлежит
    Google. Курс акций гугла вырос сегодня на 1,29 %, но вряд ли из-за шахматных успехов дочерней компании.
    —- добавлено: 7 дек 2017 —-
    Что это могло дать если alphazero тренировалась играя сама с собой, а не со стоком?
    В любом случае жду дополнительных тестов.
    Ведь это страшно и красиво, если нейросеть за 9 часов превзошла то, что люди создавали 60 лет.(В 1957 году Алексом Бернштейном была создана первая программа для игры на стандартной шахматной доске и при участии всех фигур)
    Нестор нравится это.
  7. Котэ Восьмикратный чемпион подъезда

    • Участник
    • Старожил
    Рег.:
    30.04.2010
    Сообщения:
    987
    Симпатии:
    393
    Репутация:
    12
    Оффлайн
    В любом случае, это очень красиво


    И ферзь с h8 не сможет вернуться в игру
    MS, nh2008 и 4547 нравится это.
  8. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    "...играл он тестовый матч в конце против SF8, +28-0=72, имел в своём распоряжении 4 TPU по 45 Терафлоп каждый, что примерно соответствует 360 самым мощным процессорам на данный момент, стокфиш 8 играл на 60 ядрах.
    .....
    Плюс похоже, что стокфиш пользовал 1 ГБ хэша, что ОЧЕНЬ мало для такого количества ядер... Что ещё занизило его результаты. Также не могу найти никаких упоминаний про эндшпильные таблицы" (из комментов в facebook Сутовского)


    Конечный итог был в пользу Альфы примерно на 100 эло, как посчитал Комс. Компьютерная мощность Альфы была в 100 с лишним раз больше (60 ядер Стока - это 3 самых мощных текущих проца). Между тем простое удвоение процессорной мощности дает движку как минимум 100 эло прибавки (тема обсуждалась в тут в одной из тем + я однажды лично задавал этот вопрос создателю Гудини, который говорил аж о +200). Умножаем, делим...
    Выходит, что на равном железе Сток был бы минимум на 500 Эло сильнее. Вот так-то, господа ИИ/нейросети.

    P.S. Комс ниже пишет о 50 Эло за одно удвоение. Выходит, Сток на равном железе сильнее только на 250 эло :)
    MS нравится это.
  9. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Ожидал Вашей реакции, только совсем не ожидал что будет отрицание.
    Железо у стокфиша было серверное, 64 ядра, гораздо мощнее любого домашнего пк
    —- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-
    То-есть если я на своем домашнем компе устрою матч Stockfish8 4cpu против Stockfish8 8cpu, результат будет 28-72-0 ? Что как раз эквивалентно разнице в 100 пунктов.
    Это просто смешно, попробуйте тогда сами.
    Кстати, сам Альфазеро просчитывал всего-навсего 80 килопозиций в секунду.

    Скорость железа ничто, алгоритм все.
  10. Котэ Восьмикратный чемпион подъезда

    • Участник
    • Старожил
    Рег.:
    30.04.2010
    Сообщения:
    987
    Симпатии:
    393
    Репутация:
    12
    Оффлайн
    Но ведь не до бесконечности же? Я в этом профан, но мне кажется, что график увеличения Эло в зависимости от мощности железа должен выглядеть не как график линейной функции, а как что-то наподобие y=корень из x. .Убежден, что даже если дать стоку 4 TPU по 45 Терафлоп он он от этого не заиграет на 4000 эло (добавлял по сто пунктов за каждое удвоение процессорной мощности)
  11. Zayats Без определенного статуса

    • Ветеран
    • Старожил
    Рег.:
    09.01.2007
    Сообщения:
    2.446
    Симпатии:
    1.651
    Репутация:
    156
    Оффлайн
    Пока наиболее любопытным фактом является сухой счет. Если сегодня у равных противников обычный расклад +10-9=81, а у отличающихся на разряд, скажем, +55-5=40, то для тяжеловесов ближайшего будущего можно ожидать +1-0=99 и +50-0=50 соответственно. Отсутствие поражений, согласно Апокалипсису Капабланки, ничто иное как четвертая печать - ничейная смерть на бледном коне. Конечно, по одному микроматчу преждевременно делать определенные выводы, я бы скорее предполагал встретить всадника на уровне 7 дана (около 4000 пунктов ЭЛО).

    Вот как выглядит мой прогноз. Если взять за точку отсчета -9 (ЭЛО 800, генератор случайных ходов) и откладывать по 200 пунктов, то в отрицательной части у нас будут любительские разряды: -5 - третий разряд, -2 - кмс и т.д. Затем тонкая полоска профессиональных шахмат, а на обратной стороне шкалы 9 дан - непобедимый движок. Вряд ли он сможет оценить произвольную позицию как 32-фигурная таблица, но из начального положения с любым противником будет держаться в серой ничейной зоне - вплоть до совершения оным ошибки.

    Engine.JPG

    На графике изображен рост силы наиболее мощной программы, в 90-ые компьютеры соревновались с профессионалами, далее стали бороться друг с другом, а людям давать фору. Если с 1970 по 1990 действовал закон Мура и быстродействие возросло в 1000 раз (что дало прибавку в 1000 пунктов), то сейчас темпы упали, быстродействие удваивается за три года. Т.е. в текущий момент мы должны увидеть 5 дан (ЭЛО 3600) - видимо, это и есть AlphaZero.

    Что произойдет в обозримом будущем? В 2035 году появится программа, которая во многих партиях будет действовать безукоризненно; в 2045 году - 8 дан, который станет стабильно держать белый цвет против идеального соперника.
    Konnifer, wentille, Любитель_ и 3 другим нравится это.
  12. 4547 Учаcтник

    • Участник
    Рег.:
    15.11.2016
    Сообщения:
    1.804
    Симпатии:
    1.808
    Репутация:
    138
    Оффлайн
    Неужели придется видоизменять шахматы после побед АльфаЗеро? :D

    Edwards, Любитель_, I0p3a и 2 другим нравится это.
  13. Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    Сейчас главное не результаты игр. Главное - демонстрация новых возможностей. Как минимум продемонстрирован альтернативный метод создания топовых движков. Очень перспективный. Метод, который вполне может стать и основным в ближайшие годы. Особенно если Гугл это направление не забросит. В любом случае будет интересно.
    Undying, Gridnev и Комсюк нравится это.
  14. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    3.502
    Симпатии:
    4.570
    Репутация:
    206
    Оффлайн
    А тем временем до этого в замке у Шефа...
    https://www.kommersant.ru/doc/3401255
  15. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    или ты забыл, или Роберт гонит :)
    Удвоение даёт приблизительно 50 Эло, проверено на движковых партиях плайчесса
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    тебе гвоздь в голову надо забить!
    На чесскоме такой же Сток анализирует партию за минуту, а в матче у него была минута на ход и 64 ядра
    Так кто кого должен анализировать?
    —- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-
    Удвоение скорости, а не мощности!
    Тем более, что удвоение мощности не даёт удвоение скорости
  17. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    3.502
    Симпатии:
    4.570
    Репутация:
    206
    Оффлайн
    Совсем народ обленился. :) Кто-нибудь уже пробовал хотя бы на домашнем компе оценить игру Стока в этом матче?
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    движковцы смотрели и ляпов пока не обнаружили...
    Предлагайте ходы, которые, по вашему мнению, не Стокфиша
    Они проверят :)
    я чуть выше предложил один, но при ближайшем рассмотрении там уже жбан у вяленого
  19. Michael-13 Господин

    • Участник
    • Старожил
    Рег.:
    18.11.2011
    Сообщения:
    3.068
    Симпатии:
    1.098
    Репутация:
    29
    Оффлайн
    Возможно свежие новости будут в комментариях на шахматных форумах мира:
    https://chess24.com/en/read/news/deepmind-s-alphazero-crushes-chess
    https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
    https://lichess.org/forum/general-c...e-deepminds-alpha-zero-beats-stockfish?page=1
    Или ждем официальные статьи и видео на сайте https://deepmind.com через несколько дней.
  20. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
    Нестор и vasa нравится это.
  21. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Так-то он обучался всего-лишь 4 часа без учителя, зная только правила.
    В январе они выкатят новую версию, которая обучалась месяц.
    А еще позже версию, работающую всего-лишь на нескольких видеокартах
    Gridnev нравится это.
  22. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.315
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    там же:
    One person that did comment to Chess.com has quite a lot of first-hand experience playing chess computers. GM Garry Kasparov is not surprised that DeepMind branched out from Go to chess.
    "It's a remarkable achievement, even if we should have expected it after AlphaGo," he told Chess.com. "It approaches the 'Type B,' human-like approach to machine chess dreamt of by Claude Shannon and Alan Turing instead of brute force."
    мой перевод:
  23. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.242
    Симпатии:
    21.128
    Репутация:
    627
    Адрес:
    Москва, Россия
    Оффлайн
    Моё отрицание связано только с игрой Стокфиша. ;)
    А АльфаЗеро действительно играл классно. Бесспорно!
    И это самое главное в данном матче.

    Интересно, какое железо использует этот монстр? Как организуется процесс?

    Х-ммм... Это важная информация.
    Правда, сейчас уже мало кто работает со Стокфиш-8. Народ в основном привлекает к анализу последние версии Стокфиша.
    Но разница между ними совсем невелика. Так что сути не меняет.
    Gridnev и sovaz1997 нравится это.
  24. Rooost Новичок

    • Новичок
    Рег.:
    23.08.2017
    Сообщения:
    85
    Симпатии:
    132
    Репутация:
    13
    Адрес:
    г. Хабаровск
    Оффлайн
    "brute force" имеется ввиду "перебор". Т.е. Сила алгоритма в том, что рассматривая меньшее количество позиций, Альфа показывает результаты лучше:
    АльфаЗеро рассматривает всего 80000 позиций в секунду, по сравнению с 70 миллионами позиций в секунду от Стокфиш.
    Нестор нравится это.
  25. pavelgttfj8 Учаcтник

    • Участник
    Рег.:
    07.12.2017
    Сообщения:
    290
    Симпатии:
    90
    Репутация:
    3
    Оффлайн
    Очень жду от вас видео-обзор. Особенно этой партии https://lichess.org/zbCOTavB#82
    Это очень интересно. Англоговорящие видеообзоршики не очень популярные, делали, там лайки просто зашкаливают.
    Оба играют без эндшпильных и дебютных баз, версия стокфиша - победитель 2016 tcec.
    1 мин/ход 4TPU ALphaZero против 64core Stockfish8
    Анализ железа:
    As far as I know 1 TPU has 8GB of memory and 180 teraflops: https://www.theinquirer.net/inquire...with-180-teraflop-max-out-for-ai-acceleration

    8 core high end cpu has 350 gigaflops
    Core i7 5960X (Haswell E)

    8 core @ 3.0GHz AVX2

    https://www.pugetsystems.com/labs/hpc/Linpack-performance-Haswell-E-Core-i7-5960X-and-5930K-594/

    So overall it is around:

    32 GB vs 1GB
    720 TF vs 2.9TF

    It looks like Deepmind hardware was more than 200 times stronger.
    Только вот если стокфиш заставить играть с самим собой где у одного компьютера будет железо хоть в 1000 раз мощнее, результата в 25-25-0 w-d-l за белых и близко не получится.
  26. puz78 Начинающий

    • Начинающий
    Рег.:
    14.04.2017
    Сообщения:
    2
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    А разве восьмая версия не последняя? На официальном сайте девятой нет.
  27. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.242
    Симпатии:
    21.128
    Репутация:
    627
    Адрес:
    Москва, Россия
    Оффлайн
    Читаю обсуждения нашумевшего матча АльфаЗеро - Стокфиш. Первое впечатление такое, что начинающий пилот на звездолёте обогнал Шумахера, который ехал на своём жалком Феррари.
    Остаётся непонятным, как именно работает эта нейронная сеть? Те объяснения на пальцах, которые я видел, приводят к новым вопросам.
    Для того, чтобы АльфаЗеро за ограниченное количество времени сыграл сам с собой огромное количество партий в выбранном направлении и потом на основе статистики выбрал лучшее продолжение, ему необходим суперкомпьютер, гигантские возможности.
    Плюс хороший, толковый шахматный движок.
    Но раньше, насколько я знаю, не могли, не умели запускать движки на суперкомпах, не было такой возможности. Теперь, стало быть, нашли?
    Но в целом получается, что если мы на место этого внутреннего движка нейронной сети (который видимо, сам по себе весьма скромен) поместим самого Стокфиша, то получится МегаАльфаЗеро. Непобедимый монстр!
    И если Гугл начнёт сдавать свою монстру в аренду шахматистам-аналитикам, то мы в самое ближайшее время увидим кардинальные изменения в шахматной теории. Некоторые варианты будут закрыты, покажется дно на многих, прежде как будто бездонных направлениях.
    Впрочем, я не вижу в этом ничего страшного.
    Всё равно мало кто сможет запомнить хоть малую часть этих анализов. Шахматисты будут идти на партию с опухшими от обилия вариантов головами.
    А более сильные шахматисты будут умело уклоняться от актуальных компьютерных продолжений - и играть в шахматы.
    Так что не помрём...
  28. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    спорное утверждение... Это всего лишь 190 Эло!
    Результат может быть и разгромнее
  29. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.242
    Симпатии:
    21.128
    Репутация:
    627
    Адрес:
    Москва, Россия
    Оффлайн
    Помилуйте... Какой такой официальный сайт?
    Народ активно разрабатывает Стокфиш и каждый месяц выкладывает свои результаты. Которые любой из нас может бесплатно скачивать и использовать.
    Вот... Рекомендую: Stockfish Development Versions
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    http://abrok.eu/stockfish/
    —- добавлено: 7 дек 2017 —-
    каждый день :)
  31. Rooost Новичок

    • Новичок
    Рег.:
    23.08.2017
    Сообщения:
    85
    Симпатии:
    132
    Репутация:
    13
    Адрес:
    г. Хабаровск
    Оффлайн
    Я вот сам ещё не осознал всего этого. Но что, если это действительно инновационный подход к игре в шахматы. Не математическая оценка, как мы привыкли и, кажется, уже не можем ничего представить, а более тонкая материя, которую мы представить себе не можем ввиду ограниченности нашего белкового мозга? Т.е. нейросеть чувствует фигуры на другом, более высоком уровне абстракции... Немножко изотерики вам на размышление :)
    Любитель_ нравится это.
  32. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.242
    Симпатии:
    21.128
    Репутация:
    627
    Адрес:
    Москва, Россия
    Оффлайн
    Нет, нет, не надо изотерики.
    Мы, физики, привыкли к более земным и логичным материям. И объяснениям происходящего. :)
  33. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    3.502
    Симпатии:
    4.570
    Репутация:
    206
    Оффлайн


    Не поленился, запустил чессбейз. Это не Стокфиш играл, тут уже нет сомнений. Обычная разводка.
    Gridnev и Challenger Spy нравится это.
  34. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    книг не было :rtfm:

    у тебя 64 ядра?

    какое время анализа у тебя при поиске ошибок?
    DraggonZ нравится это.
  35. ZenDisciple Начинающий

    • Начинающий
    Рег.:
    07.12.2017
    Сообщения:
    7
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Как я понимаю, нейронная сеть работает примерно как мозг, но с вычислительными способностями компьютера. То есть, представить себе приличного гроссмейстера, который способен все варианты досчитать до конца, при этом видит все дебютные и эндшпильные тонкости и считает варианты только при необходимости, а не полным перебором.

Поделиться этой страницей