AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Что-то подобное MCTS появилось ещё лет десять назад, во времена третьей Рыбки и первых версий Аквариума. Рандомизированный анализ. Но для игры по каким-то причинам эти алгоритмы не очень подошли...
    Ещё вспоминается Берлинер с его Hitech, B*-search, а также семейство алгоритмов conspiracy search. Это всё 80-е...
     
    MS нравится это.
  2. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Команда форума

    Репутация:
    226
    Valium Secret:
    Если забить в анализ на чесскоме любую партию из "Лондон чесс классик 2017", то неточностей и ошибок намного меньше чем сделал Стокфиш против АльфаЗеро.
    Получается что с такими настройками у стофиша любой толковый гроссмейстер выиграл бы...
     
  3. Котэ
    Оффлайн

    Котэ Восьмикратный чемпион подъезда

    Репутация:
    12
    А есть где-нибудь информация о железе на котором играл вяленый? А то некоторые его ходы и правда смотрятся так себе...
    А с другой стороны компания компания выпустившая alphazero весьма серьезна. У них сильнейшая в мире прога для го. Для них было бы неосмотрительно и даже попросту глупо запускать сток на чем-то откровенно слабом...
     
  4. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    673
    Интересно, насколько вырос курс акций из-за этой "неосмотрительности и глупости"
     
  5. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Команда форума

    Репутация:
    226
    Толстый намек на то, что они старый Сток по косточкам разбирали не один месяц и нашли в нем конкретные дыры :)
     
  6. Котэ
    Оффлайн

    Котэ Восьмикратный чемпион подъезда

    Репутация:
    12
    Ответить на этот вопрос не сложно. alphazero разрабатывала компания DeepMind. DeepMind с 2014 года принадлежит
    Google. Курс акций гугла вырос сегодня на 1,29 %, но вряд ли из-за шахматных успехов дочерней компании.
    —- добавлено: 7 дек 2017 —-
    Что это могло дать если alphazero тренировалась играя сама с собой, а не со стоком?
    В любом случае жду дополнительных тестов.
    Ведь это страшно и красиво, если нейросеть за 9 часов превзошла то, что люди создавали 60 лет.(В 1957 году Алексом Бернштейном была создана первая программа для игры на стандартной шахматной доске и при участии всех фигур)
     
    Последнее редактирование: 7 дек 2017
    Нестор нравится это.
  7. Котэ
    Оффлайн

    Котэ Восьмикратный чемпион подъезда

    Репутация:
    12
    В любом случае, это очень красиво


    И ферзь с h8 не сможет вернуться в игру
     
    MS, nh2008 и 4547 нравится это.
  8. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Команда форума

    Репутация:
    226
    "...играл он тестовый матч в конце против SF8, +28-0=72, имел в своём распоряжении 4 TPU по 45 Терафлоп каждый, что примерно соответствует 360 самым мощным процессорам на данный момент, стокфиш 8 играл на 60 ядрах.
    .....
    Плюс похоже, что стокфиш пользовал 1 ГБ хэша, что ОЧЕНЬ мало для такого количества ядер... Что ещё занизило его результаты. Также не могу найти никаких упоминаний про эндшпильные таблицы" (из комментов в facebook Сутовского)


    Конечный итог был в пользу Альфы примерно на 100 эло, как посчитал Комс. Компьютерная мощность Альфы была в 100 с лишним раз больше (60 ядер Стока - это 3 самых мощных текущих проца). Между тем простое удвоение процессорной мощности дает движку как минимум 100 эло прибавки (тема обсуждалась в тут в одной из тем + я однажды лично задавал этот вопрос создателю Гудини, который говорил аж о +200). Умножаем, делим...
    Выходит, что на равном железе Сток был бы минимум на 500 Эло сильнее. Вот так-то, господа ИИ/нейросети.

    P.S. Комс ниже пишет о 50 Эло за одно удвоение. Выходит, Сток на равном железе сильнее только на 250 эло :)
     
    Последнее редактирование: 7 дек 2017
    MS нравится это.
  9. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Ожидал Вашей реакции, только совсем не ожидал что будет отрицание.
    Железо у стокфиша было серверное, 64 ядра, гораздо мощнее любого домашнего пк
    —- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-
    То-есть если я на своем домашнем компе устрою матч Stockfish8 4cpu против Stockfish8 8cpu, результат будет 28-72-0 ? Что как раз эквивалентно разнице в 100 пунктов.
    Это просто смешно, попробуйте тогда сами.
    Кстати, сам Альфазеро просчитывал всего-навсего 80 килопозиций в секунду.

    Скорость железа ничто, алгоритм все.
     
  10. Котэ
    Оффлайн

    Котэ Восьмикратный чемпион подъезда

    Репутация:
    12
    Но ведь не до бесконечности же? Я в этом профан, но мне кажется, что график увеличения Эло в зависимости от мощности железа должен выглядеть не как график линейной функции, а как что-то наподобие y=корень из x. .Убежден, что даже если дать стоку 4 TPU по 45 Терафлоп он он от этого не заиграет на 4000 эло (добавлял по сто пунктов за каждое удвоение процессорной мощности)
     
    Последнее редактирование: 7 дек 2017
  11. Zayats
    Оффлайн

    Zayats Без определенного статуса

    Репутация:
    156
    Пока наиболее любопытным фактом является сухой счет. Если сегодня у равных противников обычный расклад +10-9=81, а у отличающихся на разряд, скажем, +55-5=40, то для тяжеловесов ближайшего будущего можно ожидать +1-0=99 и +50-0=50 соответственно. Отсутствие поражений, согласно Апокалипсису Капабланки, ничто иное как четвертая печать - ничейная смерть на бледном коне. Конечно, по одному микроматчу преждевременно делать определенные выводы, я бы скорее предполагал встретить всадника на уровне 7 дана (около 4000 пунктов ЭЛО).

    Вот как выглядит мой прогноз. Если взять за точку отсчета -9 (ЭЛО 800, генератор случайных ходов) и откладывать по 200 пунктов, то в отрицательной части у нас будут любительские разряды: -5 - третий разряд, -2 - кмс и т.д. Затем тонкая полоска профессиональных шахмат, а на обратной стороне шкалы 9 дан - непобедимый движок. Вряд ли он сможет оценить произвольную позицию как 32-фигурная таблица, но из начального положения с любым противником будет держаться в серой ничейной зоне - вплоть до совершения оным ошибки.

    Engine.JPG

    На графике изображен рост силы наиболее мощной программы, в 90-ые компьютеры соревновались с профессионалами, далее стали бороться друг с другом, а людям давать фору. Если с 1970 по 1990 действовал закон Мура и быстродействие возросло в 1000 раз (что дало прибавку в 1000 пунктов), то сейчас темпы упали, быстродействие удваивается за три года. Т.е. в текущий момент мы должны увидеть 5 дан (ЭЛО 3600) - видимо, это и есть AlphaZero.

    Что произойдет в обозримом будущем? В 2035 году появится программа, которая во многих партиях будет действовать безукоризненно; в 2045 году - 8 дан, который станет стабильно держать белый цвет против идеального соперника.
     
    Konnifer, wentille, Любитель_ и 3 другим нравится это.
  12. 4547
    Оффлайн

    4547 Учаcтник

    Репутация:
    138
    Неужели придется видоизменять шахматы после побед АльфаЗеро? :D

     
    Edwards, Любитель_, I0p3a и 2 другим нравится это.
  13. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Сейчас главное не результаты игр. Главное - демонстрация новых возможностей. Как минимум продемонстрирован альтернативный метод создания топовых движков. Очень перспективный. Метод, который вполне может стать и основным в ближайшие годы. Особенно если Гугл это направление не забросит. В любом случае будет интересно.
     
    Undying, Gridnev и Комсюк нравится это.
  14. ШахматыЭтоДиагноз
    Оффлайн

    ШахматыЭтоДиагноз Учаcтник

    Репутация:
    206
    А тем временем до этого в замке у Шефа...
    https://www.kommersant.ru/doc/3401255
     
  15. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    или ты забыл, или Роберт гонит :)
    Удвоение даёт приблизительно 50 Эло, проверено на движковых партиях плайчесса
     
  16. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    тебе гвоздь в голову надо забить!
    На чесскоме такой же Сток анализирует партию за минуту, а в матче у него была минута на ход и 64 ядра
    Так кто кого должен анализировать?
    —- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-
    Удвоение скорости, а не мощности!
    Тем более, что удвоение мощности не даёт удвоение скорости
     
  17. ШахматыЭтоДиагноз
    Оффлайн

    ШахматыЭтоДиагноз Учаcтник

    Репутация:
    206
    Совсем народ обленился. :) Кто-нибудь уже пробовал хотя бы на домашнем компе оценить игру Стока в этом матче?
     
  18. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    движковцы смотрели и ляпов пока не обнаружили...
    Предлагайте ходы, которые, по вашему мнению, не Стокфиша
    Они проверят :)
    я чуть выше предложил один, но при ближайшем рассмотрении там уже жбан у вяленого
     
    Последнее редактирование: 7 дек 2017
  19. Michael-13
    Оффлайн

    Michael-13 Господин

    Репутация:
    29
    Возможно свежие новости будут в комментариях на шахматных форумах мира:
    https://chess24.com/en/read/news/deepmind-s-alphazero-crushes-chess
    https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
    https://lichess.org/forum/general-c...e-deepminds-alpha-zero-beats-stockfish?page=1
    Или ждем официальные статьи и видео на сайте https://deepmind.com через несколько дней.
     
  20. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    https://www.chess.com/news/view/google-s-alphazero-destroys-stockfish-in-100-game-match
     
    Нестор и vasa нравится это.
  21. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Так-то он обучался всего-лишь 4 часа без учителя, зная только правила.
    В январе они выкатят новую версию, которая обучалась месяц.
    А еще позже версию, работающую всего-лишь на нескольких видеокартах
     
    Gridnev нравится это.
  22. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    там же:
    One person that did comment to Chess.com has quite a lot of first-hand experience playing chess computers. GM Garry Kasparov is not surprised that DeepMind branched out from Go to chess.
    "It's a remarkable achievement, even if we should have expected it after AlphaGo," he told Chess.com. "It approaches the 'Type B,' human-like approach to machine chess dreamt of by Claude Shannon and Alan Turing instead of brute force."
    мой перевод:
     
  23. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    626
    Моё отрицание связано только с игрой Стокфиша. ;)
    А АльфаЗеро действительно играл классно. Бесспорно!
    И это самое главное в данном матче.

    Интересно, какое железо использует этот монстр? Как организуется процесс?

    Х-ммм... Это важная информация.
    Правда, сейчас уже мало кто работает со Стокфиш-8. Народ в основном привлекает к анализу последние версии Стокфиша.
    Но разница между ними совсем невелика. Так что сути не меняет.
     
    Gridnev и sovaz1997 нравится это.
  24. Rooost
    Оффлайн

    Rooost Новичок

    Репутация:
    13
    "brute force" имеется ввиду "перебор". Т.е. Сила алгоритма в том, что рассматривая меньшее количество позиций, Альфа показывает результаты лучше:
    АльфаЗеро рассматривает всего 80000 позиций в секунду, по сравнению с 70 миллионами позиций в секунду от Стокфиш.
     
    Нестор нравится это.
  25. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Очень жду от вас видео-обзор. Особенно этой партии https://lichess.org/zbCOTavB#82
    Это очень интересно. Англоговорящие видеообзоршики не очень популярные, делали, там лайки просто зашкаливают.
    Оба играют без эндшпильных и дебютных баз, версия стокфиша - победитель 2016 tcec.
    1 мин/ход 4TPU ALphaZero против 64core Stockfish8
    Анализ железа:
    As far as I know 1 TPU has 8GB of memory and 180 teraflops: https://www.theinquirer.net/inquire...with-180-teraflop-max-out-for-ai-acceleration

    8 core high end cpu has 350 gigaflops
    Core i7 5960X (Haswell E)

    8 core @ 3.0GHz AVX2

    https://www.pugetsystems.com/labs/hpc/Linpack-performance-Haswell-E-Core-i7-5960X-and-5930K-594/

    So overall it is around:

    32 GB vs 1GB
    720 TF vs 2.9TF

    It looks like Deepmind hardware was more than 200 times stronger.
    Только вот если стокфиш заставить играть с самим собой где у одного компьютера будет железо хоть в 1000 раз мощнее, результата в 25-25-0 w-d-l за белых и близко не получится.
     
  26. puz78
    Оффлайн

    puz78 Начинающий

    Репутация:
    0
    А разве восьмая версия не последняя? На официальном сайте девятой нет.
     
  27. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    626
    Читаю обсуждения нашумевшего матча АльфаЗеро - Стокфиш. Первое впечатление такое, что начинающий пилот на звездолёте обогнал Шумахера, который ехал на своём жалком Феррари.
    Остаётся непонятным, как именно работает эта нейронная сеть? Те объяснения на пальцах, которые я видел, приводят к новым вопросам.
    Для того, чтобы АльфаЗеро за ограниченное количество времени сыграл сам с собой огромное количество партий в выбранном направлении и потом на основе статистики выбрал лучшее продолжение, ему необходим суперкомпьютер, гигантские возможности.
    Плюс хороший, толковый шахматный движок.
    Но раньше, насколько я знаю, не могли, не умели запускать движки на суперкомпах, не было такой возможности. Теперь, стало быть, нашли?
    Но в целом получается, что если мы на место этого внутреннего движка нейронной сети (который видимо, сам по себе весьма скромен) поместим самого Стокфиша, то получится МегаАльфаЗеро. Непобедимый монстр!
    И если Гугл начнёт сдавать свою монстру в аренду шахматистам-аналитикам, то мы в самое ближайшее время увидим кардинальные изменения в шахматной теории. Некоторые варианты будут закрыты, покажется дно на многих, прежде как будто бездонных направлениях.
    Впрочем, я не вижу в этом ничего страшного.
    Всё равно мало кто сможет запомнить хоть малую часть этих анализов. Шахматисты будут идти на партию с опухшими от обилия вариантов головами.
    А более сильные шахматисты будут умело уклоняться от актуальных компьютерных продолжений - и играть в шахматы.
    Так что не помрём...
     
  28. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    спорное утверждение... Это всего лишь 190 Эло!
    Результат может быть и разгромнее
     
  29. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    626
    Помилуйте... Какой такой официальный сайт?
    Народ активно разрабатывает Стокфиш и каждый месяц выкладывает свои результаты. Которые любой из нас может бесплатно скачивать и использовать.
    Вот... Рекомендую: Stockfish Development Versions
     
  30. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    http://abrok.eu/stockfish/
    —- добавлено: 7 дек 2017 —-
    каждый день :)
     
  31. Rooost
    Оффлайн

    Rooost Новичок

    Репутация:
    13
    Я вот сам ещё не осознал всего этого. Но что, если это действительно инновационный подход к игре в шахматы. Не математическая оценка, как мы привыкли и, кажется, уже не можем ничего представить, а более тонкая материя, которую мы представить себе не можем ввиду ограниченности нашего белкового мозга? Т.е. нейросеть чувствует фигуры на другом, более высоком уровне абстракции... Немножко изотерики вам на размышление :)
     
    Любитель_ нравится это.
  32. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    626
    Нет, нет, не надо изотерики.
    Мы, физики, привыкли к более земным и логичным материям. И объяснениям происходящего. :)
     
  33. ШахматыЭтоДиагноз
    Оффлайн

    ШахматыЭтоДиагноз Учаcтник

    Репутация:
    206


    Не поленился, запустил чессбейз. Это не Стокфиш играл, тут уже нет сомнений. Обычная разводка.
     
    Gridnev и Challenger Spy нравится это.
  34. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    книг не было :rtfm:

    у тебя 64 ядра?

    какое время анализа у тебя при поиске ошибок?
     
    DraggonZ нравится это.
  35. ZenDisciple
    Оффлайн

    ZenDisciple Начинающий

    Репутация:
    0
    Как я понимаю, нейронная сеть работает примерно как мозг, но с вычислительными способностями компьютера. То есть, представить себе приличного гроссмейстера, который способен все варианты досчитать до конца, при этом видит все дебютные и эндшпильные тонкости и считает варианты только при необходимости, а не полным перебором.