AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. warrior Учаcтник

    • Участник
    Рег.:
    08.12.2009
    Сообщения:
    224
    Симпатии:
    150
    Репутация:
    10
    Оффлайн
    Полагаю, что условный Каруана, в предверии ТП, не может себя успокаивать "До шахмат им (=Google) дела нет, побаловались и бросят".

    Равновесие нарушено и нарушено сильно!

    Если раньше у всех гроссов на компах были условные Рыбки и Стокфиши и все были примерно ~в равных условиях, то теперь известно, что на планете Земля существует место (уникальное! единственное!) где можно получить уникальный аналитический материал (=ну скажем, 200 партий) например на тему "Закрываем белыми вопрос с французской защитой раз и навсегда".

    Я полагаю, что претенденты и их команды сейчас места себе не находят и думают что делать - т.е. как получить этот ресурс в свое распоряжение, пусть всего лишь на N часов, но получить. Какие задействовать политические, финансовые, репутационные рычаги ...

    Я также полагаю, что Гугл _поможет_ "правильному" кандидату. А что касается Крамника, Карякина и Грищука - ну, мы можем окропить их святой водой ... :(
    —- добавлено: 9 дек 2017 —-
    И наверное, пора перестать мечтать что корона "вернется в Россию". Либо духовные скрепы, либо ИИ ...
    felagund08 нравится это.
  2. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Нет перевеса по мощности. Стокфиш и Альфа Зеро это два принципиально разных подхода к решению задачи. Их бессмысленно по флопсам сравнивать. Смысл имеет оценка по энергопотреблению/стоимости. А в этом плане железо было примерно равное.
    thenewone и felagund08 нравится это.
  3. Vertu Учаcтник

    • Участник
    Рег.:
    22.12.2006
    Сообщения:
    932
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Неужели? Сравните-ка по стоимости 2 Xeon'a с 4 TPU второго поколения.
  4. longinean Учаcтник

    • Участник
    Рег.:
    12.04.2015
    Сообщения:
    1.446
    Симпатии:
    4.845
    Репутация:
    101
    Нарушения:
    22
    Оффлайн
    Как раз сравнение энергопотребления лишено всякого смысла. Performance-per-watt у TPU в 196 раз выше, чем у CPU. Что они добились таких энергосберегающих показателей - это они, конечно, молодцы, но это должно интересовать только интересующихся достижениями компьютерных железячников, а не достижениями в создании шахматных алгоритмов. Сравнивать программы надо при равном перформансе, какой бы у них там ни был разный подход, и сколько бы ватт ни жрало их железо
    [​IMG]
    Challenger Spy и sovaz1997 нравится это.
  5. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Процессор Intel Core i7 имеет производительность порядка 150-200 гигафлопсов. Видеокарта Nvidia GeForce GTX 1080 имеет производительность 9 терафлопсов. Стоимость процессора и видеокарты при этом примерно одинакова 400-600 баксов. То есть видеокарты в силу в своей заточенности на флопсы (по сути кроме операций над числами с плавающей точкой они больше ничего делать не умеют) имеют преимущество в производительности по этому показателю как раз где-то в 70 раз.
    —- добавлено: 9 дек 2017 —-
    Это личные проблемы Стокфиша, что он требует для работы полноценного процессора, а на железе заточенном под флопсы (грубо говоря на видеокарте) работать не способен в принципе.
  6. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Вопрос, а нужен ли им этот TCEC в принципе? С го, там всё понятно было, ИИ победил топовых белковых игроков, собрал кучу медиа, рекламы и известности. С шахматами такое уже невозможно, победа над тем же Магнусом ничего не докажет, т.к. люди уже долгие годы слабее движков, никого этим не удивишь. А что им (DeepMind) даст публичная победа (еще одна) над тем же Вяленым? Мне кажется, Свидлер правильные слова сказал, что им (DeepMind) шахматы по большему счету не сильно интересны, так, одна из множества игр для применения (и тестирования) их A0, не более. И даже деньги (некий призовой фонд) их не заинтересует, т.к. Гугл не нуждается в этих деньгах.
  7. GKA Старожил

    • Участник
    • Старожил
    Рег.:
    05.11.2009
    Сообщения:
    636
    Симпатии:
    138
    Репутация:
    3
    Оффлайн
    Вроде же разжевали этот вопрос на других ресурсах...
    Обрезанный везде Сток против супержелеза...
    И всего то превосходство единиц на 100 рейтинга...
    Challenger Spy нравится это.
  8. longinean Учаcтник

    • Участник
    Рег.:
    12.04.2015
    Сообщения:
    1.446
    Симпатии:
    4.845
    Репутация:
    101
    Нарушения:
    22
    Оффлайн
    У Стокфиша вообще нет никаких проблем. Проблемы возникают у тех, кто хочет сравнивать силу программ (именно софта, а не железа), работающих на разных платформах. С видеокартами тут как раз все ясно. Все программы, пытавшиеся их использовать, гораздо слабее Стокфиша, несмотря на более высокую производительность gpu.
    thenewone нравится это.
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    Туда он ткнул
    При вводе "одним щелчком" в оболочке Фритц ходит фигура, ходившая последней
    Т.е. клик по полю f8 приведёт к ходу ладьёй
    Любитель_ и Challenger Spy нравится это.
  10. Котэ Восьмикратный чемпион подъезда

    • Участник
    Рег.:
    29.04.2010
    Сообщения:
    986
    Симпатии:
    384
    Репутация:
    12
    Оффлайн
    Alphazero кроме основного зачета играла со стоком и набор популярных дебютных табий. Например вот в этой всем известной позиции:

    Статистика следующая 27/22/1, b 6/44/0 т е A0 набрал 38 очков из 50 белыми и 28 из 50 черными.
    Во всех прочих табиях, от ферзевого гамбита до Каро-Канна перевес также был на стороне A0. Так что причина поражения стока не в том, что он спамил неудачный вариант новоиндийки, а в том, что он хуже играет в шахматы. Блондин играет сильнее брюнета и никаким железом или дебютами изменить этого нельзя.
    Undying нравится это.
  11. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.435
    Симпатии:
    1.977
    Репутация:
    103
    Адрес:
    Заир
    Онлайн
    У меня всё более и более крепнет ощущение, что это скорее реклама, чем настоящая смена на шахматном престоле. Матч был закрытый, и это порождает тьму вопросов. Самыми серьёзными мне кажутся такие.

    1. Кто докажет, что АльфаЗеро вообще существует? Что это не какой-нибудь известный движок, который распараллелили на громадное количество процессов, переименовав по такому случаю?
    2. Кто докажет, что было сыграно 100 партий, а не 100 000? Это ведь самое простое: проиграть матч +24 - 20 000 = 80 000, а потом показать лишь 100 партий, +24 - 0 = 76. Ради рекламы-то самое оно.
    3. Отсутствие дебютной книжки у Стокфиша в условиях неравенства железа. Отсутствие книжки лишает его вариативности игры, т.е. надо просто нащупать вариант поострее, где превосходство в нодах будет сказываться. Дальше можно размножать такие победы, так как Стокфиш будет его раз за разом повторять.
    4. Стокфиш, по-видимому, был криво установлен, возможно где-то накосячили при распараллеливании на 64 ядра. Он делал слабые ходы, которые не воспроизводятся на персоналках (Crest уже нашёл ...c4 во французской, ...Rf8 с лишним качеством в новоиндисйской - на наших компах Стокфиш так слабо что-то не хочет играть).
    5. На TCEC или где-либо ещё мы АльфаЗеро не увидим. Позадавать ей вопросы у нас возможности не будет. Её небось разберут, как Дип Блю, под слова о пройденном этапе и неинтересности ещё раз доказывать что-то по новой. Информация строго дозирована, а воспринимать её предлагается на веру.

    Не уважаю такую позицию, когда от подобных вопросов отмахиваются под слова "мы не должны никому и ничего доказывать", и дальше пускаются в рассуждения о нейронных сетях и о будущем искусственного интеллекта.
    Любитель_, Challenger Spy и sovaz1997 нравится это.
  12. Экстремист Учаcтник

    • Участник
    Рег.:
    26.09.2006
    Сообщения:
    988
    Симпатии:
    67
    Репутация:
    11
    Оффлайн
    И что?Это вы к тому,что всё таки ошибка оператора?
  13. longinean Учаcтник

    • Участник
    Рег.:
    12.04.2015
    Сообщения:
    1.446
    Симпатии:
    4.845
    Репутация:
    101
    Нарушения:
    22
    Оффлайн
    Во-первых, табия так себе, почти начальная позиция. Во-вторых, тот же Стокфиш на 300 ядрах набрал бы против самого себя на 64 ядрах столько же или больше. Не потому, что лучше в шахматы играет, а потому, что железа больше. А в-третьих, с дебютной книгой набрал бы еще больше из такой табии
  14. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    2.192
    Симпатии:
    49
    Репутация:
    3
    Оффлайн
    Неудачные варианты, 1 гиг оперативки, 1 минута на ход и тд. - “С миру по нитке — голому рубаха
    Challenger Spy нравится это.
  15. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Речь о том, что переборные алгоритмы (Стокфиш в частности) на видеокартах работать эффективно не могут. Нейронные сети (и Альфа Зеро в частности) как раз под видеокарты заточены.
    —- добавлено: 9 дек 2017 —-
    К минуте на ход какие претензии? Обе программы были в равных условиях. И собственно вообще не факт, что это дало какое-то преимущество Альфа Зеро.
    N1mTzo нравится это.
  16. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    2.192
    Симпатии:
    49
    Репутация:
    3
    Оффлайн
    Вы когда последний раз играли с фиксированным временем на ход? Если ответ, "почти никогда не играл", то следующий вопрос: почему же все-таки в шахматном мире предпочитают играть, к примеру, 1+0, 3+0, 5+0, но никогда 1 сек на ход, 5 сек на ход, 10 сек на ход?
    Моя версия: Альфа Зеро хреново распределяет время на партию (Time management) и это нужно было нивелировать. Поэтому такая экзотика с контролем.
    Challenger Spy нравится это.
  17. Vertu Учаcтник

    • Участник
    Рег.:
    22.12.2006
    Сообщения:
    932
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    А в огороде - бузина. Причем тут вообще видеокарты, и их производительность? А0 играла на четырёх TPU, а не на видеокартах. Вы что, утверждаете, что они сравнимы по стоимости с двумя 32-ядерными CPU?
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    книга Brain от Зиппорта и +160 Эло в кармане
    Сток победил бы и на этом железе :)
    —- добавлено: 9 дек 2017 —-
    кстати, эта книга создаётся исключительно Стокфишем... пусть будет ну типа "тренировки Альфы"
    Challenger Spy и Fruit нравится это.
  19. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    дайте Вяленому книгу (им же созданную по методу Монте-Карло) и час на всю партию, а эта монстрила пусть себе думает по минуте на ход, и мы увидим, кто есть ху
    —- добавлено: 9 дек 2017 —-
    Но пасаран!
    Любитель_, Fruit и Challenger Spy нравится это.
  20. Vertu Учаcтник

    • Участник
    Рег.:
    22.12.2006
    Сообщения:
    932
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Пусть поставят перед Альфа0 задачу написать движок под винду/линукс сильнее Stockfish. Вот если она эту задачу решит - это уже будет похоже на ИИ.
  21. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    Тут я затрудняюсь придумать обвинение...
    Это гипотеза :)
  22. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    304
    Симпатии:
    64
    Репутация:
    0
    Оффлайн
    Ладно, пора вставить свои 5 копеек. Поначалу и я испытывал скепсис по поводу нового "гуру" шахматах. Думал дело в глубине, на которую (не) продвинулся Сток. Но действительно в одном из постов было показано, что Сток показывают нули (равенство) на большой глубине в проигранной позиции. Вот это удивило по настоящему. Значит есть проблемы в оценке позиции. Другими движками почти не пробовал, но по моему и они не блещут в этих позициях. А мы так привыкли доверять оценкам. Судя по описанным ресурсам Сток мог продвигаться на большую глубину (например 40 полуходов) даже за минуту (хотя конечно не факт). Нейросеть, как будто вскрыла непонимание движками некоторых позиций. И чем больше фигур на доске, тем больше непонимание. Понятно, что в позициях с более-менее простой структурой и малым количеством фигур нейросеть не выиграет, хоть ты тресни. В принципе дебют можно простить, да я и не видел больших ошибок в дебюте. Что теперь закрывать разыгранные варианты новоиндийки? Ну француженка была не на высоте, согласен. Ну а новый гуру видимо хорош. Раздвинул границы, хотя и до него некоторая искусственность в разыгрывании партии движками ощущалась. В общем явные недоработки в алгоритмах существующих движков надо подлатать и на время всё закончится.:)
  23. NoraNora Учаcтник

    • Участник
    Рег.:
    30.03.2013
    Сообщения:
    328
    Симпатии:
    221
    Репутация:
    7
    Оффлайн
    Первое что Стокфишу приходит в голову это как раз Rf8.

    Вложения:

    • m2PMVGV_saA.jpg
      m2PMVGV_saA.jpg
      Размер файла:
      313,6 КБ
      Просмотров:
      1.245
  24. Экстремист Учаcтник

    • Участник
    Рег.:
    26.09.2006
    Сообщения:
    988
    Симпатии:
    67
    Репутация:
    11
    Оффлайн
    Да хуже этот Стокфиш играет. Уже ясно всё. Ничего не поделаешь. Если дополнительно ему дать дебютную книгу, удобный контроль и ещё чего нибудь - всё равно толку не будет.
  25. Vertu Учаcтник

    • Участник
    Рег.:
    22.12.2006
    Сообщения:
    932
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Возможно, всё-таки у современных движков есть некоторые общеизвестные врожденные недостатки, которые трудно устранить в рамках текущей парадигмы построения шахматных алгоритмов. А у нейросети - другая парадигма, и пока неизвестно, какие у нее недостатки.
    —- добавлено: 9 дек 2017 —-
    И что? Стокфишу в матче давали минуту на ход на 64 (или 32?) ядрах. А вас одна секунда на одном ядре.
    sovaz1997 нравится это.
  26. NoraNora Учаcтник

    • Участник
    Рег.:
    30.03.2013
    Сообщения:
    328
    Симпатии:
    221
    Репутация:
    7
    Оффлайн
    Ну вот тут вот демонстрация, на какой глубине Стокфиш 8 понимает, что после Qf4 на доске не =, а всё намного хуже для чёрных. Аж в районе 37й.

    Вложения:

    • m2PMVGV_saA.jpg
      m2PMVGV_saA.jpg
      Размер файла:
      277,4 КБ
      Просмотров:
      930
  27. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Никто не докажет. Ваше личное право верить или не верить в данную информацию.

    Ребята из DeepMind тихо выложили статью на архив орг, всю основную шумиху подняли СМИ.

    А0 это пока совокупность железа и алгоритмов, до реального ИИ там пока еще далеко.
  28. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    и у 64-ядерного компа через минуту была глубина 20?
    —- добавлено: 9 дек 2017 —-
    там неясно... Thread - 64, могло быть и так, и так
    —- добавлено: 9 дек 2017 —-
    Так какого ты спрашиваешь, если тебе всё ясно?
  29. vsvor Новичок

    • Новичок
    Рег.:
    09.12.2017
    Сообщения:
    9
    Симпатии:
    3
    Репутация:
    0
    Оффлайн

    Каким образом можно их сравнивать по стоимости, если TPU не продаются и не производятся в сравнимых объемах? TPU 1-го поколения (которые в количестве 5000 шт. использовались при обучении) имели следующие характеристики: техпроцесс 28 нм, около 300 мм^2, 40 W, частота 700 МГц, 92 трлн операций с 8-битовыми числами в секунду.
    https://arxiv.org/ftp/arxiv/papers/1704/1704.04760.pdf

    Плата с 4 TPU 2-го поколения (4*45 = 180 TFlops, FP16) не выглядит слишком монструозной:
    [​IMG]
    https://www.nextplatform.com/2017/05/17/first-depth-look-googles-new-second-generation-tpu/

    Кстати: все-таки A0 играла на одной такой плате с 4 чипами или на четырех с 16 чипами?
  30. NoraNora Учаcтник

    • Участник
    Рег.:
    30.03.2013
    Сообщения:
    328
    Симпатии:
    221
    Репутация:
    7
    Оффлайн
    На самом деле, при первом включении, у меня он на самом деле уверенно долго показывал нули, а после введение рукой хода Qf4 странно резко поменял оценку на +-.
  31. West55 Начинающий

    • Начинающий
    Рег.:
    09.12.2017
    Сообщения:
    4
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    Добрый день, всем.
    Почему считаете, что минута на ход - это однозначно в минус Стокфишу?
    Тут сложный вопрос. Ведь Альфа очень сильно отсеивает варианты. Т.е. ее глубина просчета вполне может быть глубже при одном времени. У Стокфиша количество вариантов растет лавинообразно от глубины(экспонента?) Минута, возможно, является оптимумом, при данном железе. У Альфы сильно меньшая скорость нарастания вариантов от глубины.
    В сторону же малых времен тоже ясно преимущество Альфы, т.к. она может лучше оценивать конечные позиции.
  32. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Какое отношение игра людей имеет к игре программ? Для людей фиксированное время на ход, конечно, крайне неудобно. А для программ это естественный формат.
  33. Vertu Учаcтник

    • Участник
    Рег.:
    22.12.2006
    Сообщения:
    932
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Так на каком же основании вы утверждаете, что системы 4TPU и 2CPU сравнимы по стоимости?
  34. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    TPU это по сути упрощенная и урезанная видеокарта. Из Вики:
  35. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    я не знаю, что в плюс Альфе, но у Стокфиша отличный тайм-менеджмент и время он распределит по партии, как положено
    —- добавлено: 9 дек 2017 —-
    это противоестественный формат для матча движков :rtfm:

Поделиться этой страницей