AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Обучение проводится только 1 раз, поэтому считайте, что это входит в процесс разработки (но на совершенно ином уровне).
    Любитель_ нравится это.
  2. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Кроме общего зачёта они сыграли по 100 игр на различных популярных дебютах, и stockfish на этих дебютах действительно иногда выигрывал (сицилианку 7 раз белыми, например). Можно считать что это "как бы stockfish сыграл будь у него дебютная таблица", но на самом деле alphazero такие неудобные для себя дебюты просто не играет! (как видно из графика).

    Также информация о том, что у stockfish дебютной книги не было — это только догадка Накамуры, а официального подтверждения этому нету, и на самом деле вполне себе дебютная книга и могла бы быть. Например, когда alphaGo выиграл у Ли Седола, народ тоже "подозревал" что запретили в го играть "ко" Седолу под подписку о неразглашении, а на самом деле всё было честно.
  3. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    И? Это гигабайты информации о начальной позиции, наработанные за много часов или дней. У движков они традиционно хранятся в дебютной книге. И у одного из соперников эту информацию просто отняли.
    Как я говорил - корректное тестирование надо устраивать на наборе начальных позиций.
    Любитель_ и Комсюк нравится это.
  4. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Сток должен выйти из дебюта (с книгой) и решить всё в миттельшпиле
    Не удалось, подхватываются таблицы, и ничья в эндшпиле :)
    Болеем за наших!
    —- добавлено: 7 дек 2017 —-
    во-во
    sovaz1997 нравится это.
  5. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Кстати при разработке stockfish тоже используются большие вычислительные мощности (чтобы проверить на тестовых играх с самим собой, действительно ли изменения усиливают движок). Вот тут любой желающий может подключиться и предоставить свой комп для таких тестов: http://tests.stockfishchess.org/tests

    Так что нельзя говорить что у alphazero большие мощности, а у stockfish такого нет. На самом деле мощности сравнимы и в процессе разработки, и в процессе игры.
  6. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Это все как с клонированием овечки Долли, уже 20 лет прошло , где атака клонов? Турбозеро млин. Человек не думает нейронами, он думает душой-волей. Дурят нашего брата этими нейронами. Чтоб нейроны обучались они должны быть отдельными личностями.
    Любитель_ нравится это.
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    а тесты были до матча?
    Тогда это ещё фора для самообучения Альфы
  8. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Я просто хочу сказать одну мысль: чтобы сравнение было корректным, нужно одинаковое железо. Тогда мы можем сравнивать движки, т. к. условия одинаковые.

    Но прорыв заключается в совершенно ином подходе к оценке позиции. Больше нет весов фигур, нет бонусов/штрафов. Есть просто система, в которой есть правила. И все. Даже если бы AlphaZero играла слабее, чем Stockfish, это бы не сильно преуменьшило достижение.

    P. S. но я жду более качественного тестирования, большего количества партий для достоверности. Ведь человек+Stockfish против Stockfish тоже может показать красивые партии :)
    Любитель_ и Rom нравится это.
  9. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Хватит ли у ДупельЗеро памяти хранить все чему он научился? Он же после каждой партии должен кучу инфы сохранять.
  10. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Сток тоже бы не играл неудобные дебюты, если бы на тесте у него была обучаемая книга (не таблица, по которой он всё время шпарит!), пусть и короткая
  11. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Комс, это спортивный подход, а не научный. В данном случае был научный эксперимент.
  12. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Перед матчем или после — разницы нет, фаза обучения (много игр с самим собой) и игры с противником — это разные фазы. После того, как фаза обучения закончена, модель фиксируется и больше не обновляется. На играх со стокфишем alphazero не учится, он играл первую и последнюю игру с абсолютно одинаковыми знаниями.
    (кстати был вопрос такой от журналистов, когда alphaGo играл с Ли Седолом, и до этого с компьютерными программами, и разрабочики подтвердили что между играми модель не меняется, на играх не учится).

    Поэтому и требование разрешить stockfish'у править свою дебютную таблицу между играми было бы нечестным, хотя и не помогло б стокфишу.
    Любитель_ и Комсюк нравится это.
  13. Ми-Ля-Зола Новичок

    • Новичок
    Рег.:
    28.03.2016
    Сообщения:
    47
    Симпатии:
    45
    Репутация:
    1
    Оффлайн
    Можно вопрос, ибо я не шахматный профессионал.
    Вот смотрите:
    https://lichess.org/zbCOTavB#56

    Личессовский стокфиш в этой партии на 28-ом ходу (по идеи позиция должна стоять сразу по ссылке) пишет крепкий НОЛЬ. И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же. Так вот вопрос: я смотрю на эту позицию своим убогим условным первым разрядом и мне кажется, что позиция черных на шахматном языке называется "ящик". И если показать ее шахматному профи, то он скажет так же, что да все, у черных плохо от слова "совсем": линии e и d намертво захвачены белыми, король черных разбит и гуляет по доске, конь и ладья на a8 и b8 - это венок (а не венец!). Я не прав? А вот если прав, то в этом то и есть разница между AZ и всеми предыдущими движками - она не пересчитала стокфиш, она его ОБЫГРАЛА.
    Любитель_, Undying и Vladruss нравится это.
  14. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Думаю, AlphaZero по силе слабее Стокфиша (хотя все сделано так, чтобы мы пришли к другому выводу), но играет круто и умно.
    Странно, что Стокфиша не заставили думать 80тыс. позиций в секунду, чтобы счет в пользу AlphaZero был еще более впечатляющий -100 из 100.:)
    Challenger Spy нравится это.
  15. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    У нейросети размер модели фиксированный, он не растёт от каждой игры. Если этот фиксированный размер слишком маленький, нейросеть грубо говоря "выкидывает" наименее важную информацию чтобы освободить место для более важной. Но даже небольшой модели (1 мегабайт), наверняка достаточно для того чтоб распознавать все "шаблоны" которые знают профессиональные гроссмейстеры, а у alphazero скорее всего модель побольше.

    Говоря кратко: такой проблемы, которую вы описали, нету, т.к. количество необходимой памяти с каждой игрой не растёт.
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    не так
  17. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Пока вы тут рассуждаете о проблемах харда, в США программисты уже пишут алгоритм компьютерной стратегии "Как захватить весь мир". После этого они заставят по этим вводным данным играть эту самую Зеру, она и подскажет им все верные решения. Так что, плакать нам скоро придется.
    Camon14 нравится это.
  18. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Это лишь вершина айсберга, которую показали американцы, раз они Иерусалим признали столицей Израиля, значит чувствуют в себе силу мощную, что не боятся никого.
    —- добавлено: 7 дек 2017, опубликовано: 7 дек 2017 —-
    Не зря Бендер говорил " шахматы превратятся в прикладную науку и изобретет способ межгалактического общения" :) Видимо смысл шахмат это помощь в развитии ИИ.
  19. Ми-Ля-Зола Новичок

    • Новичок
    Рег.:
    28.03.2016
    Сообщения:
    47
    Симпатии:
    45
    Репутация:
    1
    Оффлайн
    Vladruss, вряд ли, количество переменных и данных необходимых для ввода бесконечно как жизнь. Объясню проще: во второй мировой войне победил ДУХОВНЫЙ подвиг советского солдата. По всем "мощностям" мы стояли на тот же "ящик", но то, что советские солдаты совершили под Сталинградом никакими мощностями не учесть и не просчитать. Это не лирика уже даже в военной науке. Ресурс "духовная сила нации" давно используется во всех военных стратегиях. Был прекрасный доклад одного полковника "О начале третьей мировой войны и ее возможной периодизации", пока, к сожалению, не могу его найти, чтобы дать ссылку.
  20. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Ну, дык, и кто мешает ввести в игру эту новую константу "Духовная сила нации"?
    Впрочем, зря я этот разговор затеял. Оффтоп это.
  21. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    а как выиграть после 30...Лh8?
    —- добавлено: 7 дек 2017 —-
    нашёл
  22. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    Характерно, что Альфазеро смело идет в дебюте на жертвы ради развития инициативы - и без всяких дебютных справочников. Вот мне партия понравилась: https://lichess.org/D8qrQ6vY#95



    Гениальная игра!
  23. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Vladruss, да, у A0 нет оценки материала, он оценивает позицию в общем (как человек, можно сказать). Но обобщение оценки позиции и счёт намного лучше, чем у человека, хотя насчёт оценки позиции я не уверен, возможно, у человека она ещё лучше, учитывая очень скудные счетные способности.
    Любитель_ и DraggonZ нравится это.
  24. Gridnev Старожил

    • Участник
    • Старожил
    Рег.:
    01.06.2012
    Сообщения:
    652
    Симпатии:
    3.632
    Репутация:
    152
    Оффлайн
    Уже приводили кусочек этой игры, иллюстрирующий идею запирания ферзя в углу. Очень круто. Есть чему поучиться.
  25. Ми-Ля-Зола Новичок

    • Новичок
    Рег.:
    28.03.2016
    Сообщения:
    47
    Симпатии:
    45
    Репутация:
    1
    Оффлайн
    Ну, я вот загрузил позицию в chessbase, поставил на движок. Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию. Stockfish 8 на глубине 48 дает твердые нули. "СОРОК ВОСЕМЬ, КАРЛ!!!" Когда до него дойдет??? Понятно, что, видимо, произошла ошибка в альфабетаотсечении и типа того, и всё... Он тупо не врубается. А человек врубается, что у черных край одним взглядом на позицию.
  26. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    https://twitter.com/bennedik/status/938741157319856128
    Statistics about the 1300 games played between AlphaZero and Stockfish. In total, AlphaZero won 318 games, lost 24, with 958 draws. That's 61% and an Elo performance of 3479, assuming 3389 Elo for Stockfish (which I think ran on a faster hardware than the Elo is from).
    —- добавлено: 8 дек 2017 —-
    Чаво?
    Комсюк нравится это.
  27. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Ваш движок даёт свою оценку
    Если смотреть Let's check, то через ход уже есть оценка +1.31 даже на 32-ой глубине,
    правда, от Комода :lol:
    Нестор нравится это.
  28. Ми-Ля-Зола Новичок

    • Новичок
    Рег.:
    28.03.2016
    Сообщения:
    47
    Симпатии:
    45
    Репутация:
    1
    Оффлайн
    Vertu, ну в смысле? В chessbase включаешь движок, он сверху показывает свой обсчет, ниже в другом окне показывает обсчет с серверов через инет. Если эту позицию уже считали, то ее оценка есть. crest.JPG Ну, как бы мой комп на глубине 48 давно бы дым пускал...
    —- добавлено: 8 дек 2017, опубликовано: 8 дек 2017 —-
    Да?.. Ой... А что это тогда? Я думал это с серваков через инет... Извиняюсь, в нес тогда дезинфу... Но этото что все же
  29. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    это оценка тех, кто считал ранее, но ваш движок с ними не соединяется
  30. vasa Опытный перворазрядник

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    35.296
    Симпатии:
    17.577
    Репутация:
    583
    Адрес:
    Ростов-на-Дону
    Оффлайн
    А вот игрулечка кавайная какая :)

  31. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Явление АО это как явление Морфи. Он нас научит Родину любить в шахматы играть.
  32. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Ваша малюсенькая ошибка заключается в том, что вы не замечаете имеющуюся в качестве компенсации у черных лишнюю фигуру :oops:
    sovaz1997 нравится это.
  33. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.315
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Самое смешное, что Гуглу в принципе шахматы малоинтересны, поиграются немного и бросят,
    как Го. А в Азии гошники до сих пор в себя прийти не могут. То же самое будет и с шахматами.
    Только в себя долго не смогут прийти адвансеры и разработчики топовых движков ;)
    А цель Гугла — это по-настоящему сильный алгоритм для ИИ!
    Только вот доиграются они с огнём, чует моё сердце ...
    Понаделают из нас, человеков, нанороботы канцелярских скрепок ...
  34. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Challenger Spy, дай всё-таки экспертную оценку по железу
    Во сколько раз у Альфы было сильнее?
  35. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Комсюк, Я уже писал выше, что примерно в 100 раз. Но это не экспертная оценка, а основанная на обсуждаемых тут и там параметрах соперников грубая прикидка, причем вовсе не от спеца в нейронных сетях :)

Поделиться этой страницей