AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Обучение проводится только 1 раз, поэтому считайте, что это входит в процесс разработки (но на совершенно ином уровне).
     
    Любитель_ likes this.
  2. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Кроме общего зачёта они сыграли по 100 игр на различных популярных дебютах, и stockfish на этих дебютах действительно иногда выигрывал (сицилианку 7 раз белыми, например). Можно считать что это "как бы stockfish сыграл будь у него дебютная таблица", но на самом деле alphazero такие неудобные для себя дебюты просто не играет! (как видно из графика).

    Также информация о том, что у stockfish дебютной книги не было — это только догадка Накамуры, а официального подтверждения этому нету, и на самом деле вполне себе дебютная книга и могла бы быть. Например, когда alphaGo выиграл у Ли Седола, народ тоже "подозревал" что запретили в го играть "ко" Седолу под подписку о неразглашении, а на самом деле всё было честно.
     
  3. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    И? Это гигабайты информации о начальной позиции, наработанные за много часов или дней. У движков они традиционно хранятся в дебютной книге. И у одного из соперников эту информацию просто отняли.
    Как я говорил - корректное тестирование надо устраивать на наборе начальных позиций.
     
  4. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Сток должен выйти из дебюта (с книгой) и решить всё в миттельшпиле
    Не удалось, подхватываются таблицы, и ничья в эндшпиле :)
    Болеем за наших!
    —- добавлено: 7 Dec 2017 —-
    во-во
     
    sovaz1997 likes this.
  5. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Кстати при разработке stockfish тоже используются большие вычислительные мощности (чтобы проверить на тестовых играх с самим собой, действительно ли изменения усиливают движок). Вот тут любой желающий может подключиться и предоставить свой комп для таких тестов: http://tests.stockfishchess.org/tests

    Так что нельзя говорить что у alphazero большие мощности, а у stockfish такого нет. На самом деле мощности сравнимы и в процессе разработки, и в процессе игры.
     
  6. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Это все как с клонированием овечки Долли, уже 20 лет прошло , где атака клонов? Турбозеро млин. Человек не думает нейронами, он думает душой-волей. Дурят нашего брата этими нейронами. Чтоб нейроны обучались они должны быть отдельными личностями.
     
    Любитель_ likes this.
  7. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    а тесты были до матча?
    Тогда это ещё фора для самообучения Альфы
     
  8. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Я просто хочу сказать одну мысль: чтобы сравнение было корректным, нужно одинаковое железо. Тогда мы можем сравнивать движки, т. к. условия одинаковые.

    Но прорыв заключается в совершенно ином подходе к оценке позиции. Больше нет весов фигур, нет бонусов/штрафов. Есть просто система, в которой есть правила. И все. Даже если бы AlphaZero играла слабее, чем Stockfish, это бы не сильно преуменьшило достижение.

    P. S. но я жду более качественного тестирования, большего количества партий для достоверности. Ведь человек+Stockfish против Stockfish тоже может показать красивые партии :)
     
    Любитель_ and Rom like this.
  9. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Хватит ли у ДупельЗеро памяти хранить все чему он научился? Он же после каждой партии должен кучу инфы сохранять.
     
  10. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Сток тоже бы не играл неудобные дебюты, если бы на тесте у него была обучаемая книга (не таблица, по которой он всё время шпарит!), пусть и короткая
     
  11. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Комс, это спортивный подход, а не научный. В данном случае был научный эксперимент.
     
  12. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Перед матчем или после — разницы нет, фаза обучения (много игр с самим собой) и игры с противником — это разные фазы. После того, как фаза обучения закончена, модель фиксируется и больше не обновляется. На играх со стокфишем alphazero не учится, он играл первую и последнюю игру с абсолютно одинаковыми знаниями.
    (кстати был вопрос такой от журналистов, когда alphaGo играл с Ли Седолом, и до этого с компьютерными программами, и разрабочики подтвердили что между играми модель не меняется, на играх не учится).

    Поэтому и требование разрешить stockfish'у править свою дебютную таблицу между играми было бы нечестным, хотя и не помогло б стокфишу.
     
  13. Ми-Ля-Зола
    Оффлайн

    Ми-Ля-Зола Новичок

    Репутация:
    1
    Можно вопрос, ибо я не шахматный профессионал.
    Вот смотрите:
    https://lichess.org/zbCOTavB#56

    Личессовский стокфиш в этой партии на 28-ом ходу (по идеи позиция должна стоять сразу по ссылке) пишет крепкий НОЛЬ. И если дать ему хоть в сто раз больше мощностей, то не удивлюсь, если он будет считать точно так же. Так вот вопрос: я смотрю на эту позицию своим убогим условным первым разрядом и мне кажется, что позиция черных на шахматном языке называется "ящик". И если показать ее шахматному профи, то он скажет так же, что да все, у черных плохо от слова "совсем": линии e и d намертво захвачены белыми, король черных разбит и гуляет по доске, конь и ладья на a8 и b8 - это венок (а не венец!). Я не прав? А вот если прав, то в этом то и есть разница между AZ и всеми предыдущими движками - она не пересчитала стокфиш, она его ОБЫГРАЛА.
     
  14. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Думаю, AlphaZero по силе слабее Стокфиша (хотя все сделано так, чтобы мы пришли к другому выводу), но играет круто и умно.
    Странно, что Стокфиша не заставили думать 80тыс. позиций в секунду, чтобы счет в пользу AlphaZero был еще более впечатляющий -100 из 100.:)
     
    Challenger Spy likes this.
  15. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    У нейросети размер модели фиксированный, он не растёт от каждой игры. Если этот фиксированный размер слишком маленький, нейросеть грубо говоря "выкидывает" наименее важную информацию чтобы освободить место для более важной. Но даже небольшой модели (1 мегабайт), наверняка достаточно для того чтоб распознавать все "шаблоны" которые знают профессиональные гроссмейстеры, а у alphazero скорее всего модель побольше.

    Говоря кратко: такой проблемы, которую вы описали, нету, т.к. количество необходимой памяти с каждой игрой не растёт.
     
  16. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    не так
     
  17. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Пока вы тут рассуждаете о проблемах харда, в США программисты уже пишут алгоритм компьютерной стратегии "Как захватить весь мир". После этого они заставят по этим вводным данным играть эту самую Зеру, она и подскажет им все верные решения. Так что, плакать нам скоро придется.
     
    Camon14 likes this.
  18. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Это лишь вершина айсберга, которую показали американцы, раз они Иерусалим признали столицей Израиля, значит чувствуют в себе силу мощную, что не боятся никого.
    —- добавлено: 7 Dec 2017, опубликовано: 7 Dec 2017 —-
    Не зря Бендер говорил " шахматы превратятся в прикладную науку и изобретет способ межгалактического общения" :) Видимо смысл шахмат это помощь в развитии ИИ.
     
  19. Ми-Ля-Зола
    Оффлайн

    Ми-Ля-Зола Новичок

    Репутация:
    1
    Vladruss, вряд ли, количество переменных и данных необходимых для ввода бесконечно как жизнь. Объясню проще: во второй мировой войне победил ДУХОВНЫЙ подвиг советского солдата. По всем "мощностям" мы стояли на тот же "ящик", но то, что советские солдаты совершили под Сталинградом никакими мощностями не учесть и не просчитать. Это не лирика уже даже в военной науке. Ресурс "духовная сила нации" давно используется во всех военных стратегиях. Был прекрасный доклад одного полковника "О начале третьей мировой войны и ее возможной периодизации", пока, к сожалению, не могу его найти, чтобы дать ссылку.
     
  20. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Ну, дык, и кто мешает ввести в игру эту новую константу "Духовная сила нации"?
    Впрочем, зря я этот разговор затеял. Оффтоп это.
     
  21. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    а как выиграть после 30...Лh8?
    —- добавлено: 7 Dec 2017 —-
    нашёл
     
  22. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Характерно, что Альфазеро смело идет в дебюте на жертвы ради развития инициативы - и без всяких дебютных справочников. Вот мне партия понравилась: https://lichess.org/D8qrQ6vY#95



    Гениальная игра!
     
  23. sovaz1997
    Оффлайн

    sovaz1997 Учаcтник

    Репутация:
    3
    Vladruss, да, у A0 нет оценки материала, он оценивает позицию в общем (как человек, можно сказать). Но обобщение оценки позиции и счёт намного лучше, чем у человека, хотя насчёт оценки позиции я не уверен, возможно, у человека она ещё лучше, учитывая очень скудные счетные способности.
     
    Любитель_ and DraggonZ like this.
  24. Gridnev
    Оффлайн

    Gridnev Старожил

    Репутация:
    152
    Уже приводили кусочек этой игры, иллюстрирующий идею запирания ферзя в углу. Очень круто. Есть чему поучиться.
     
  25. Ми-Ля-Зола
    Оффлайн

    Ми-Ля-Зола Новичок

    Репутация:
    1
    Ну, я вот загрузил позицию в chessbase, поставил на движок. Ну, понятно, мой кряхтит на убогой глубине, но он же с серверами соединяется и дает оценку тех, кто уже считал эту позицию. Stockfish 8 на глубине 48 дает твердые нули. "СОРОК ВОСЕМЬ, КАРЛ!!!" Когда до него дойдет??? Понятно, что, видимо, произошла ошибка в альфабетаотсечении и типа того, и всё... Он тупо не врубается. А человек врубается, что у черных край одним взглядом на позицию.
     
  26. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    https://twitter.com/bennedik/status/938741157319856128
    Statistics about the 1300 games played between AlphaZero and Stockfish. In total, AlphaZero won 318 games, lost 24, with 958 draws. That's 61% and an Elo performance of 3479, assuming 3389 Elo for Stockfish (which I think ran on a faster hardware than the Elo is from).
    —- добавлено: 8 Dec 2017 —-
    Чаво?
     
    Комсюк likes this.
  27. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Ваш движок даёт свою оценку
    Если смотреть Let's check, то через ход уже есть оценка +1.31 даже на 32-ой глубине,
    правда, от Комода :lol:
     
    Нестор likes this.
  28. Ми-Ля-Зола
    Оффлайн

    Ми-Ля-Зола Новичок

    Репутация:
    1
    Vertu, ну в смысле? В chessbase включаешь движок, он сверху показывает свой обсчет, ниже в другом окне показывает обсчет с серверов через инет. Если эту позицию уже считали, то ее оценка есть. crest.JPG Ну, как бы мой комп на глубине 48 давно бы дым пускал...
    —- добавлено: 8 Dec 2017, опубликовано: 8 Dec 2017 —-
    Да?.. Ой... А что это тогда? Я думал это с серваков через инет... Извиняюсь, в нес тогда дезинфу... Но этото что все же
     
  29. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    это оценка тех, кто считал ранее, но ваш движок с ними не соединяется
     
  30. vasa
    Оффлайн

    vasa Опытный перворазрядник Staff Member Команда форума

    Репутация:
    583
    А вот игрулечка кавайная какая :)

     
  31. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Явление АО это как явление Морфи. Он нас научит Родину любить в шахматы играть.
     
  32. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Staff Member

    Репутация:
    226
    Ваша малюсенькая ошибка заключается в том, что вы не замечаете имеющуюся в качестве компенсации у черных лишнюю фигуру :oops:
     
    sovaz1997 likes this.
  33. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    Самое смешное, что Гуглу в принципе шахматы малоинтересны, поиграются немного и бросят,
    как Го. А в Азии гошники до сих пор в себя прийти не могут. То же самое будет и с шахматами.
    Только в себя долго не смогут прийти адвансеры и разработчики топовых движков ;)
    А цель Гугла — это по-настоящему сильный алгоритм для ИИ!
    Только вот доиграются они с огнём, чует моё сердце ...
    Понаделают из нас, человеков, нанороботы канцелярских скрепок ...
     
    Last edited: 8 Dec 2017
  34. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Challenger Spy, дай всё-таки экспертную оценку по железу
    Во сколько раз у Альфы было сильнее?
     
  35. Challenger Spy
    Оффлайн

    Challenger Spy Технический специалист Staff Member

    Репутация:
    226
    Комсюк, Я уже писал выше, что примерно в 100 раз. Но это не экспертная оценка, а основанная на обсуждаемых тут и там параметрах соперников грубая прикидка, причем вовсе не от спеца в нейронных сетях :)