AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    64
    Симпатии:
    24
    Репутация:
    1
    Оффлайн
    Теории заговора чертовски занимательны, но они обычно разбиваются о простые математические выкладки и элементарную логику.
    Можно было бы конечно заподозрить Deep Mind в тотальной фальсификации, если бы не:
    1. Огромное количество партий, в которых Alpha Zero демонстрирует высочайший уровень игры.
    2. Нейронка Lc0, основанная на алгоритмах A0, и показывающая отличные результаты (версия 11248 превосходит Stockfish 8)
    3. Над проектом A0 не один человек работает, а большая команда. Много людей будет знать о фальсификате. Репутационные риски, в случае раскрытия, огромны.
    4. Я понимаю, что Ваш пример утрирован, но там никак не может быть 200 пунктов разницы с SF 8, Leela тому доказательство. В худшем случае там примерно такой же уровень игры.
    5. Логические игры для Google и DeepMind имеют невысокий приоритет. Еcли компании такого уровня занимаются вещами сотой - тысячной важности для того, чтобы в итоге сфальсифицировать результаты, то с этим миром все очень плохо.
    Mustitz и Jadn нравится это.
  2. Launder Новичок

    • Новичок
    Рег.:
    25.11.2016
    Сообщения:
    87
    Симпатии:
    22
    Репутация:
    1
    Оффлайн
    Таблица везде дана С ТОЧКИ ЗРЕНИЯ АльфаЗироу, вот и всё.

    Тем не менее, исключения тоже имеют свою логику, поэтому "нет пределов пониманию":scratch:

    Вместо "алгоритмических движков", как вариант, могу предложить "переборные движки", как то, что они делают лучше всего: высокая точность и отличное умение использовать неточности противника, а также смело идут на рискованные позиции, "веря" в свой счёт и ставя, при этом сложнейшие счётные проблемы противнику (но врят ли, при этом, умея оценить, насколько их "точная" оценка, всесторонняя, для данной позиции).
  3. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.964
    Симпатии:
    2.172
    Репутация:
    85
    Адрес:
    Москва
    Оффлайн
    И это снова будет неточной классификацией, так как и альфа-бета, и MCTS являются алгоритмами перебора - то есть построения (в явном или неявном виде) дерева игры и проведения на нём процедуры поиска, с распространением оценок (или вероятностей) от ветвей к корню. Различаются только правила построения и форма результирующего дерева.

    Собственно, классификация в первом приближении простая, и состоит из двух признаков:
    1) алгоритм поиска: 1а) в глубину (альфа-бета и её производные), 1б) в ширину (MCTS)
    2) алгоритм оценки: 2a) линейный (традиционные движки), 2б) нелинейный (нейросети)

    Прошу заметить, что даже линейная по сути оценка может фактически считаться вырожденной нейросетью с одним скрытым слоем из одного или двух (миттельшпиль, эндшпиль) нейронов.

    Соответственно, имеем 4 возможных комбинации.
    Из них используются 1а + 2а (Стокфиш и все-все-все), 1б + 2б (AZ, lc0), 1б + 2а (новый Комодо). Кажется, 1а + 2б это Жираф, но надо проверить, там, возможно, какая-то более сложная гибридизация.
    Undying и Alhimik88 нравится это.
  4. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.207
    Симпатии:
    1.696
    Репутация:
    93
    Адрес:
    Заир
    Оффлайн
    Лезу в базу. По победам в базе вижу вижу +6 - 3 в пользу Стокфиша. Плюс есть какие-то партии без результата. Плюс одна "победа" Лилы за "white disconnects" в такой позиции:

    Чёрным тут присуждена незаслуженная победа, они должны были проиграть.

    В общем, либо +6 - 2, либо +7 - 2 в пользу Стокфиша. Чем хвастать?
  5. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.207
    Симпатии:
    1.696
    Репутация:
    93
    Адрес:
    Заир
    Оффлайн
    А причём тут вся команда? У разных людей разные задачи. Одни теории пишут, другие в код внедряют, третьи обучением занимаются, и так далее. Одному из них поручают проводить матч со Стокфишем. Остальных в это посвящать необязательно, пускай своим делом занимаются. Что и кому он пойдёт рассказывать?
  6. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    Сеть на 90 пунктов слабее 11248. Не будут они заранее показывать результаты 11248 против Stockfish. Если Lc0 выйдет в финал, будет интрига.

    Если так смотреть, то в одной партии SF был полностью позиционно раздавлен, но соскочпил на вечный шах. Итого +7 -3. Что +7 -2, что +7 -3 - это не говорит о превосходстве SF, т. к. результат в пределах погрешности. А если взглянуть на то, против какой сети играл SF, можно делать уже некоторые выводы.
    Alhimik88 нравится это.
  7. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Наш китайский друг весьма жестко проехался по Альфазеро на толкчессе

    Challenger Spy и Alhimik88 нравится это.
  8. minga Новичок

    • Новичок
    Рег.:
    02.11.2016
    Сообщения:
    11
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Итак… фэнтэзийная версия, так что не воспринимайте серьезно. Первая статья о искуственном разуме а0 появилась 6 декабря 2017 года. Тогда заявили, что а0 обыграл Stockfish 8 в матче из 100 партий. Затем прошел год, мы ждали большей информации о чудо нейронной сети, так и не дождались. Т.е. получилось что? Пошумели, пошумели, попиарились, свою выгоду получили и забыли. Теперь ровно 6 декабря, год спустя опять выкатывают – мы мол уже победили в матче из 1000 партий и уже более убедительно, но все тот же устаревший Stockfish 8. И опять нету полной информации, какие-то отдельные партии. Есть такое совпадение – каждый раз альфа зира выползает под появление новой версии Stockfish, в 2017 как раз только-только выходил 9-й а сейчас только-только вышел 10-й.

    АльфаГо оказалась не в состоянии одолеть Stockfish, постоянно проигрывала ему матчи.

    Взяли последнюю девелоперскую версию Stockfish 9 и назвали ее "АльфаЗиро".

    В 2017 провели матч Stockfish 8 vs. Stockfish 9 (он же АльфаЗиро). Девятому подкрутили немного настройки, настроили его на более агрессивный стиль, короля не прятать, жертвовать материал и захватывать пространство. Девятый одолел Восьмого, всем сказали что это некий АльфаЗиро победил Восьмого, вот вам несколько интересных партий.

    В 2018 опять под декабрь началось сезонное обострение, начало гореть.
    [​IMG]
    Быстро организовали матч Stockfish 8 vs. Stockfish 10 (он же АльфаЗиро) Десятому опять подкрутили настройки на агрессивность. Сыграли 1000 партий, Десятый победил, самые интересные выложили.

    Все. АльфаЗиро не существует. Это был Stockfish следующего поколения.
    [​IMG]
    Challenger Spy нравится это.
  9. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    626
    Симпатии:
    1.359
    Репутация:
    49
    Оффлайн
    А как же стиль? (Или, если больше нравится, "шахматный почерк")
    Launder нравится это.
  10. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    64
    Симпатии:
    24
    Репутация:
    1
    Оффлайн
    Еще стоит добавить, что в приведенных партиях участвовал самый последний Stockfish, а A0 играл с SF8, который примерно на 110 пунктов слабее.
    sovaz1997 нравится это.
  11. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    Более того: а как же Лила, основная на этой статье
    Launder нравится это.
  12. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    64
    Симпатии:
    24
    Репутация:
    1
    Оффлайн
    Так пишите будто вам известно сколько людей участвует в организации матча со Стокфишем. Более того, Вы фактически утверждаете, что это был один человек, который к тому же единолично отбирал партии. Вы не в Deep Mind работаете случайно?
  13. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Да нет, А0 - это таки реальность.
    Но я поддерживаю мнение Ласкоса с толкчесса, что А0 несколько сильнее Лейлы (и соответственно Стокфиша 9, примерно 52% он против него наберет). Но уступает 10-му Стоку, мое мнение - примерно на 30 ЭЛО.

    И мне в принципе неясно где А0 может усилиться. Стокфиш же наберет свои очередные +70 Эло и уйдет в солидный отрыв.
  14. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    A0 может усилится просто за счёт использование системы тестирования подобной Stockfish и улучшению поиска. И там, я уверен, многое можно улучшить. А вот улучшить Stockfish на 70 пунктов будут не просто, но число разработчиков и железо сделают свое дело, конечно
    —- добавлено: 9 дек 2018 —-
    Вообще, из-за нелинейности силы игры движков типа AZ очень трудно оценить, что сильнее - Lc0 или AZ, нужен матч против большого числа движков.
  15. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    229
    Симпатии:
    41
    Репутация:
    6
    Оффлайн
    лучше друг против друга
  16. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Ну скажем crem же говорил, что почерпнул важную инфу со статьи дипмайнд, уже во второй дивизион чуть-чуть новое уехало. Так что что-то у них да есть выше.

    Пока от дипмайнд одна польза - с его помощью Лейла усиляется :)
    sovaz1997 нравится это.
  17. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    KEV81, и это тоже. Но чем больше будет участвовать, тем точнее будет результат
  18. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Альберт Силвер и наш китайский друг сцепились в мертвой схватке об умных методах разработки, черных ящиках, брутфорсах на 384 ядрах, брутфорсах в 28 миллионов плавающих параметров А0, хромоногих оценках в сантипешках и в %, и даже глупости нейросетей. Рекомендую!

    http://talkchess.com/forum3/viewtopic.php?f=2&t=69175&start=122
  19. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.207
    Симпатии:
    1.696
    Репутация:
    93
    Адрес:
    Заир
    Оффлайн
    Раз статистики +7 -2 в пользу Стокфиша мало для статистически достоверных выводов, то тем более её мало для вывода о том, что Лила может на равных противостоять Стокфишу. На людях нейросетям пока нечем хвастать. Зато когда независимых наблюдателей нет, АльфаЗеро начинает крушить и рвать.
  20. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    На конфигурациях TCEC и СССС Стокфиш сильнее. Но кроме этих 2 площадок проводилась тонна матчей, многие стримили, и если дать Лейле на порядок более мощное железо - она матч может выиграть, и даже выигрывала.
    Сейчас в Лейле что-то подкрутили, она стала ощутимо веселее играть. Но по виду все равно слабее стока 10.

    А так если Лейле дать 5 RTX 2080, а Стоку ядер 20, то я почти уверен, что у Лейлы будет преимущество в матче. Небольшое, но все же.
  21. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    Мобуту, хорошо, что конкретно вы хотите доказать? Что это все - ложь? Что на самом деле AZ не может обыграть SF 8?
    Уже скоро Лила обыграет SF, в ближайшие месяцы или год, это должно случится просто потому, что AB развивается 50 лет, а успехи связи шахмат и нейронных сетей появились лишь год назад. Подкрутят поиск и получат еще 100 пунктов, в чем проблема? Сейчас это не основная задача, т. к. пока нет цели всеми способами одолеть SF. Но сыграть +7 -2 =21 - это действительно неплохо, это лучше, чем 5-0 после 10 партий против Houdini 6. И ведь год назад этого проекта вообще не существовало (!)

    По поводу соотношения железа: в TCEC и CCCC вполне оптимальное соотношение. Хотя в TCEC процессоры можно обновить уже, думаю. Но суть не в этом - рано или поздно NN-движки будет наголову выше AB-движков.

    P. S. А раньше думали, что Лиле в ТОП-5-то точно не попасть))
  22. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    По-моему как раз насчет топ-5 особо не сомневались. Ну т.е были разговоры - есть большая тройка, есть за ними Файр, на его уровне и должна играть Лейла (примерно). И, наверное, не будь в TCEC проблем с оборудованием, из-за которого Лейла не прошла в прошлом TCEC третий дивизион - она бы синхронно вместе с Этериалом поднялась до 1-го дивизиона, и там бы заняла 4-5 место. По СССС видно - она минимум 4-ый движок точно (на деле 3-4 с комодо)
    sovaz1997 нравится это.
  23. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.207
    Симпатии:
    1.696
    Репутация:
    93
    Адрес:
    Заир
    Оффлайн
    Это любой читер, обыгравший Карлсена, может примерно так же сказать. Мол, я же знаю, что играю сильнее Карлсена, просто надо малость подкрутить мой уровень. А ждать неохота, поэтому я авансом обеспечил себе победу путём читерства. Ну, подумаешь, что в этом такого? Всего лишь приблизил неизбежное. В чём проблема-то?
  24. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    229
    Симпатии:
    41
    Репутация:
    6
    Оффлайн
    тебя троллят, а ты ведешься ))
    sovaz1997 нравится это.
  25. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    914
    Симпатии:
    408
    Репутация:
    10
    Оффлайн
    А Альберт Силвер и наш китайский друг это кто такие?
  26. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    Альберт Сильвер - создатель нейронной сети Deus X для Lc0 на основе человеческих партий. Движок играл в TCEC 13, в TCEC 14 были изменены правила и Deus X не смог учавствовать в этом сезоне. Возможно, будет участвовать в следующем CCCC.

    Наш китайский друг (noobpwnftw) - человек, предоставивший большое количество мощностей для тестирования Stockfish (благодаря нему скорость развития Stockfish увеличилась в 1.5-2 раза). Также, он помог в развитии и Ethereal. Ну и 7-фигурные таблицы Syzygy тоже рассчитаны с использованием его компьютеров. Вроде 1 000 000 $ у него в месяц уходит на электроэнергию, не помню точно))

    Также, он предоставляет мощности для 176-ядерного SF и 128-ядерного Komodo в качестве "экспертной" оценки в TCEC.

    В общем, если бы не он, не было бы сейчас ни SF 10, ни 7-фигурных таблиц, ни Ethereal-а в ТОП5.
    Challenger Spy, Undying и Нестор нравится это.
  27. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    Рег.:
    10.04.2006
    Сообщения:
    2.597
    Симпатии:
    2.888
    Репутация:
    301
    Адрес:
    Москва
    Оффлайн
    Капитан Сильвер? :)
  28. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    797
    Симпатии:
    1.999
    Репутация:
    92
    Нарушения:
    9
    Оффлайн
    Деньги, кажется, не его. Он вроде бы работает в каком-то большом китайском data center, где много свободных компьютеров и большой бюджет.
    sovaz1997 нравится это.
  29. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    617
    Симпатии:
    105
    Репутация:
    2
    Оффлайн
    SF 10 был бы, конечно, но не сейчас (ровно через 10 лет после выхода SF 1), а как минимум через полгода-год;
    7-фигурки Syzygy намного меньше по объему и поддерживаются движками;
    Ethereal в ТОП-5. Ну, да, достижение в первую очередь для самого автора. Но автор также писал патчи для SF, что тоже способствовало его развитию.
  30. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Стокфиш 10 был бы примерно на 30 ЭЛО слабее и позже
    Базы Ломоносова - они вообще-то не для всех.
    Появился новый, сильный движок. Эндрю Грант (его автор) уже немало для шахматного программирования сделал - у него есть и патчи для Стокфиша, и коммиты для Лейлы. Разве плохо?
    Кстати, этот китаец так-то предоставил больше всех мощностей для Лейлы. При обучении нынешней, турнирной версии Лейлы 11248. И после этого тоже помогал в экспериментах, хотя и не так активно. Crem скажет побольше
    Комсюк, Undying и sovaz1997 нравится это.
  31. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    229
    Симпатии:
    41
    Репутация:
    6
    Оффлайн
    На бирже не пробовал играть с такими уверенными прогнозами? ))
    * Эло - это фамилия, а не аббревиатура.
    —- добавлено: 10 дек 2018 —-
    "Тысячи их".
    —- добавлено: 10 дек 2018 —-
    Так я же написал, что он - красава.
    sovaz1997 и Комсюк нравится это.
  32. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.286
    Симпатии:
    14.746
    Репутация:
    935
    Нарушения:
    9
    Оффлайн
    Стокофилам просьба не ругаться меж собой :)
  33. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Чуть меньше половины роста Стокфиша за год
  34. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    Рег.:
    30.09.2006
    Сообщения:
    13.553
    Симпатии:
    9.924
    Репутация:
    429
    Оффлайн
    Каждый раз когда заглядываю в эту ветку, такое впечатление, что в секту попал...
  35. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    130
    Симпатии:
    110
    Репутация:
    1
    Оффлайн
    Лучше молиться Стокфишу, а не богу.
    От стокфиша польза есть, он помогает, да.

Поделиться этой страницей