AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Но ведь можно сделать так , что Альфа выдавала не только ход , но и то , как она его вычислила . По сути ОФ .

    Сток будет распределять расчеты так , как задаст программист .
    Если нужно больше расчетов в оценку - значит так и надо распределять мощность .

    Нет . Если Сток оценивает в 40 раз хуже - то при замедлении он будет оценивать в 40 раз меньше позиций , но при этом каждую позицию в 40 раз тщательней . Речь не о замедлении а о перераспределении вычислительной мощности .

    Я думаю , производитель программы охотно согласится написать на диске - сделано на основе НС Гугла .
    Гугл получит свою часть славы , разработчик деньги , шахматисты - суперпрогу .
  2. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    Наверное надо определиться, мы говорим об Альфе целиком или только об её нейросети? Сама нейросеть ничего "объяснить" не может, кроме как предоставить список произведенных арифметических операций над каждой позицией. Альфа целиком предоставит список наиболее посещаемых позиций в дереве перебора, из которых она выбрала наиболее посещаемый вариант.

    Стоку не надо больше расчетов в оценку, так как он наиболее эффективен именно при своей нынешней оценке. Если же добавлять параметры в его нынешнюю оценку, то это приведет к увеличению времени на вычисление этой оценки, потере скорости перебора и соответственно снижению общей силы игры.

    В нынешнюю ОФ Стока заложен определенный набор арифметических операций для оценки позиции. Ни больше, ни меньше. Нынешняя оценка не может оценивать в 40 раз качественнее, даже если повторит эти расчеты 40 раз.

    Я полагаю многие поступят проще. Возьмут Сток, переименуют его, проведут матч "своей" программы против Альфы на "более корректных" условиях и напишут на диске "Мы круче Гугла". :)
    Комсюк нравится это.
  3. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Все верно . Мы берем этот список операций , и составляем на его основе новый алгоритм для Стока .

    Это если у Стока собственная ОФ .
    Но мы вставим в Сток ОФ Альфы . Стокфиш будет считать и оценивать позиции как Альфа .

    Написать мало , надо предъявить текст партий . И чтобы эти партии соответствовали заявленному качеству .
    Иначе над ними просто посмеются .
  4. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.854
    Симпатии:
    11.648
    Репутация:
    717
    Нарушения:
    21
    Оффлайн
    Оптик, иди начерти пару формул! Сток выиграет у этой богини, если не связывать ему руки. Переименовать его - дело двух секунд
    --- добавлено: 21 янв 2018 ---
    Будет и текст партий... в отличие от Гугла, и показания всех приборов (глубина, ширина и долгота расчётов)
  5. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    485
    Симпатии:
    173
    Репутация:
    21
    Оффлайн
    Не понятно как это сделать. Для каждой новой позиции список операций будет разным.

    Но при этом возможно станет играть хуже, поскольку скорость поиска (перебора) по дереву вариантов резко снизится.

    ChessBase постоянно так делают. Найдут пару позиций в которых их программы справляются лучше других и пишут статью. При желании и партии наиграть могут. :cool:
  6. Оптик Учаcтник

    • Участник
    Рег.:
    08.04.2013
    Сообщения:
    934
    Симпатии:
    559
    Репутация:
    30
    Оффлайн
    Ну как это делает Альфа ? В процессе обучения , Альфа сформировала некую целевую функцию , точно расставила в этой функции все весовые коэффициенты .
    И на основе этой функции играет сильнее чем Сток на своем алгоритме .

    С чего бы это Альфа не может выдать в чистом виде эту ОФ ?
    И почему ею не сможет воспользоваться обычная шахматная программа ?
  7. Jadn Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    10.05.2006
    Сообщения:
    2.968
    Симпатии:
    721
    Репутация:
    28
    Оффлайн
    Альфа вполне может её выдать, ну, если Гугл позволит. Но, вот эта оценочная функция работает на TPU. Можно конечно её переписать на х86 платформу, но разница со Стоковской в скорости будет даже не в 1000 раз, а намного больше. В итоге это Сток только ослабит.
    Оптик нравится это.
  8. Launder Новичок

    • Новичок
    Рег.:
    25.11.2016
    Сообщения:
    58
    Симпатии:
    13
    Репутация:
    1
    Оффлайн
    Мне кажется это не вполне корректный вопрос. Ну совершенно другой принцип у этой штуки, слишком какой-то топорный перевод этих "весовых коэффициентов"...
    --- добавлено: 22 янв 2018, опубликовано: 22 янв 2018 ---
    Во-первых 32-фигурная и любая другая база не понимают, а имеют таблицу соответствий, понимать может только человек, который видит в решении определённую логическую нить форсированную или не очень, но в любом случае, он понимает, ЗА СЧЁТ ЧЕГО это решение существует.
    Во-вторых, "комбинаторика в чистом виде" она до тех пор пока мы в этом хаосе не найдём определённого порядка. Конечно, для таких длинных решений доля комбинаторики такая, что распухнет любой мозг, и тем не менее, полагаю, что, всё же "в чистом виде", в природе мало что существует, и, в данном случае, примесь логики наверняка присутствует, просто она настолько разбавлена, что увидеть её крайне сложно, но это не значит что её нет. Можно сказать, что шахматы это вообще чистая комбинаторика, но ведь находим же мы в них логику?
    Так же и тут, просто из-за сложности и, возможно, из практических соображений (возможная цель на возможные усилия), пока не нашли своего исследователя. Есть какие-то линии, где порядок строгий порядок ходов, есть где не строгий, есть более, или менее длинные решение. Кстати, более короткое решение не всегда более наглядное, а значит более простое. Когда мы смотрим на позицию, мы видим те или иные применимые к ней идеи, но в коротком решении могут быть объединены они все - но нам же нужно это клубок распутать? В этом и сложность, что ответе спрятано(ы) (понятные нам) решение(я). Наша задача постичь идеи содержащиеся в этих ответах и тогда, пусть и не самым коротким путём ход в ход, но мы сможем решать подобные нерешаемые задачи... В общем, не исключено, что вооружившись таблицами, мы можем найти в них не мало алмазов...
  9. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Вспоминается известный анекдот про Бернарда Шоу.
    "Давайте поженимся, наши дети будут умные, как вы, и красивые, как я! -- Леди, а вдруг получится наоборот?"
    Launder, Undying, Zayats и 3 другим нравится это.
  10. nn В предбаннике

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    623
    Симпатии:
    1.206
    Репутация:
    83
    Нарушения:
    23
    Оффлайн
    Новые лучшие веса leela-chess в supervised learning. Дебют научилась имитировать, но зато потом компенсирует это нескучным театром народной самодеятельности.

  11. nn В предбаннике

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    623
    Симпатии:
    1.206
    Репутация:
    83
    Нарушения:
    23
    Оффлайн
    Да, там описано правильное решение - своим ходом сделать так, чтобы все поразрядные суммы цифр двоичного представления числа камней в кучках стали четными. Есть также и способ считать все это в течении нескольких секунд даже при достаточно большом числе камней и кучек глядя на позицию, а не в небо, как Вася при своем ходе - сразу видно какие-то шах-мат-суммы считает, а не варианты.

    Такая же проблема как с 32-фигурными таблицами возникает, если игра начинается с проигранной позиции, и нужно максимизировать шансы на ошибку соперника. Нужно идти в сложную позицию - больше камней больше кучек, неодинаковое число камней в кучках, нечетное число кучек, нечетность во многих поразрядных суммах, и т.д. Выигрываешь, даже если рассказать сопернику правильное решение, но не говорить как просто все считать. В шахматах при наличии 32-фигурных таблиц подобную программу тоже можно написать со своими критериями сложностями.
    Комсюк нравится это.
  12. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.854
    Симпатии:
    11.648
    Репутация:
    717
    Нарушения:
    21
    Оффлайн
    я играл только 3-5-7, но это действительно таблица у меня в голове :)
    Поскольку я не считал, а пришёл к решению экспериментально полным перебором (прямо, как MCTS)
  13. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    91
    Симпатии:
    86
    Репутация:
    4
    Оффлайн
    Опубликовали доклад Хассабиса: https://www.youtube.com/watch?v=DXNqYSNvnjA
    В основном повторяет всё тот же доклад DeepMind об AlphaZero, но местами есть новое.
    nn и N1mTzo нравится это.
  14. nn В предбаннике

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    623
    Симпатии:
    1.206
    Репутация:
    83
    Нарушения:
    23
    Оффлайн
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
  16. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    А что нового говорит? Когда матч реванш будет?
  17. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Какой ещё реванш? Они же не на титул играли, а просто программу тестировали.
  18. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    52
    Симпатии:
    7
    Репутация:
    0
    Оффлайн
    А что им жалко чтоли на титул сыграть? В Го ведь много играли, что мешает в шахматы немного поиграть?
  19. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Наверное, жалко, раз проект ещё в мае закрыли и всех людей на другие задачи перебросили. Так что даже непонятно, кому и с кем реванш играть.
  20. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    108
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    то есть доклад менее чем недельной давности был сделан без участия гугла и дипмаинда?
    crem нравится это.
  21. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    91
    Симпатии:
    86
    Репутация:
    4
    Оффлайн
    Проект "AlphaGo" действительно "закрыли", в том смысле, что больше соревнований в Го с людьми не будет. Но работа всё равно идёт. Например, статья "AlphaGo Zero" была написана в октябре 2017 (хотя сама работа была сделана ранее), а вот"AlphaZero" вообще был полностью написан после того объявления о закрытии, или вот AlphaGo Teach: https://alphagoteach.deepmind.com/, - был запущен в декабре 2017.

    По поводу AlphaZero и шахмат -- вначале DeepMind опубликует полноценную статью в научном журнале, а не препринт, а потом будет думать, какими будут дальнейшие шаги. Уверен, что вопрос "сильнее ли alphazero чем stockfish" в воздухе не повиснет.
    N1mTzo нравится это.
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Если вы о недавней речи Хассабиса, то она на 90% состоит из повторения всех предыдущих презентаций, и на 10% - из пересказа препринта, подготовленного по материалам работ до апреля 2017 года.
  23. Benas Новичок

    • Новичок
    Рег.:
    09.05.2017
    Сообщения:
    67
    Симпатии:
    6
    Репутация:
    1
    Оффлайн
    Шахматы - как некая площадка и думаю в ней будет еще не одна битва титанов...
    Аlpha стала как бы сильнейшей, но на вечно ли ?
  24. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Против прорвы TPU (и прочих монстров) у Стока нет шансов, более интересным имхо было бы сравнить Альфу (ее алгоритмы), обученную на чем-то вроде Intel Loihi с тем же Стоком на среднем железе, устроить некий тест ПК vs ПК.
  25. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Ничто не вечно — это понятно.
    AlphaZero — Морфи наших дней! Это понятно?;)
  26. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.567
    Симпатии:
    1.849
    Репутация:
    78
    Адрес:
    Москва
    Оффлайн
    Понятно. Сойдёт с ума и займётся адвокатской практикой.
    Последние данные очков репутации:
    ШахматыЭтоДиагноз: 1 (Это пять!) 31 янв 2018
  27. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    108
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Расчеты показывают что как раз наоборот. По мнению разработчиков запаса роста ЭЛО а А0 уже нет практически нет (смотрите графики), и то отставание Стокфиша в 100 ЭЛО, что было продемонстрировано, вполне успешно компенсируются более адекватными условиями игры (хотя бы побольше хеша, изменения контроля, добавление дебютной книжки ну и лучше Стокфиша только новый Стокфиш, который вот вот зарелизят )
  28. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Матч показал именно то, что он показал, что SF вообще не шарит в позах с позиционной жертвой, за что и огр*** множество раз.

    Кто вам сказал, что А0 абсолют и его игру нельзя улучшить? Если смотреть как улучшили алгоритмы для Го там есть куда расти:
    [​IMG]

    Если верить "родным" тестам Вяленого, то между версией v8 и самыми новыми билдами нет и близко разницы 100 эло. Если же глянуть еще независимые тесты типа computerchess.org.uk (там гоняют разные движки друг с другом, а не стравливают разные билды Вяленого), то там и вовсе разница в 20 эло.
  29. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    108
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Возможно, что ему просто не хватило тех условий, что его лишили (в данном случае контроля и хеша)

    Вы разве не про шахматы писали?
    Сток вроде пока в Го не играет даже плохо.

    Поэтому я и перечислил 4 условия, которые в сумме и дадут примерно 100 ЭЛО роста.
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.854
    Симпатии:
    11.648
    Репутация:
    717
    Нарушения:
    21
    Оффлайн
    там одна книжка даст 120 :)
  31. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    108
    Симпатии:
    14
    Репутация:
    0
    Оффлайн
    Оценки разные, от 50 до 160, тут я решил потестить книжку Стока (Braina) по сравнению с Perfect2017, был очень удивлен преимуществу в 40 ЭЛО, но дебютная книжка это такая вещь, что с неё оппоненту легко уйти, просто сделав один ход "не по ней". Эндшпильная в этом смысле более определенная, если удалось свести к выигрышной позиции, то сорваться с крючка уже не возможно, можно только укоротить агонию :)
  32. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.798
    Симпатии:
    281
    Репутация:
    19
    Адрес:
    Киев
    Оффлайн
    Обычно это будет второсортный ход, не создающий больших проблем за белых, и приводящей к худшей позиции за чёрных.
  33. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.854
    Симпатии:
    11.648
    Репутация:
    717
    Нарушения:
    21
    Оффлайн
    очень серьёзный тест книг у Седата
    https://sites.google.com/site/computerschess/scct-book-cs-17
    +104 книжка Брейнфиша даёт

    с книжки Брейна без потерь не уйдёшь :)
    Она не из партий создаётся, а методом Монте-Карло, как я понял, вскользь ознакомившись
    --- добавлено: 31 янв 2018 ---
    И самое главное!
    Зная КВ, железо и движок соперника, можно создать книгу, которая будет выносить под 100% движок без книжки
    Последние данные очков репутации:
    Rom: 1 (Лениво мне было обновлять старые ссылки, но всегда найдутся добрые люди :)) 31 янв 2018
    Rom нравится это.
  34. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Складывается впечатление, что вы в этой теме первые 30+ страниц не читали (судя по регистрации так и есть).

    Вы в курсе, что А0 изначально не под шахматы разрабатывался? Шахматы так, между делом были протестированы. Очевидно, что если бы авторы A0 вложили столько своего времени в шахматы, сколько они вложили в Го, то ИИ еще сильнее играл бы в шахматы.

    Так мы книжку тестируем, или алгоритмы Вяленого? Это уже похоже на натягивание совы на глобус, а не на честное соревнование. Хэша добавить еще можно, контроль не на ход, а на партию сделать (и то в матче был норм контроль как по мне), возможно еще 5-фигурки дать Стоку, книжку ходов на 8-10. Всё остальное имхо - это бессмысленный буст Стокфиша.

    В любой дебютной книге используется монте-карло, ведь это статистика (наигрывание) того или иного хода. Другой уже вопрос, насколько это статистика достоверна, при каком контроле она наиграна. Ходы с хорошей статистикой на поверку не всегда оказываются хорошими.

    При сопоставимых по силе движках (и железе) ни о каких 100% речи быть не может, даже если в УКК тестировать.
  35. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    11.854
    Симпатии:
    11.648
    Репутация:
    717
    Нарушения:
    21
    Оффлайн
    читал он всё!
    И здесь, и на других ресурсах :)
    Он и описывает невыгодные условия, только недооценивает их!
    --- добавлено: 31 янв 2018 ---
    у Альфы книжка не на 8 ходов просчитана

    Когда это ты в альфафаны переметнулся?
    В прошедшем матче она не показала ничего сверхъестественного, если дать Стоку его костыли, то он и на том железе победит
    --- добавлено: 31 янв 2018, опубликовано: 31 янв 2018 ---
    в этой книжке считают типа ИДеА, и левые ходы тоже, там беспонтово от первой линии сильно дёргаться
    --- добавлено: 31 янв 2018 ---
    это не партии на каком-то контроле, это ходы на приличном времени анализа!
    Эта книжка, насчитанная самим же Стокфишем, выводила бы его в нулях (а то и в плюсе) в любом дебюте

Поделиться этой страницей