AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Ничто не вечно — это понятно.
    AlphaZero — Морфи наших дней! Это понятно?;)
  2. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.386
    Симпатии:
    2.860
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Понятно. Сойдёт с ума и займётся адвокатской практикой.
  3. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Расчеты показывают что как раз наоборот. По мнению разработчиков запаса роста ЭЛО а А0 уже нет практически нет (смотрите графики), и то отставание Стокфиша в 100 ЭЛО, что было продемонстрировано, вполне успешно компенсируются более адекватными условиями игры (хотя бы побольше хеша, изменения контроля, добавление дебютной книжки ну и лучше Стокфиша только новый Стокфиш, который вот вот зарелизят )
  4. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Матч показал именно то, что он показал, что SF вообще не шарит в позах с позиционной жертвой, за что и огребал множество раз.

    Кто вам сказал, что А0 абсолют и его игру нельзя улучшить? Если смотреть как улучшили алгоритмы для Го там есть куда расти:
    [​IMG]

    Если верить "родным" тестам Вяленого, то между версией v8 и самыми новыми билдами нет и близко разницы 100 эло. Если же глянуть еще независимые тесты типа computerchess.org.uk (там гоняют разные движки друг с другом, а не стравливают разные билды Вяленого), то там и вовсе разница в 20 эло.
  5. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Возможно, что ему просто не хватило тех условий, что его лишили (в данном случае контроля и хеша)

    Вы разве не про шахматы писали?
    Сток вроде пока в Го не играет даже плохо.

    Поэтому я и перечислил 4 условия, которые в сумме и дадут примерно 100 ЭЛО роста.
  6. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    там одна книжка даст 120 :)
  7. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Оценки разные, от 50 до 160, тут я решил потестить книжку Стока (Braina) по сравнению с Perfect2017, был очень удивлен преимуществу в 40 ЭЛО, но дебютная книжка это такая вещь, что с неё оппоненту легко уйти, просто сделав один ход "не по ней". Эндшпильная в этом смысле более определенная, если удалось свести к выигрышной позиции, то сорваться с крючка уже не возможно, можно только укоротить агонию :)
  8. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.414
    Симпатии:
    945
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Обычно это будет второсортный ход, не создающий больших проблем за белых, и приводящей к худшей позиции за чёрных.
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    очень серьёзный тест книг у Седата
    https://sites.google.com/site/computerschess/scct-book-cs-17
    +104 книжка Брейнфиша даёт

    с книжки Брейна без потерь не уйдёшь :)
    Она не из партий создаётся, а методом Монте-Карло, как я понял, вскользь ознакомившись
    —- добавлено: 31 янв 2018 —-
    И самое главное!
    Зная КВ, железо и движок соперника, можно создать книгу, которая будет выносить под 100% движок без книжки
    Rom нравится это.
  10. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Складывается впечатление, что вы в этой теме первые 30+ страниц не читали (судя по регистрации так и есть).

    Вы в курсе, что А0 изначально не под шахматы разрабатывался? Шахматы так, между делом были протестированы. Очевидно, что если бы авторы A0 вложили столько своего времени в шахматы, сколько они вложили в Го, то ИИ еще сильнее играл бы в шахматы.

    Так мы книжку тестируем, или алгоритмы Вяленого? Это уже похоже на натягивание совы на глобус, а не на честное соревнование. Хэша добавить еще можно, контроль не на ход, а на партию сделать (и то в матче был норм контроль как по мне), возможно еще 5-фигурки дать Стоку, книжку ходов на 8-10. Всё остальное имхо - это бессмысленный буст Стокфиша.

    В любой дебютной книге используется монте-карло, ведь это статистика (наигрывание) того или иного хода. Другой уже вопрос, насколько это статистика достоверна, при каком контроле она наиграна. Ходы с хорошей статистикой на поверку не всегда оказываются хорошими.

    При сопоставимых по силе движках (и железе) ни о каких 100% речи быть не может, даже если в УКК тестировать.
  11. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    читал он всё!
    И здесь, и на других ресурсах :)
    Он и описывает невыгодные условия, только недооценивает их!
    —- добавлено: 31 янв 2018 —-
    у Альфы книжка не на 8 ходов просчитана

    Когда это ты в альфафаны переметнулся?
    В прошедшем матче она не показала ничего сверхъестественного, если дать Стоку его костыли, то он и на том железе победит
    —- добавлено: 31 янв 2018, опубликовано: 31 янв 2018 —-
    в этой книжке считают типа ИДеА, и левые ходы тоже, там беспонтово от первой линии сильно дёргаться
    —- добавлено: 31 янв 2018 —-
    это не партии на каком-то контроле, это ходы на приличном времени анализа!
    Эта книжка, насчитанная самим же Стокфишем, выводила бы его в нулях (а то и в плюсе) в любом дебюте
  12. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    цитируемая книжка от Зиппорта это не книжка-убийца с длинными редкими ветками, а широкое полотно
    Но я уже приводил здесь партию, где Сток без книги заплывает во французской в тесте Седата (с другой, более специализированной книжкой)
    Игра начинается с +4.5
    Не веришь, что они все закончатся победой?
  13. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    По крайней мере много чего, и дело в том,что мой оппонент не совсем учитывает тот факт, что Гугл выложил только 10 игр из 28 проигранных Стоком, скорее всего они отбирались что бы показать интеллект A0, но даже в них есть такие,которые трудно повторить Стоку 8, так как он сделанный в матче с A0 ход не под каким видом не хочет повторять даже при гораздо худшем железе, что было с недоумением замечено некоторыми комментаторами (видео есть).
    То есть мнение, которое хочет создать Гугл , весьма предвзято.
    По любому оценки будут весьма приблизительные и моя цель только подчеркнуть что A0 и SF примерно равные игроки (даже на весьма не равном железе) и поставить под сомнение фразу :
    С вашими условиями вполне можно согласиться, именно так и тестируют обычно движки (с малоходовой книжкой).
  14. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    давайте опираться на факты!
    1. Партий было не 100
    2. Сток проиграл не 28
    3. Есть выигранные

    тут соглашусь

    А тут нет!
    Ни одного хода, якобы не Стокфиша 8, представлено не было
    sovaz1997 нравится это.
  15. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Речь не об этом, а о том, что при том сочетании контроля, хеша и числа ядер,тот ход, который не был бы в первой линии при нормальных параметрах игры оказался в первой линии.

    те 10, что выложены, были из числа 28 проигранных в матче из 100 игр
    (если верить Гуглу)
    Разумеется этим одним матчем дело не ограничилось ... (полный список итогов всех матчей вполне доступен)
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    если об этом, то ролик можно было не приводить :)
    с ходом Лf8 мы выяснили здесь месяц назад
  17. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Это твой твинк?:D

    Я об этих более-менее справедливых условиях (для обоих участниках матча) писАл страниц двадцать назад. Альфаман/альфафоб тут не применимо.

    Ну здрасти! А талевские атаки в новоиндийке с жертвами, а избиение в испанке, а жертва фиги во французской?


    Дебютное дерево в шахматах слишком широкое, все посчитать не получится, тем более в каких-нить кривых дебютах типа старушки или французской движки типа стока буксуют довольно часто.


    Тут мы опять упираемся в границы перебора, о чем я и писал. Пусть у тебя книга на 30 полуходов проанализирована, а соперник на 35 считает. И эти нули превращаются в дырку от бублика. Помню ловил таких ребят еще когда в переписку играл, тогда любителей идеевской книги с оценками было много.

    Ты веришь, что движок 100 раз пойдет в этот один кривой вариант? Я такие книжки с кривыми вариантами сам клепал когда на плече играл лет 10 назад (а то и 15, когда рулили фрицы 5, 6 и 7:gigi:), даже тогда движки через раз лезли в такие варианты (подловить не так легко было), а уж сейчас еще меньше лезут, т.к. на 400-500-600 пунктов сильнее играют и рандомят при поражении другой дебют(вариант).
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.722
    Репутация:
    1.124
    Нарушения:
    32
    Оффлайн
    нет, я его встречал в похожих темах на других ресурсах

    а я помню...
    Но книга 8-10 это не справедливость, а фикция

    Будем десятком партий восторгаться, а в проигранных, возможно, одноходовые зевки :)

    Так вот пусть соперник (вернее, соперница) и покажет пересчитывание Стокфиша в этих условиях
    И, кстати, можешь поискать дырки в той книге
    Будет очень интересно (тебе в поиске... и нам, если найдёшь)
    —- добавлено: 1 фев 2018, опубликовано: 1 фев 2018 —-
    100 раз не пойдёт в один и тот же, но у тебя же и боковушки посчитаны...
    Если клепал, то зачем удивляться?

    Да уж, таперича, не то, что давеча
    Но в Гугле тоже "не дураки", при контроле минута на ход они дерево очень заузили
    —- добавлено: 1 фев 2018 —-
    Очень интересно!
    И где же у него хранится знание о проигрыше?
  19. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Есть ещё новый бот minusGo, играющий в Go на доске 9x9, используя методы из AlphaZero (в отличие от Leela Zero который использует методы из AlphaGo Zero).
    https://online-go.com/player/481097/
    И вот ещё один похожий бот: https://online-go.com/player/495900/

    Кроме того, Google позавчера выложил реализацию AlphaGo Zero на tensorflow: https://github.com/tensorflow/minigo.
    Это не тот самый AlphaGo от Deepmind, а просто энтузиасты из Google написали совсем отдельную реализацию по статьям об AlphaGo, в качестве примера проекта, использующего Tensorflow.
    N1mTzo нравится это.
  20. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Странно, я уж думал что её забросили?
    Ну может как нибудь и AlphaZero в свободное от работы время выложат :)
  21. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    62
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    В идеале, что бы сравнить алгоритмы Альфы и Стока , нужно дать и тому и другому хорошую книгу и заставить альфу чтобы она играла по ней.
    Эндшпильные базы то же можно дать обоим. Контроль часа по 1.5 каждому. Ну и с хешом прблему как то тоже можно решить. И тогда весь вопрос останется только в железе. И если железо удасться приравнять, (хоть я и болею за стока) думаю перевёс всё же будет за Альфой.
  22. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Ага, а в миттельшпиле заставить чтобы альфа играла так же как стокфиш!

    Если AlphaZero "понимает" дебюты лучше, чем "хорошая книга", то не понятно, зачем её заставлять играть по книге.
    А Stockfish'у можно книгу разрешить, да.

    Насчёт эндшпильной базы — более трудный вопрос.
    Стокфишу вполне можно её выдать, но это будет бесспорное преимущество у стокфиша.
    Выдавать ли базу AlphaZero — зависит от вопроса, на который надо ответить. Если "играет ли движок, построенный исключительно на нейронных сетях, лучше классических", то выдавать не надо. А если "надо построить как можно более сильный движок" — то выдавать нужно.
  23. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Имеется в виду переучить A0? Что бы она обучалась по книге?
    думаю что это шаг назад, она и так сыграв 44 млн игр неплохо научилась и содержит в себе книгу ничуть не хуже.
    Вполне можно и даже Cerebellum целиком дать,тем более что это как раз именно та, которая по SF и создана.
    Вопрос довольно не трудный, считается что концовка в теории хорошо отработана и играть там не интересно, эндшпильная база нужна что б не тратить время зазря, раз уже и так известен результат. Мы же не хотим проверить ЭБ? (Про них и так всё изветсно)
    p.S. К тому же до эндшпиля ещё надо как то дожить.... Не всем удается...
  24. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    62
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
    Нет не обучалась, а просто первые ходы и альфа и сток должны делать строго по книге, и и после определенного хода включаться в игру.
  25. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Ну так книга то ведь не Богом данная (чай не Библия :) ), наверняка есть много достойных ходов, которых там нет и A0 их может найти при обучении или при игре.
  26. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    А вот если чуток вернуться , то я не поленился сделать картинку
    [​IMG]
    Из которой и следует что правильный ход уже рассчитывается после 3 млрд позиций примерно через 42 с (что меньше 1 мин) и более не меняется ,по крайней мере до 1 мин (до 4.6 млрд позиций).
    И он сделан SF8 исключительно из-за маленького хеша
  27. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Для AlphaZero уже не совсем актуально.
  28. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    От версии SF это не зависит, это системная ошибка организаторов матча A0 и SF
  29. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.248
    Симпатии:
    3.005
    Репутация:
    116
    Нарушения:
    31
    Оффлайн
  30. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.248
    Симпатии:
    3.005
    Репутация:
    116
    Нарушения:
    31
    Оффлайн
    Каспаров об AlphaZero и остальном. Обещает в апреле-мае выйдет полная статья
    Undying и crem нравится это.
  31. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.248
    Симпатии:
    3.005
    Репутация:
    116
    Нарушения:
    31
    Оффлайн
    Началось распределенное обучение leela-chess. Здесь можно посмотреть игры.
    WinPooh, crem и Rom нравится это.
  32. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.386
    Симпатии:
    2.860
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Выбрал первую попавшуюся, и сразу наткнулся на шедевр:
    http://162.217.248.187/game/3279
  33. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.414
    Симпатии:
    945
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Имхо, лучше было бы время на ход увеличить, чтобы монте-карло больше вариантов смотрел... Как-то вообще грустно
  34. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    28.01.2011
    Сообщения:
    4.788
    Симпатии:
    2.610
    Репутация:
    222
    Оффлайн
    Китайские свиноводы делают ставку на искусственный интеллект

    Компания Alibaba Cloud в сотрудничестве с Tequ Group и Dekon Group внедрила свою платформу искусственного интеллекта ET Brain в свиноводстве. Ожидается, что искусственный интеллект позволит увеличить средний приплод в расчете на свиноматку на три головы за год, а показатель смертности поросят сделать ниже 3%.

    [​IMG]
    Конкурентоспособность свиноферм оценивается по двум основным показателям: PSY (годовой приплод в расчете на свиноматку) и MSY (число товарных свиней в год в расчете на свиноматку). В Дании, например, PSY достигает 30, тогда как в Китае пока достигнуты показатели около 20. Alibaba Cloud и партнеры рассчитывают цвеличить этот показатель до 32.

    Искусственный интеллект использует для оптимального индивидуального ухода технологии распознавания по внешности и голосу. С самого рождения он отслеживает активность и развитие поросенка. Обнаруживая отклонения в поведении животных, система обращает на них внимание животновода, который принимает необходимые меры, например, если свинья готовится опороситься или нуждается в лечении.
    Комментарий:
    • UF Наконец-то дельное применение ИИ. А то все шахматы какие-то подсовывают да управление автомобилем. Для машины интеллект необязателен, достаточно реакции )
    mikola7 нравится это.
  35. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    Рег.:
    30.12.2009
    Сообщения:
    14.048
    Симпатии:
    6.831
    Репутация:
    487
    Нарушения:
    9
    Оффлайн
    Глупость какая. Весь опыт человечества доказывает, что чем больше в обществе интеллекта, тем меньший прирост населения. И наоборот: чем меньше культуры и больше свинства, тем плодовитость выше.
    Undying нравится это.

Поделиться этой страницей