AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    10.492
    Симпатии:
    9.942
    Репутация:
    549
    Нарушения:
    36
    Оффлайн
    цитируемая книжка от Зиппорта это не книжка-убийца с длинными редкими ветками, а широкое полотно
    Но я уже приводил здесь партию, где Сток без книги заплывает во французской в тесте Седата (с другой, более специализированной книжкой)
    Игра начинается с +4.5
    Не веришь, что они все закончатся победой?
  2. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    По крайней мере много чего, и дело в том,что мой оппонент не совсем учитывает тот факт, что Гугл выложил только 10 игр из 28 проигранных Стоком, скорее всего они отбирались что бы показать интеллект A0, но даже в них есть такие,которые трудно повторить Стоку 8, так как он сделанный в матче с A0 ход не под каким видом не хочет повторять даже при гораздо худшем железе, что было с недоумением замечено некоторыми комментаторами (видео есть).
    То есть мнение, которое хочет создать Гугл , весьма предвзято.
    По любому оценки будут весьма приблизительные и моя цель только подчеркнуть что A0 и SF примерно равные игроки (даже на весьма не равном железе) и поставить под сомнение фразу :
    С вашими условиями вполне можно согласиться, именно так и тестируют обычно движки (с малоходовой книжкой).
  3. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    10.492
    Симпатии:
    9.942
    Репутация:
    549
    Нарушения:
    36
    Оффлайн
    давайте опираться на факты!
    1. Партий было не 100
    2. Сток проиграл не 28
    3. Есть выигранные

    тут соглашусь

    А тут нет!
    Ни одного хода, якобы не Стокфиша 8, представлено не было
    sovaz1997 нравится это.
  4. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Речь не об этом, а о том, что при том сочетании контроля, хеша и числа ядер,тот ход, который не был бы в первой линии при нормальных параметрах игры оказался в первой линии.

    те 10, что выложены, были из числа 28 проигранных в матче из 100 игр
    (если верить Гуглу)
    Разумеется этим одним матчем дело не ограничилось ... (полный список итогов всех матчей вполне доступен)
  5. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    10.492
    Симпатии:
    9.942
    Репутация:
    549
    Нарушения:
    36
    Оффлайн
    если об этом, то ролик можно было не приводить :)
    с ходом Лf8 мы выяснили здесь месяц назад
  6. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Это твой твинк?:D

    Я об этих более-менее справедливых условиях (для обоих участниках матча) писАл страниц двадцать назад. Альфаман/альфафоб тут не применимо.

    Ну здрасти! А талевские атаки в новоиндийке с жертвами, а избиение в испанке, а жертва фиги во французской?


    Дебютное дерево в шахматах слишком широкое, все посчитать не получится, тем более в каких-нить кривых дебютах типа старушки или французской движки типа стока буксуют довольно часто.


    Тут мы опять упираемся в границы перебора, о чем я и писал. Пусть у тебя книга на 30 полуходов проанализирована, а соперник на 35 считает. И эти нули превращаются в дырку от бублика. Помню ловил таких ребят еще когда в переписку играл, тогда любителей идеевской книги с оценками было много.

    Ты веришь, что движок 100 раз пойдет в этот один кривой вариант? Я такие книжки с кривыми вариантами сам клепал когда на плече играл лет 10 назад (а то и 15, когда рулили фрицы 5, 6 и 7:gigi:), даже тогда движки через раз лезли в такие варианты (подловить не так легко было), а уж сейчас еще меньше лезут, т.к. на 400-500-600 пунктов сильнее играют и рандомят при поражении другой дебют(вариант).
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    10.492
    Симпатии:
    9.942
    Репутация:
    549
    Нарушения:
    36
    Оффлайн
    нет, я его встречал в похожих темах на других ресурсах

    а я помню...
    Но книга 8-10 это не справедливость, а фикция

    Будем десятком партий восторгаться, а в проигранных, возможно, одноходовые зевки :)

    Так вот пусть соперник (вернее, соперница) и покажет пересчитывание Стокфиша в этих условиях
    И, кстати, можешь поискать дырки в той книге
    Будет очень интересно (тебе в поиске... и нам, если найдёшь)
    --- добавлено: 1 фев 2018, опубликовано: 1 фев 2018 ---
    100 раз не пойдёт в один и тот же, но у тебя же и боковушки посчитаны...
    Если клепал, то зачем удивляться?

    Да уж, таперича, не то, что давеча
    Но в Гугле тоже "не дураки", при контроле минута на ход они дерево очень заузили
    --- добавлено: 1 фев 2018 ---
    Очень интересно!
    И где же у него хранится знание о проигрыше?
  8. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    75
    Симпатии:
    70
    Репутация:
    4
    Оффлайн
    Есть ещё новый бот minusGo, играющий в Go на доске 9x9, используя методы из AlphaZero (в отличие от Leela Zero который использует методы из AlphaGo Zero).
    https://online-go.com/player/481097/
    И вот ещё один похожий бот: https://online-go.com/player/495900/

    Кроме того, Google позавчера выложил реализацию AlphaGo Zero на tensorflow: https://github.com/tensorflow/minigo.
    Это не тот самый AlphaGo от Deepmind, а просто энтузиасты из Google написали совсем отдельную реализацию по статьям об AlphaGo, в качестве примера проекта, использующего Tensorflow.
    N1mTzo нравится это.
  9. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Странно, я уж думал что её забросили?
    Ну может как нибудь и AlphaZero в свободное от работы время выложат :)
  10. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    31
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    В идеале, что бы сравнить алгоритмы Альфы и Стока , нужно дать и тому и другому хорошую книгу и заставить альфу чтобы она играла по ней.
    Эндшпильные базы то же можно дать обоим. Контроль часа по 1.5 каждому. Ну и с хешом прблему как то тоже можно решить. И тогда весь вопрос останется только в железе. И если железо удасться приравнять, (хоть я и болею за стока) думаю перевёс всё же будет за Альфой.
  11. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    75
    Симпатии:
    70
    Репутация:
    4
    Оффлайн
    Ага, а в миттельшпиле заставить чтобы альфа играла так же как стокфиш!

    Если AlphaZero "понимает" дебюты лучше, чем "хорошая книга", то не понятно, зачем её заставлять играть по книге.
    А Stockfish'у можно книгу разрешить, да.

    Насчёт эндшпильной базы -- более трудный вопрос.
    Стокфишу вполне можно её выдать, но это будет бесспорное преимущество у стокфиша.
    Выдавать ли базу AlphaZero -- зависит от вопроса, на который надо ответить. Если "играет ли движок, построенный исключительно на нейронных сетях, лучше классических", то выдавать не надо. А если "надо построить как можно более сильный движок" -- то выдавать нужно.
  12. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Имеется в виду переучить A0? Что бы она обучалась по книге?
    думаю что это шаг назад, она и так сыграв 44 млн игр неплохо научилась и содержит в себе книгу ничуть не хуже.
    Вполне можно и даже Cerebellum целиком дать,тем более что это как раз именно та, которая по SF и создана.
    Вопрос довольно не трудный, считается что концовка в теории хорошо отработана и играть там не интересно, эндшпильная база нужна что б не тратить время зазря, раз уже и так известен результат. Мы же не хотим проверить ЭБ? (Про них и так всё изветсно)
    p.S. К тому же до эндшпиля ещё надо как то дожить.... Не всем удается...
  13. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    31
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    Нет не обучалась, а просто первые ходы и альфа и сток должны делать строго по книге, и и после определенного хода включаться в игру.
  14. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Ну так книга то ведь не Богом данная (чай не Библия :) ), наверняка есть много достойных ходов, которых там нет и A0 их может найти при обучении или при игре.
  15. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    А вот если чуток вернуться , то я не поленился сделать картинку
    [​IMG]
    Из которой и следует что правильный ход уже рассчитывается после 3 млрд позиций примерно через 42 с (что меньше 1 мин) и более не меняется ,по крайней мере до 1 мин (до 4.6 млрд позиций).
    И он сделан SF8 исключительно из-за маленького хеша
  16. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Для AlphaZero уже не совсем актуально.
  17. svoitsl Новичок

    • Новичок
    Рег.:
    05.01.2018
    Сообщения:
    73
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    От версии SF это не зависит, это системная ошибка организаторов матча A0 и SF
  18. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    506
    Симпатии:
    1.073
    Репутация:
    73
    Нарушения:
    10
    Оффлайн
  19. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    506
    Симпатии:
    1.073
    Репутация:
    73
    Нарушения:
    10
    Оффлайн
    Каспаров об AlphaZero и остальном. Обещает в апреле-мае выйдет полная статья
    Undying и crem нравится это.
  20. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    506
    Симпатии:
    1.073
    Репутация:
    73
    Нарушения:
    10
    Оффлайн
    Началось распределенное обучение leela-chess. Здесь можно посмотреть игры.
    WinPooh, crem и Rom нравится это.
  21. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.240
    Симпатии:
    1.650
    Репутация:
    60
    Адрес:
    Москва
    Оффлайн
    Выбрал первую попавшуюся, и сразу наткнулся на шедевр:
    http://162.217.248.187/game/3279
  22. Mustitz Заслуженный

    • Заслуженный
    • Участник
    Рег.:
    30.09.2006
    Сообщения:
    2.705
    Симпатии:
    201
    Репутация:
    12
    Адрес:
    Киев
    Оффлайн
    Имхо, лучше было бы время на ход увеличить, чтобы монте-карло больше вариантов смотрел... Как-то вообще грустно
  23. Challenger Spy Модератор

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    3.360
    Симпатии:
    1.981
    Репутация:
    182
    Оффлайн
    Китайские свиноводы делают ставку на искусственный интеллект

    Компания Alibaba Cloud в сотрудничестве с Tequ Group и Dekon Group внедрила свою платформу искусственного интеллекта ET Brain в свиноводстве. Ожидается, что искусственный интеллект позволит увеличить средний приплод в расчете на свиноматку на три головы за год, а показатель смертности поросят сделать ниже 3%.

    [​IMG]
    Конкурентоспособность свиноферм оценивается по двум основным показателям: PSY (годовой приплод в расчете на свиноматку) и MSY (число товарных свиней в год в расчете на свиноматку). В Дании, например, PSY достигает 30, тогда как в Китае пока достигнуты показатели около 20. Alibaba Cloud и партнеры рассчитывают цвеличить этот показатель до 32.

    Искусственный интеллект использует для оптимального индивидуального ухода технологии распознавания по внешности и голосу. С самого рождения он отслеживает активность и развитие поросенка. Обнаруживая отклонения в поведении животных, система обращает на них внимание животновода, который принимает необходимые меры, например, если свинья готовится опороситься или нуждается в лечении.
    Комментарий:
    • UF Наконец-то дельное применение ИИ. А то все шахматы какие-то подсовывают да управление автомобилем. Для машины интеллект необязателен, достаточно реакции )
    Последние данные очков репутации:
    mikola7: 1 24 фев 2018
    mikola7 нравится это.
  24. Vladruss НедоКМС

    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    9.549
    Симпатии:
    3.160
    Репутация:
    289
    Нарушения:
    50
    Оффлайн
    Глупость какая. Весь опыт человечества доказывает, что чем больше в обществе интеллекта, тем меньший прирост населения. И наоборот: чем меньше культуры и больше свинства, тем плодовитость выше.
  25. MS Михаил Семионенков

    • Команда форума
    Рег.:
    10.02.2006
    Сообщения:
    5.901
    Симпатии:
    1.572
    Репутация:
    131
    Оффлайн
    :)
  26. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    506
    Симпатии:
    1.073
    Репутация:
    73
    Нарушения:
    10
    Оффлайн
    После сотни тысяч партий leela-chess-zero стара играть на 1000 эло сильнее. Из некоторых партий отсекает все лишнее, и они действительно заслуживали бы помещения в книгах. Но эти бесценные крупицы знаний были открыты человеком ранее
    http://162.217.248.187/game/53341
    Наверно, еще несколько тысяч эло и доберется до уровня человека-начинающего. В Го, кажется, что-то около 5 тысяч эло между случайной игрой и начинающим.
  27. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    429
    Симпатии:
    143
    Репутация:
    21
    Оффлайн
    Меньше. По крайней мере в отношении Лила Зеро.

    Прежде всего, реальное эло и эло самоигры соотносятся примерно как 1:3. Кроме того, могу подтвердить как новичок в игре 19х19, что непросто выиграть уже у сетки 860k (1732 эло самоигры от рандома) на переборе 1600 playouts/ход.

    Если верить этому ресурсу, то 860k соответствует примерно 28 кю традиционной шкалы. Для сравнения, 11 кю - это норма 3-го спортивного разряда ЕВСК и РФГ, 7 кю - 2-го разряда, конечно при всей условности сопоставления разных систем.
  28. SDChess Учаcтник

    • Участник
    Рег.:
    01.05.2006
    Сообщения:
    192
    Симпатии:
    33
    Репутация:
    4
    Оффлайн
    Хорошие новости от Геннадия Обухова! На этот раз Геннадий, давний партнер нашего сайта, хороший шахматный журналист, вдумчивый аналитик взялся за труд прокомментировать понятным даже для любителя языком партии недавно завершившегося матча Stockfish и AlphaZero. Напомню, что матч, о котором идет речь, прошел с контроле 1 мин/ход 4TPU ALphaZero против 64core Stockfish. AlphaZero выиграла W-D-L 28-72-0 (О железе, которое использовала программа AlphaZero мало что известно).
    Комментарии Геннадия Обухова, написаны живых ярким и образным языком, должны быть интересны даже тем, кто знаком с опубликованными партиями знаменитого матча, кроме того, Геннадий предлагает вашему вниманию мнения сильнейших шахматистов мира по этой теме... Посмотреть его материалы, которые он назвал "ШАХМАТНЫЙ ТЕРМИНАТОР: настоящее безумие" можно здесь.
    http://www.sdchess.ru/news.htm
    Launder, crem и sovaz1997 нравится это.
  29. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    75
    Симпатии:
    70
    Репутация:
    4
    Оффлайн
    Кстати, если кому-то не жалко использовать вычислительные мощности своего компа для обучения lczero, можно запустить программу-клиента lczero чтобы она считала.
    Современный комп может просчитать где-то 3500-4000 партий за сутки, а комп, который был современным 5 лет назад -- 1500-2000 партий.
    Сейчас там всего 10-15 постоянных пользователей, и в сумме они просчитывают всего около 20000 партий в день. Поэтому любая помощь ощутима.
  30. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    429
    Симпатии:
    143
    Репутация:
    21
    Оффлайн
    Какая-то глючная у них программа. Bench для GPU и CPU категорически не совпадает. По крайней мере на моём компе. Нейросетку, тренированную на партиях людей, и которая в их тестах обыгрывает GnuChess (2800 эло), в состоянии обыграть даже я.

    P.S. Какого качества будет "помощь" при таких глюках, даже представить сложно.
  31. crem Новичок

    • Новичок
    Рег.:
    24.11.2016
    Сообщения:
    75
    Симпатии:
    70
    Репутация:
    4
    Оффлайн
    Не понимаю что значит "Bench для GPU и CPU категорически не совпадает."
    Во-первых, там далеко не 2800 ELO, вообще не знаю откуда вы это взяли. Gnuchess запускался в режиме 30 ходов в минуту. Цели обыграть gnuchess не было, просто тестировали, что сеть способна учиться.
    Во-вторых, конечно в программе вероятно наличие ошибок, ведь проект совсем новый (хотя в последние пару дней всё спокойно). Исправление и обнаружение этих ошибок -- это тоже часть процесса разработки/обучения, и для этого тоже нужны вычислительные мощности, и добавление вычислительных мощностей пододвигает дату, когда lczero заиграет хорошо.
  32. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    429
    Симпатии:
    143
    Репутация:
    21
    Оффлайн
    При запуске bench-теста в консоли lczero, на одной и той же нейросети, с одинаковыми параметрами, на одном потоке (thread), без рандомизации, оценки позиции для GPU и CPU должны совпадать. Но у меня они кардинально отличаются. От "равно" до "выиграно". Причём если параметр -t прямо прописан в файле .bat, то bench-тест вылетает с ошибкой.

    Взял отсюда и начиная отсюда. Если сеть выигрывает у как минимум 2800 CCRL со счётом 8,5 - 1,5, то её уровень всяко должен быть очень приличный.

    Да, я знаю, и в целом вполне согласен. Только у меня есть некоторый отрицательный опыт в этом отношении. Четыре месяца назад, когда проект Лила Го Зеро ещё только начинался, я наиграл одну партию на пробу. Потратил на неё 8 часов. Дожидаясь её окончания, я полагал, что по крайней мере помогаю проекту. Но оказалось, что даже немного вредил :) . Впоследствии выяснилось, что на некоторых компьютерах OpenCL высчитывается некорректно, и до тех пор пока не была введена самопроверка, такие машины по сути добавляли в тренировочный набор партии с рандомными ходами.

    Может быть конечно я перестраховываюсь, но если версия для CPU (от 8 марта) сначала не хочет запускаться на CPU (её удалось принудить к этому только запуская с параметром --gpu 1), а потом на приличной нейросети с параметром -p 100 вчистую проигрывает даже 8-му (из 20-ти) уровню игры Стока, то вполне возможно, что с ней что-то не так.

    P.S. Ещё одна возможная проблема - версия для CPU, с параметром -t 2, загружает 4-ядерный процессор на 100%, а с параметром -t 1 примерно на 90%.
  33. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    506
    Симпатии:
    1.073
    Репутация:
    73
    Нарушения:
    10
    Оффлайн
    На уровне 2700 в своих эло от нуля на глаз заметен, кажется, стал прогресс: LCZero научилась ставить мат в 1 ход. Мини-шедевр:
    http://162.217.248.187/game/331103
  34. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    8.240
    Симпатии:
    1.650
    Репутация:
    60
    Адрес:
    Москва
    Оффлайн
    Тем временем гошная Лила Зеро выиграла на равных у корейской профессионалки в отставке:
    https://online-go.com/game/12063810
  35. Zayats Без определенного статуса

    • Ветеран
    Рег.:
    08.01.2007
    Сообщения:
    1.973
    Симпатии:
    931
    Репутация:
    101
    Оффлайн
    А почему черные в конце не пошли 259.s18 (вместо t14), защищая шесть полей в правом верхнем углу? Уже не имело значения?

Поделиться этой страницей