AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    Стокфиш и другие подобные движки это язычество.
    Нет бога кроме АЗ и пророка его Лилы.
    Undying нравится это.
  2. FlashNeo Учаcтник

    • Участник
    Рег.:
    23.11.2018
    Сообщения:
    587
    Симпатии:
    309
    Репутация:
    2
    Оффлайн
    Пока что Стокфиш по-батьковски наминает бока Лейле.
  3. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    богохульство
  4. wentille Учаcтник

    • Участник
    Рег.:
    31.08.2017
    Сообщения:
    3.890
    Симпатии:
    5.915
    Репутация:
    113
    Онлайн
    Ветка-секта —- для Ахмадулиной это было бы ценной рифмой
    Goranflo нравится это.
  5. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    56.959
    Симпатии:
    20.601
    Репутация:
    596
    Адрес:
    Москва, Россия
    Оффлайн
    Я в шоке, братцы.
    В одной из партий матча играющий... то есть, уверенно проигрывающий черными Стокфиш-8 в следующей позиции



    сделал ход 4...Qb6?!. :facepalm2:
    Как ни объясняй его (профилактика против d2-d4, давление на b2 и т.д.), а ход-то сомнительный.
    Я поначалу не поверил, что Стокфиш-8 мог так сыграть, но запуск на моём компе подтвердил худшие опасения. Этот ход почти всё время в тройке лучших, а на глубине 31 он и вовсе выполз на первую строчку.
    А потом я включил Стокфиш-10. Он тоже рассматривает этот выпад ферзя, но зато на первую строчку (вплоть до глубины 32) он не выходит.

    Вот так происходит излечение от язв.
    Launder, Rom, Challenger Spy и 2 другим нравится это.
  6. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    81
    Симпатии:
    35
    Репутация:
    1
    Оффлайн
    А какая объективная оценка хода 4...Qb6? Черные получают очень плохие позиции?
  7. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    так непонятно, это плохой ход или хороший?
  8. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    18.975
    Симпатии:
    22.988
    Репутация:
    1.212
    Нарушения:
    29
    Оффлайн
    Alhimik88, KEV81, после хода стоит знак... и это не знак препинания
  9. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    81
    Симпатии:
    35
    Репутация:
    1
    Оффлайн
    Вот уж не знал, спасибо, Вы открыли мне глаза!
    Если серьезно, то я конечно некорректно поставил вопрос, однако, думаю, что не нужно быть гением, чтобы понять - вопрос задавался о причинах знака после хода, а не о его расшифровке.
    Launder нравится это.
  10. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    18.975
    Симпатии:
    22.988
    Репутация:
    1.212
    Нарушения:
    29
    Оффлайн
    а КЕВ знал? ;)
  11. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    Думаю, что разработчики движка не уделяют много внимания дебюту, потому что дебютные книги закрывают этот вопрос. А AlphaZero использует в своей нейросети статистику результатов миллионов партий.
  12. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Интересно, встречаются ли в партиях АльфаЗеро случаи затупливания в эндшпиле, аналогичные любимым заскокам Лилы: перейти в ничейный разноцвет, и ещё сто ходов рисовать себе оценку плюс пять? Если нет, то как они эту проблему решили, и что делается неправильно в случае Лилы?
    Launder нравится это.
  13. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    AlphaZero не может себе нарисовать оценку +5, там больше +1 не может быть :)
  14. Alhimik88 Новичок

    • Новичок
    Рег.:
    10.06.2009
    Сообщения:
    81
    Симпатии:
    35
    Репутация:
    1
    Оффлайн
    Вы видимо путаете первичную оценку нейронный сеток в виде процентной вероятности исходов, с тем, что выдает та же нейронная сетка интегрированная через UCI протокол. Разработчики условно перевели язык вероятностей на привычный числовой язык оценки шахматных движков. Так что A0, Leela и прочие нейронки спокойно могут выдавать оценку и +5, и даже +20.
  15. Alexander Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    3.389
    Симпатии:
    1.288
    Репутация:
    33
    Оффлайн
    Это еще что...
    Альфазиро белыми такую позицию умудрилась проиграть:


    За такие вещи надо лишать третьего разряда :)

    Вложения:

    Undying, Rom и FlashNeo нравится это.
  16. tiger Новичок

    • Новичок
    Рег.:
    11.02.2006
    Сообщения:
    85
    Симпатии:
    25
    Репутация:
    1
    Оффлайн
    Зачем? Нормальная оценка и должна быть от 0 до 1. И чем сильнее прога тем более дискретна оценка в этом интервале, стремясь к одному из трех чисел (0, 0.5, 1) . Это заодно дает возможность сравнивать оценки разных прог помимо всего прочего.
    Undying нравится это.
  17. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    56.959
    Симпатии:
    20.601
    Репутация:
    596
    Адрес:
    Москва, Россия
    Оффлайн
    Насколько я успел заметить по партиям, есть у Альфы такая настройка - играть на победу практически в любых позициях, и в объективно равных, и даже в сложно-сомнительных.
    Видимо, эта настройка статистически оправдывается. Пару раз Альфа проиграет, зато десяток раз выиграет.
    Polarity и Undying нравится это.
  18. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    В других движках она тоже встречается, называется Contempt (презрение к противнику). Чем она больше, тем менее ценной движок считает для себя ничью. В 10-м Стокфише эта опция по умолчанию включена (значение порядка 20), поэтому при анализе он может выдавать странные, несимметричные оценки при ходе разных сторон.
  19. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.527
    Симпатии:
    1.243
    Репутация:
    32
    Адрес:
    Киев
    Оффлайн
    В A0 такая оценка не реализована, потому что им она без надобности. У Leela такая оценка только для реализации требования TCEC, выбрали от фонаря одну функцию из континуума возможных, отображающих [-1, +1] на (-∞, +∞). Опять же, проценты мне куда более понятнее, чем пешки, и я бы предпочёл видеть их. Но тут будет проблема, что alpha-beta движки не оперируют такой оценкой.
    Polarity нравится это.
  20. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    Это альфа вывела с нуля, разработчики ей дали всего лишь возможность улучшаться.
    Undying нравится это.
  21. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    Как раз более привычный это вероятность победы.
    Мерить преимущество в абстрактных "пешка", вот это уже немножко по компьютерному.
    —- добавлено: 11 дек 2018 —-
    Нет там никаких таких настроек.
  22. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Красиво. Сначала Лила отдает 2 пешки, чтобы не мешали фигурам работать. Потом отдает ладью и пешку за 2 легкие

    фигуры. Остается 2 лишних пешки у черных. В итоге Leela выигрывает.



    P. S. Опять проблемы с вставкой PGN на форуме :(
    WinPooh и Undying нравится это.
  23. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Удалось починить. Что я сделал:

    1) убрал все комментарии с помощью утилиты trim.exe из набора http://komodochess.com/pub/40H-pgn-utilities/
    2) исправил тег "Site" так, чтобы он не был гиперссылкой
    sovaz1997 нравится это.
  24. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Лила явно под впечатлением от партий АльфаЗеро. Сидит сейчас с Текселем к 20-му ходу без двух пешек и без рокировки. Показывает "+3" в свою пользу...
    Undying и sovaz1997 нравится это.
  25. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Она не только под впечатлением, но и с некоторыми настройками из новой статьи по AZ :)
  26. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Lc0 обыграла Stockfish 11 Dev в стиле Alpha Zero (отдав сначала одну пешку, затем - еще одну). Контроль - 60 минут + 15 секунд (добавка).

    Железо: Intel Core i7-860 (Stockfish играл на 6 потоках) против GeForce GTX 660 (выдает около 800-1000 nps в начальной позиции).

    Undying нравится это.
  27. karasik10 Новичок

    • Новичок
    Рег.:
    25.10.2018
    Сообщения:
    24
    Симпатии:
    5
    Репутация:
    0
    Адрес:
    Рига
    Оффлайн
    На такой древней карте.... у меня на amd rx470 Лила никак не может Сток10 обыграть . Можно узнать что за версия сети играла ?
  28. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Какая у вас скорость Лилы в начальной позиции? У меня 800-1000 nps (разгоняется постепенно). Древняя, не древняя, но здесь есть CUDA, которая дает хорошее преимущество перед картами AMD именно для Leela. Но RTX, конечно, в несколько десятков раз лучше будет :)

    А, ну еще от процессора зависит в том числе, конечно)
    Ну и то, что Лила и Stockfish играли без дебютной книги, дало какое-никакое преимущество Лиле.
  29. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    56.959
    Симпатии:
    20.601
    Репутация:
    596
    Адрес:
    Москва, Россия
    Оффлайн
    Стало быть, это изначальная концепция, стратегия работы Альфы - или, как хотите, назовите.
    Возможно, просто правила игры, введённые в нейронку! Мол, играть необходимо до голых королей, результат вторичен и т.п.
    Агрессия в её игре порой запредельная и безумная.
  30. karasik10 Новичок

    • Новичок
    Рег.:
    25.10.2018
    Сообщения:
    24
    Симпатии:
    5
    Репутация:
    0
    Адрес:
    Рига
    Оффлайн
    sovaz1997, Вот [​IMG]
    В начальной позиции сразу nps 1k становится и дроссели на видяхе сильно свистят , хотя в видеоиграх не так .
    Процессор i5 2500k в разгоне , сеть 11248 на rx 470 . Удивительно что 1 партию сегодня Лила у Стокфиша выиграла в ладейнике , у Стока нули стояли потом бац и -3 . В остальных партиях она в окончаниях в цейтноте плывет и равные позиции сливает.
    Launder и sovaz1997 нравится это.
  31. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Да, видеокарту Leela очень сильно нагружает, есть такое.

    У вас, кстати, сколько потоков на Stockfish отведено? Просто скорость маленькая. А скорость Лилы хорошая.

    У меня сеть 11250 и последняя версия lc0.exe
  32. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    Или просто AlphaZero.
  33. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.474
    Симпатии:
    3.068
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Там в коде присутствует запрет на ранние размены фигур. По крайней мере, в Лиле, которая во всём стремится подражать Альфе, это реализовано:

    Leela in 3rd division participated with Lc0 TP("Trade Penalty", i.e it gives a penalty to every early trades making Leela play stronger as results showed)
    http://blog.lczero.org/2018/12/tcec-season-14-leela-promoted-from-3rd.html#more

    Хотя, как по мне, это явное нарушение "нулевого принципа".
  34. Polarity Новичок

    • Новичок
    Рег.:
    24.04.2018
    Сообщения:
    77
    Симпатии:
    17
    Репутация:
    0
    Оффлайн
    https://lichess.org/@/superleela
    Желающие могут поиграть с моим ботом на достаточно мощном железе.
    Обновляю нейронку на последнюю версию 1 раз в день.
    Не знаю сколько он ещё просуществует.
    Ну и ещё, кажется она не умеет ставить мат, потому что я не разбирался как прикрутить эндшпильные таблицы (банально не было времени). Но играет всё равно очень мощно.
  35. KEV81 Учаcтник

    • Участник
    Рег.:
    06.03.2017
    Сообщения:
    240
    Симпатии:
    46
    Репутация:
    6
    Оффлайн
    Если это так-то - да, девственность потеряна.

Поделиться этой страницей