AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Boroda Новичок

    • Новичок
    Рег.:
    12.01.2018
    Сообщения:
    62
    Симпатии:
    8
    Репутация:
    0
    Оффлайн
  2. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    187
    Симпатии:
    32
    Репутация:
    1
    Оффлайн
    относительно самой себя, когда ещё её только научили двигать фигуры,да и то, как выяснилось позднее, не правильно
  3. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Поиграл под Ареной GreKo против LeelaZero, с контролем 1 мин + 1 сек. После счёта 6-0 не в пользу Лилы матч прекратил. Извините, но 2800 там нет и в помине, даже делая скидку на тот факт, что видеокарта у меня весьма заурядная...
  4. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Здесь, в турнире против GreKo счет 2-2:
    https://www.twitch.tv/ccls
    —- добавлено: 2 май 2018, опубликовано: 2 май 2018 —-

    В 5-м дивизионе 12-го сезона TCEC (на самом деле пробные матчи) небольшой минус против Baron 3.41:
    http://tcec.chessdom.com/bonus/archive.php

    Вложения:

  5. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    250
    Симпатии:
    62
    Репутация:
    0
    Оффлайн
    Я так понимаю это не та Leela, которую можно скачать?
  6. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Что значит не та? 2843 это рейтинг нейронной сети которую использует движок, она обновляется несколько раз в день.
  7. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    187
    Симпатии:
    32
    Репутация:
    1
    Оффлайн
    скорее всего отличия будут не в том,что вы скачаете, а в том какой видео будете играть, обычно всякие рейтинги (что б побольше было) вычисляются при игре не хуже GTX 1060
  8. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Возможно несколько причин такой слабой игры. Я сам непосредственно с ними столкнулся. Например:

    - Для хоть сколько-нибудь сносной игры Лиле необходимо перебирать на один ход как минимум 2000 - 3000 позиций (узлов), а лучше ещё немного больше. Иначе говорить о какой-либо оценке силы игры не приходится. Если ресурсы компьютера слабы, то нужно увеличить контроль.

    - На некоторых видеокартах (особенно на старых AMD), могут присутствовать ошибки вычисления через OpenCL. В блице это может быть не заметно - вылетать программа не будет, но играть станет гораздо слабее.
    svoitsl нравится это.
  9. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    187
    Симпатии:
    32
    Репутация:
    1
    Оффлайн
    а ещё лучше много больше,если вспомнить ,что A0 перебирала ровно 80к х 60 =480 к
    Rom нравится это.
  10. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    А есть ли уже какой-нибудь из признанных рейтинг-листов, в которых рейтинг Лилы оценен по более-менее строгим стандартам, как мы привыкли с другими программами?
  11. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    Та же самая лила что можна скачать.
  12. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Не тестировали пока. Graham Banks из команды CCRL вроде хотел попробовать, но были проблемы с поддержкой UCI. Кроме того, нет официального релиза, нейросеть меняется каждый день. Так что пока ситуация как с "Ипполитом" в своё время. Кто как умеет, так и тестирует. Нюансы тестирования ещё прорабатываются и возможно стандарты придётся подкорректировать.
  13. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    35
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Поправочка: не 480к, а 4,8 миллиона ;)
  14. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Чему по умолчанию равен ключ -p?А то в новой версии обнаружили связанный с ним баг, хочу знать можно ли обойтись без него.И как в версии 0.8 задаётся -noponder?
  15. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    187
    Симпатии:
    32
    Репутация:
    1
    Оффлайн
    Вот эту разницу и прибавляли каждый раз к 0, так как считали что для пустой (в начальном состоянии ) сети и только правилами игры а коде считали что значение силы было равно 0 ЭЛО
  16. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Насколько я понял статью про рейтинг Эло на википедии 0 Эло это когда игрок проигрывает АБСОЛЮТНО все партии игроку любого положительного не нулевого уровня Эло.

    P.S. Припомнил сейчас статью разница в N пунктов это P кратная разница в силе игры (примерно так), так что то что выше неверно, но новички имеют рейтинг 1000 Эло так что 0 эло действительно очень низкий уровень игры.
  17. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Я после P.S. это и пишу, просто не знаю как удалять пост.
  18. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    35
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    В версии 0,8 похоже добавили поддержку эндшпильных баз. Добавилась команда запуска "--syzygypath". Поддержку команды по UCI протоколу планируют сделать в версии 0,9. Очень хорошо, так как эндшпиль не на высоте, мягко говоря...
  19. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    Интересно а есть где то продолжение єтого графика?
  20. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    Да я знаю за етот сайт но там совсем другие графики которие не отображают действительную силу игр, а здесь график как мне кажется отображает действительную силу игри лили в ело.
  21. nn Учаcтник

    • Участник
    Рег.:
    25.03.2007
    Сообщения:
    891
    Симпатии:
    2.386
    Репутация:
    95
    Оффлайн
    Facebook тоже подключился
    Facebook Open Sources ELF OpenGo

    ELF OpenGo is a reimplementation of AlphaGoZero / AlphaZero. It was trained on 2,000 GPUs over a two week period, and has achieved high performance.
    Github: https://github.com/pytorch/elf
  22. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    То значит что не играет лила сейчас на 5600 пунктов Ело как отображается на графиках оф сайта.
  23. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    Ну єто я понимаю. Меня интересует другая система рейтинга которая на указаном графике.
  24. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
  25. Kesandr Учаcтник

    • Участник
    Рег.:
    02.09.2008
    Сообщения:
    455
    Симпатии:
    30
    Репутация:
    11
    Оффлайн
    А как график найти здесь?
  26. Пломбир Новичок

    • Новичок
    Рег.:
    09.04.2018
    Сообщения:
    35
    Симпатии:
    25
    Репутация:
    0
    Оффлайн
    Можно прослеживать силу игры относительно различных версий стокфиша.
    С каждой сетью там наигрывают вроде бы 200 игр с контролем 48 сек + 0,2, с книжкой 200 позиций, без эндшпильных баз.
    На основе этой таблички сделал график. Каждая зеленая линия - это различная версия стокфиша. Самая верхняя - SF9; самая нижняя - SF8 уровень 0:
    Можно заметить, что, например, с 205 по 245 сеть фактически не было прогресса, хотя при играх друг с другом рост что-то около 240 пунктов
    График.png
    svoitsl нравится это.
  27. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Карта GeForce GTX 750, процессор Intel Core i5. Не знаю, насколько по нынешним меркам эта конфигурация считается слабой. Гошныя Leela Zero Elf и Leela Zero на ней выступают вполне достойно, 11-ю версию обыгрывают.
    В процессе игры Лила показывала глубину, вполне сравнимую с Греко, где-то 12-15 полуходов. Хотя я понимаю, что впрямую сравнивать нельзя из-за разных алгоритмов поиска.
    Попробую запустить матч с большим контролем.
  28. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Вроде приличная конфигурация, но для тестов требуется хотя бы 10 сек/ход.

    Эльф и Лила у меня просто мочат 11-ю версию. Причем ногами :). Лиле Зеро хватает 32 плейаута на ход, а Эльфу чтобы выигрывать, перебор не нужен совсем (1 плейаут и счет был 2-1). У 11-й было 5 сек/ход. Но это из-за того что видеокарта слабая - тестовые замеры дают всего 50 плейаутов/ход для Лилы Зеро.

    Сегодня гоняю партии с форой. Лила Зеро однозначно лучшая - выиграла у Zen 5 даже на 4-х камнях. А Эльф и 11-я проигрывают даже на 3-х.
  29. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    А как подключать Zen'а по GTP? Я пользуюсь оболочкой Sabaki.
    И ещё, как установить для Лилы время на ход? В опциях командной строки не нашёл.
    С форой у меня играть не получается - дающая фору программа обычно очень быстро сдаётся. Наверное, тоже есть какая-то настройка на этот счёт?
  30. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    "Но теперь, в последней версии Sabaki 0.33.1, команды GTP можно просто прописать в настройках второй строкой (см. скриншот 2). Они будут автоматически отправляться Лиле перед началом партии. Например, при записи time_settings 1000 10 5 устанавливается контроль 1000 секунд на партию, плюс 10 секунд на каждые 5 ходов. При настройках time_settings 0 1 0 время не ограничивается. Если у вас в настройках одновременно установлено время и количество playout' ов, то Лила просто выберет, какое условие раньше сработает."

    Время надо прописывать в строку инициализации.

    Вложения:

    • ReadMe.zip
      Размер файла:
      988,5 КБ
      Просмотров:
      60
  31. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Что-то не вижу никакого скриншота, ни первого ни второго.
    Но я понял, как это делать.
  32. Sergey1983 Учаcтник

    • Участник
    Рег.:
    03.04.2018
    Сообщения:
    126
    Симпатии:
    14
    Репутация:
    1
    Оффлайн
    Это я привёл цитату со странички https://vk.com/wall-105196334_27221
    zip со страничкой и скриншотом в моём предыдущем сообщении.
    WinPooh нравится это.
  33. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Никак, ручками приходится. На форуме 19x19 были ссылки на какой-то китайский скрипт для перехвата вывода Zen, но они уже не работают, а может я просто не понял по китайски.

    Кстати 11-я выиграла вторую партию на 3-х камнях против Zen 5, так что 1-1 и может быть она не так и плоха. Сейчас сыграю Эльфом на 2-х. Но думаю он победит.

    Не сдаётся по записи в командной строке -r 0
    Подробная справка по командам по записи -h
    Впрочем по ссылке от Sergey1983 я уже подробно расписывал.
    WinPooh нравится это.
  34. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    555
    Симпатии:
    207
    Репутация:
    21
    Оффлайн
    Не забываем, через час начало второй партии матча в го между Haylee (4p) и Лилой Зеро на сервере online-go.com. Пока без форы. Но если Haylee проиграет, то уже в следующей партии, которая состоится через неделю, фора будет.

    Ссылки где-то в этой теме:
    https://github.com/gcp/leela-zero/issues/1346
    WinPooh нравится это.
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.134
    Симпатии:
    2.365
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    А
    А при игре с форой Лила все равно считает, что у нее коми 7.5, она же по-другому не обучена? То есть количество камней получается фактически на один меньше?

Поделиться этой страницей