AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. Boroda
    Оффлайн

    Boroda Новичок

    Репутация:
    0
  2. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    относительно самой себя, когда ещё её только научили двигать фигуры,да и то, как выяснилось позднее, не правильно
     
  3. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Поиграл под Ареной GreKo против LeelaZero, с контролем 1 мин + 1 сек. После счёта 6-0 не в пользу Лилы матч прекратил. Извините, но 2800 там нет и в помине, даже делая скидку на тот факт, что видеокарта у меня весьма заурядная...
     
  4. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Здесь, в турнире против GreKo счет 2-2:
    https://www.twitch.tv/ccls
    —- добавлено: 2 May 2018, опубликовано: 2 May 2018 —-

    В 5-м дивизионе 12-го сезона TCEC (на самом деле пробные матчи) небольшой минус против Baron 3.41:
    http://tcec.chessdom.com/bonus/archive.php
     

    Attached Files:

    Last edited: 2 May 2018
  5. hornet
    Оффлайн

    hornet Учаcтник

    Репутация:
    498
    Я так понимаю это не та Leela, которую можно скачать?
     
  6. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Что значит не та? 2843 это рейтинг нейронной сети которую использует движок, она обновляется несколько раз в день.
     
  7. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    скорее всего отличия будут не в том,что вы скачаете, а в том какой видео будете играть, обычно всякие рейтинги (что б побольше было) вычисляются при игре не хуже GTX 1060
     
  8. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Возможно несколько причин такой слабой игры. Я сам непосредственно с ними столкнулся. Например:

    - Для хоть сколько-нибудь сносной игры Лиле необходимо перебирать на один ход как минимум 2000 - 3000 позиций (узлов), а лучше ещё немного больше. Иначе говорить о какой-либо оценке силы игры не приходится. Если ресурсы компьютера слабы, то нужно увеличить контроль.

    - На некоторых видеокартах (особенно на старых AMD), могут присутствовать ошибки вычисления через OpenCL. В блице это может быть не заметно - вылетать программа не будет, но играть станет гораздо слабее.
     
    Last edited: 2 May 2018
    svoitsl likes this.
  9. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    а ещё лучше много больше,если вспомнить ,что A0 перебирала ровно 80к х 60 =480 к
     
    Rom likes this.
  10. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    А есть ли уже какой-нибудь из признанных рейтинг-листов, в которых рейтинг Лилы оценен по более-менее строгим стандартам, как мы привыкли с другими программами?
     
  11. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    Та же самая лила что можна скачать.
     
  12. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Не тестировали пока. Graham Banks из команды CCRL вроде хотел попробовать, но были проблемы с поддержкой UCI. Кроме того, нет официального релиза, нейросеть меняется каждый день. Так что пока ситуация как с "Ипполитом" в своё время. Кто как умеет, так и тестирует. Нюансы тестирования ещё прорабатываются и возможно стандарты придётся подкорректировать.
     
  13. Пломбир
    Оффлайн

    Пломбир Новичок

    Репутация:
    0
    Поправочка: не 480к, а 4,8 миллиона ;)
     
  14. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Чему по умолчанию равен ключ -p?А то в новой версии обнаружили связанный с ним баг, хочу знать можно ли обойтись без него.И как в версии 0.8 задаётся -noponder?
     
  15. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Вот эту разницу и прибавляли каждый раз к 0, так как считали что для пустой (в начальном состоянии ) сети и только правилами игры а коде считали что значение силы было равно 0 ЭЛО
     
  16. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Насколько я понял статью про рейтинг Эло на википедии 0 Эло это когда игрок проигрывает АБСОЛЮТНО все партии игроку любого положительного не нулевого уровня Эло.

    P.S. Припомнил сейчас статью разница в N пунктов это P кратная разница в силе игры (примерно так), так что то что выше неверно, но новички имеют рейтинг 1000 Эло так что 0 эло действительно очень низкий уровень игры.
     
    Last edited: 5 May 2018
  17. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Я после P.S. это и пишу, просто не знаю как удалять пост.
     
  18. Пломбир
    Оффлайн

    Пломбир Новичок

    Репутация:
    0
    В версии 0,8 похоже добавили поддержку эндшпильных баз. Добавилась команда запуска "--syzygypath". Поддержку команды по UCI протоколу планируют сделать в версии 0,9. Очень хорошо, так как эндшпиль не на высоте, мягко говоря...
     
  19. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    Интересно а есть где то продолжение єтого графика?
     
  20. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    Да я знаю за етот сайт но там совсем другие графики которие не отображают действительную силу игр, а здесь график как мне кажется отображает действительную силу игри лили в ело.
     
  21. nn
    Оффлайн

    nn Старожил

    Репутация:
    124
    Facebook тоже подключился
    Facebook Open Sources ELF OpenGo

    ELF OpenGo is a reimplementation of AlphaGoZero / AlphaZero. It was trained on 2,000 GPUs over a two week period, and has achieved high performance.
    Github: https://github.com/pytorch/elf
     
    Last edited: 5 May 2018
  22. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    То значит что не играет лила сейчас на 5600 пунктов Ело как отображается на графиках оф сайта.
     
  23. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    Ну єто я понимаю. Меня интересует другая система рейтинга которая на указаном графике.
     
  24. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
  25. Kesandr
    Оффлайн

    Kesandr Учаcтник

    Репутация:
    11
    А как график найти здесь?
     
  26. Пломбир
    Оффлайн

    Пломбир Новичок

    Репутация:
    0
    Можно прослеживать силу игры относительно различных версий стокфиша.
    С каждой сетью там наигрывают вроде бы 200 игр с контролем 48 сек + 0,2, с книжкой 200 позиций, без эндшпильных баз.
    На основе этой таблички сделал график. Каждая зеленая линия - это различная версия стокфиша. Самая верхняя - SF9; самая нижняя - SF8 уровень 0:
    Можно заметить, что, например, с 205 по 245 сеть фактически не было прогресса, хотя при играх друг с другом рост что-то около 240 пунктов
    График.png
     
    Last edited: 6 May 2018
    svoitsl likes this.
  27. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Карта GeForce GTX 750, процессор Intel Core i5. Не знаю, насколько по нынешним меркам эта конфигурация считается слабой. Гошныя Leela Zero Elf и Leela Zero на ней выступают вполне достойно, 11-ю версию обыгрывают.
    В процессе игры Лила показывала глубину, вполне сравнимую с Греко, где-то 12-15 полуходов. Хотя я понимаю, что впрямую сравнивать нельзя из-за разных алгоритмов поиска.
    Попробую запустить матч с большим контролем.
     
  28. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Вроде приличная конфигурация, но для тестов требуется хотя бы 10 сек/ход.

    Эльф и Лила у меня просто мочат 11-ю версию. Причем ногами :). Лиле Зеро хватает 32 плейаута на ход, а Эльфу чтобы выигрывать, перебор не нужен совсем (1 плейаут и счет был 2-1). У 11-й было 5 сек/ход. Но это из-за того что видеокарта слабая - тестовые замеры дают всего 50 плейаутов/ход для Лилы Зеро.

    Сегодня гоняю партии с форой. Лила Зеро однозначно лучшая - выиграла у Zen 5 даже на 4-х камнях. А Эльф и 11-я проигрывают даже на 3-х.
     
  29. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    А как подключать Zen'а по GTP? Я пользуюсь оболочкой Sabaki.
    И ещё, как установить для Лилы время на ход? В опциях командной строки не нашёл.
    С форой у меня играть не получается - дающая фору программа обычно очень быстро сдаётся. Наверное, тоже есть какая-то настройка на этот счёт?
     
  30. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    "Но теперь, в последней версии Sabaki 0.33.1, команды GTP можно просто прописать в настройках второй строкой (см. скриншот 2). Они будут автоматически отправляться Лиле перед началом партии. Например, при записи time_settings 1000 10 5 устанавливается контроль 1000 секунд на партию, плюс 10 секунд на каждые 5 ходов. При настройках time_settings 0 1 0 время не ограничивается. Если у вас в настройках одновременно установлено время и количество playout' ов, то Лила просто выберет, какое условие раньше сработает."

    Время надо прописывать в строку инициализации.
     

    Attached Files:

    Last edited: 6 May 2018
  31. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Что-то не вижу никакого скриншота, ни первого ни второго.
    Но я понял, как это делать.
     
  32. Sergey1983
    Оффлайн

    Sergey1983 Учаcтник

    Репутация:
    1
    Это я привёл цитату со странички https://vk.com/wall-105196334_27221
    zip со страничкой и скриншотом в моём предыдущем сообщении.
     
    WinPooh likes this.
  33. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Никак, ручками приходится. На форуме 19x19 были ссылки на какой-то китайский скрипт для перехвата вывода Zen, но они уже не работают, а может я просто не понял по китайски.

    Кстати 11-я выиграла вторую партию на 3-х камнях против Zen 5, так что 1-1 и может быть она не так и плоха. Сейчас сыграю Эльфом на 2-х. Но думаю он победит.

    Не сдаётся по записи в командной строке -r 0
    Подробная справка по командам по записи -h
    Впрочем по ссылке от Sergey1983 я уже подробно расписывал.
     
    WinPooh likes this.
  34. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Не забываем, через час начало второй партии матча в го между Haylee (4p) и Лилой Зеро на сервере online-go.com. Пока без форы. Но если Haylee проиграет, то уже в следующей партии, которая состоится через неделю, фора будет.

    Ссылки где-то в этой теме:
    https://github.com/gcp/leela-zero/issues/1346
     
    WinPooh likes this.
  35. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    А
    А при игре с форой Лила все равно считает, что у нее коми 7.5, она же по-другому не обучена? То есть количество камней получается фактически на один меньше?