Стокфиш

Discussion in 'Машинное отделение' started by Rom, 3 Jul 2021.

  1. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Stockfish 14

    Сегодня мы рады анонсировать Stockfish 14.

    Как обычно, загрузки будут доступны бесплатно по адресу stockfishchess.org/download.

    Движок теперь значительно сильнее, чем всего несколько месяцев назад, и выигрывает в четыре раза больше игровых пар, чем проигрывает, по сравнению с предыдущей версией. Stockfish 14 теперь как минимум на 400 Эло опережает Stockfish 7, лучший движок в 2016 году. Таким образом, за последние пять лет Stockfish набирал около 80 Эло в год.

    Stockfish 14 оценивает позиции более точно, чем Stockfish 13, в результате двух основных шагов вперед в определении и обучении эффективно обновляемой нейронной сети (NNUE), которая обеспечивает оценку позиций.

    Во-первых, сотрудничество с командой Leela Chess Zero, о котором было объявлено ранее, принесло свои плоды. Команда LCZero предоставила коллекцию миллиардов позиций, оцененных Лилой, которые мы объединили с миллиардами позиций, оцененных Stockfish, чтобы обучить сеть NNUE, на которой работает Stockfish 14. Тот факт, что мы могли свободно использовать и комбинировать эти наборы данных, был важен для достигнутого прогресса и демонстрирует силу открытого исходного кода и открытых данных.

    Во-вторых, была значительно обновлена архитектура сети NNUE: новая сеть не только больше, но, что более важно, она лучше справляется с большими материальными дисбалансами и может адаптироваться к нескольким стадиям игры. Новый проект, начатый Гэри Линскоттом и Томашем Собчиком, привел к созданию тренера сетей с ускорением на видеокартах, написанного на pytorch. Этот инструмент позволяет обучать качественные сети за пару часов.

    Наконец, в этом выпуске есть некоторые уточнения поиска, исправления мелких ошибок и дополнительные улучшения. Например, Stockfish теперь примерно на 90 Эло сильнее для chess960 (шахматы Фишера) при коротком контроле времени.

    Проект Stockfish опирается на разрастающееся сообщество энтузиастов (спасибо всем!), которые вкладывают свой опыт, время и ресурсы для создания бесплатного шахматного движка с открытым исходным кодом - надежным, общедоступным и очень сильным. Мы приглашаем любителей шахмат присоединиться к фреймворку для тестирования fishtest, а программистов - внести свой вклад в проект на github.

    Оставайтесь в безопасности и наслаждайтесь шахматами!

    Команда Stockfish​
     
    vv774252, Spike, Semion13 and 2 others like this.
  2. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Я так до конца не понял причину релиза, кто нибудь знает?
    прирост не так уж и велик, особо большого скачка нет....
    25 Эло это все же не обычные 50, да и полгода ещё не прошло...
     
  3. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Таково решение vondele.
    Вроде бы хотели релизы почаще выдавать. Кроме того, соотношение побед и поражений лучше, чем во времена классики:
    10 => 11
    13 => 14
     
  4. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    А что значит "Stockfish работает с нейросетью NNUE"? Как классический движок может с ней работать?
     
  5. nn
    Оффлайн

    nn Старожил

    Репутация:
    124
    Еще с 12-го как работает. Оценочная фунция - нейросеть специального вида.
     
  6. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Оценочная функция заменяется нейросетью. То есть если раньше статическую оценку позиции считала обычная оценочная функция, то сейчас нейросеть.
     
  7. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    То есть Стокфиш в каком-то смысле перестал быть чисто переборным движком?

    12-я версия, помнится, меня впечатлила. Резко усилилась в восьмипешечных позициях. В тематических турнирах по чигоринской испанке, по старушке, по французской била более ранние версии. Расправлялась с ними в этих построениях так, как когда-то это делала AlphaZero.

    А 13-я, 14-я - сделал с ними пару турниров на своей машине, но ничего прорывного уже не замечаю. Так, просто локальные усиления по отношению к 12-й.
     
  8. nn
    Оффлайн

    nn Старожил

    Репутация:
    124
    Что значит чисто переборный? Как алгортм поиска был альфа-бетой, так и остался.
    —- добавлено: 5 Jul 2021 —-
    14-я, конечно, значительно сильнее 12-й, а прошло меньше года. Ну, не знаю по ощущениям. На таком уровне сила игры настолько превосходит человека, что разницу сложно заметить.
     
  9. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    Я сужу по небольшим турнирам разных версий на моей машине. Некоторые выигрывает 12-й, некоторые 13-й, некоторые 14-й. Даже не знаешь, на кого ставить. А 11-му и более ранним в таких турнирах что-то не везёт.

    Кстати, где-нибудь устраивают бои разных версий Стокфиша в более серьёзном масштабе?
     
  10. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    так они сами и устраивают, регресс тесты, ссылки выше
     
  11. dastvik
    Оффлайн

    dastvik Начинающий

    Репутация:
    0
    Интересный факт, Стокфиш 14 переигрывает Fritz 6 без коня. К слову сказать Fritz 6 с рейтингом более 2600 ЭЛО переиграл бы любого современного гроссмейтера.
    —- добавлено: 9 Jul 2021, опубликовано: 9 Jul 2021 —-

     
  12. Мастер Икс
    Оффлайн

    Мастер Икс Василий Щепетнев Staff Member

    Репутация:
    19
    Ну, не любого, конечно. Крамник, ЕМНИП, с восьмым матч свел вничью и проиграл только девятому.
     
  13. longinean
    Оффлайн

    longinean Учаcтник

    Репутация:
    130
    Ещё и две пешки сразу пожертвовал, а потом и третью
     
  14. Damiil_B
    Оффлайн

    Damiil_B Новичок

    Репутация:
    0
    А оценочная функция стандартная там осталась доступна или только NNUE?
    Насколько понимаю, обе там есть и чуть ли не совмещаются.
     
  15. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Есть два режима - классическая оценка или гибридная (NNUE + классика). Устанавливается в настройках движка.
     
    Spike likes this.
  16. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Не стал открывать новую ветку про Фэт Фритц (Толстый Фритц), поэтому решил высказаться здесь. Поводом написания этого сообщения стал вчерашний спор в чате между Комсюком и Локомотивом по поводу силы движков. Один топил за Стокфиша, другой за Фэт Фритца. Поскольку, у меня своего мнения не было, я решил провести тест, чтобы выяснить истину.
    Раньше Толстый Фритц у меня на двухядерном компе почему-то не шел. Но недавно я поставил четырхядерный проц, и вчерашний спор в чате натолкнул меня на мысль посмотреть, как дело пойдет на новом процессоре. С радостным удивлением я отметил, что Толстый на моем компе отлично заработал. Ну, раз так, то надо его проверить. Я провел два тестовых турнира, в который включил Толстого, Стока 14 и еще несколько движков из тех, кто мне нравится. В итоге участниками стали Толстый Фритц с сетью, Толстый без сети, Сток 14 с сетью, устаревший Кристал без сети, новый июньский Кристал с сетью и новый августовский СиФиш. Этот последний характерен тем, что у него в настройках есть не две, как обычно, а три опции: "классик" (без сети), "гибрид" (с сетью), и еще какая-то промежуточная опция под названием "Pure". Что это значит, я не знаю, но я заметил, что с этой настройкой СиФиш у меня комбинации решает лучше всего, поэтому я включил его в тесты именно с этой настройкой. Сразу скажу: этот движок не подкачал и взял оба раза первое место. Реальный монстр. Дело в том, что насколько я знаю, СиФиш, это тот же самый Сток, только скомпилированный на языке СИ, что дает ему прирост скорости и, соответственно, силы игры. Поэтому, как я понимаю, лучше использовать свежескомпилированные версии СиФиша, поскольку сам Сток будет тормознее своего отпрыска.
    В общем, я провел два турнира - один по минуте и второй с контролем 2+2. Играли на одном ядре, хэш 256, в шесть кругов. Результаты выкладываю.

    1 2 3 4 5 6
    1 Cfish 130821 64 NUMA pure ****** ½½½½½½ 1½1½1½ 1½11½½ 111½11 ½1½½11 22.0/30 282.50
    2 Stockfish 14 ½½½½½½ ****** ½½1½1½ 11011½ 011111 1111½1 22.0/30 277.00
    3 Fat Fritz 2 210805 NNUE 0½0½0½ ½½0½0½ ****** ½11½1½ 1½1½1½ 1111½½ 17.5/30
    4 Fat Fritz 2 210805 No NNUE 0½00½½ 00100½ ½00½0½ ****** ½½½½½1 01½1½0 11.0/30
    5 Crystal 140520 64 POPCNT 000½00 100000 0½0½0½ ½½½½½0 ****** ½11½10 9.5/30
    6 Crystal 240621 ½0½½00 0000½0 0000½½ 10½0½1 ½00½01 ****** 8.0/30


    2+2:
    1 2 3 4 5 6
    1 Cfish 130821 64 NUMA pure ****** ½½½½½1 ½½½½½½ ½1½1½1 1½1½1½ ½½11½½ 19.5/30
    2 Fat Fritz 2 210805 NNUE ½½½½½0 ****** ½1½½½½ ½1½½½½ 1½1½1½ 1½½111 19.0/30
    3 Stockfish 14 ½½½½½½ ½0½½½½ ****** 01½1½1 ½1½1½0 1½½½1½ 17.0/30
    4 Crystal 240621 ½0½0½0 ½0½½½½ 10½0½0 ****** 0½½½½1 ½½½½01 12.0/30
    5 Crystal 140520 64 POPCNT 0½0½0½ 0½0½0½ ½0½0½1 1½½½½0 ****** ½½½½½½ 11.5/30
    6 Fat Fritz 2 210805 No NNUE ½½00½½ 0½½000 0½½½0½ ½½½½10 ½½½½½½ ****** 11.0/30

    Стокфиш тоже выступил достойно, но до СиФиша здесь не дотянул.

    Что касается Толстого Фритца, то, походу, вся его сила заключается в сетке. Без сетки он уверенно занял последнее место, уступив даже не самому сильному Кристалу, при этом еще и прошлогоднему. Неяркий во всех отношениях результат.
    Что я для себя еще понял. Сеть дает прирост силы на более длинных контролях. Например, Кристал с сетью в пулю вообще обделался по самое не могу, но при 2+2 сыграл чуть получше. Второй тестовый турнир показал явное превосходство движков с сетью. Это значит, что на более длинных контролях результат будет более выраженным. Поэтому, возможно, Локомотив был прав, что Толстый Фритц может быть на самом деле сильнее, чем Стокфиш, НО! при двух условиях: Если у него подключена нормальная сеть, и если хороший длинный контроль. Без этих двух условий сила его игры весьма блеклая.
    Это лично мое оценочное суждение, не претендующее на истину. Тызыть, взгляд со стороны.
     
    svoitsl likes this.
  17. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
    чистая сеть, не гибрид
     
    svoitsl likes this.
  18. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
    Кристал создан как решалка, а не игралка
    Толстый сворован у Стокфиша и при этом продаётся, собственно этим и возмутились разработчики Вяленого
     
  19. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
    дураки вы оба © :lol:
     
    nn and Маминтов like this.
  20. Semion13
    Оффлайн

    Semion13 Ценятся на шахматной доске только хорошие ходы. © баннер

    Репутация:
    1.986
    Vladruss, Стокфиш14 специализируется не по 1 минуте и не по две... На более серъезных конролях и несколькими ядрами он будет впереди. Тест некорректный, - что-то типа того... :)
     
  21. Semion13
    Оффлайн

    Semion13 Ценятся на шахматной доске только хорошие ходы. © баннер

    Репутация:
    1.986
    Комсюк, Правильно! Так их етить!
     
  22. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
    А вот и третий :)
    Сток специализируется на всех контролях... и если взять промежуточную версию https://abrok.eu/stockfish/ , запихнуть вменяемую сеть https://tests.stockfishchess.org/nns , то можете начинать продавать!
    Только вряд ли получится, ведь у вас нет имени ChessBase
     
    svoitsl likes this.
  23. Semion13
    Оффлайн

    Semion13 Ценятся на шахматной доске только хорошие ходы. © баннер

    Репутация:
    1.986
    Комсюк, Сам ты такой тоже... Я на 4 ядрах проверял и сам выяснял...
     
  24. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
  25. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Надо же! Вот так живешь, и хрен кто расскажет.
     
  26. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Дальше-то, хоть, читал?
     
  27. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.270
    Всё я читал, это вы меня не читаете!
    Берётся Стокфиш между 13 и 14, берётся удачная сеть (но хуже, чем дефолтная у Стока), называется громко "Граф Толстой" и проводится тест с устаревшей версией, в данном случае 13
    Независимые тесты не показывают преимущества при прочих равных (Fat слабее чем Fish от того же числа), только тест продавца :)
     
  28. Локомотив
    Оффлайн

    Локомотив Старожил

    Репутация:
    120
    Долбанутым нет покоя.

    [​IMG]
     
  29. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Я ничего не утверждаю, но могу провести независимое тестирование между 14-м стоком и Толстым. Какой надо делать контроль, хэш, количество партий? Какую сеть ставить?
     
    svoitsl likes this.
  30. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    да, хорошо бы их свести с глазу на глаз
    Возьмите самые последние версии, какими располагаете для вашего процессора, для начальных позиций возьмите книжку типа Noomen_2Ply_Book.pgn (слишком глубокую и совсем без книжки вряд ли хорошо), TC 1'+1" думаю вполне нормально, ну остальное как у вас 1 ядро, 256 Мб,(для близких движков эти параметры влияют одинаково на оба), можете для ускорения процесса syzygy - 6 man, попробуйте для начала 10 кругов (2000 игр), займет чуть менее суток на 3 ядрах (одно оставьте для оболочки и ОС)
     
  31. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    А как на трех ядрах, если одно ядро?
     
  32. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Это я перепутал?
    Или вы его уже успели запродать?
    Оболочка cutechess-cli например позволяет вести турнир сразу на нескольких ядрах, давая каждой игре нужное число ядер (потоков), то есть вы запросто можете проводить 3 турнира параллельно предоставляя каждому по 1 ядру, это несколько сокращает общее время
     
  33. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Я не знаю такую. Я тестирую в оболочке Фрица.
     
  34. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    не уверен, что он так умеет, хотя и мог бы , ведь денежки то они могут брать (правда не все дают...).
    Когда проводятся тестовые турниры на fishtest 60 000 игр,то их просто параллелят на много ядер и весь тест не занимает слишком много времени
     
  35. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Ну, я уж ничего выдумывать не буду, проведу в оболочке Фрица. только не по минуте. Весь цимес в том, чтобы проверить на более длинных контролях. Скажем, 4+2. много партий, конечно, не смогу, но штук 300 можно попробовать.
     
    svoitsl likes this.