Стокфиш 14

Тема в разделе "Машинное отделение", создана пользователем Rom, 3 июл 2021.

  1. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    636
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    Stockfish 14

    Сегодня мы рады анонсировать Stockfish 14.

    Как обычно, загрузки будут доступны бесплатно по адресу stockfishchess.org/download.

    Движок теперь значительно сильнее, чем всего несколько месяцев назад, и выигрывает в четыре раза больше игровых пар, чем проигрывает, по сравнению с предыдущей версией. Stockfish 14 теперь как минимум на 400 Эло опережает Stockfish 7, лучший движок в 2016 году. Таким образом, за последние пять лет Stockfish набирал около 80 Эло в год.

    Stockfish 14 оценивает позиции более точно, чем Stockfish 13, в результате двух основных шагов вперед в определении и обучении эффективно обновляемой нейронной сети (NNUE), которая обеспечивает оценку позиций.

    Во-первых, сотрудничество с командой Leela Chess Zero, о котором было объявлено ранее, принесло свои плоды. Команда LCZero предоставила коллекцию миллиардов позиций, оцененных Лилой, которые мы объединили с миллиардами позиций, оцененных Stockfish, чтобы обучить сеть NNUE, на которой работает Stockfish 14. Тот факт, что мы могли свободно использовать и комбинировать эти наборы данных, был важен для достигнутого прогресса и демонстрирует силу открытого исходного кода и открытых данных.

    Во-вторых, была значительно обновлена архитектура сети NNUE: новая сеть не только больше, но, что более важно, она лучше справляется с большими материальными дисбалансами и может адаптироваться к нескольким стадиям игры. Новый проект, начатый Гэри Линскоттом и Томашем Собчиком, привел к созданию тренера сетей с ускорением на видеокартах, написанного на pytorch. Этот инструмент позволяет обучать качественные сети за пару часов.

    Наконец, в этом выпуске есть некоторые уточнения поиска, исправления мелких ошибок и дополнительные улучшения. Например, Stockfish теперь примерно на 90 Эло сильнее для chess960 (шахматы Фишера) при коротком контроле времени.

    Проект Stockfish опирается на разрастающееся сообщество энтузиастов (спасибо всем!), которые вкладывают свой опыт, время и ресурсы для создания бесплатного шахматного движка с открытым исходным кодом - надежным, общедоступным и очень сильным. Мы приглашаем любителей шахмат присоединиться к фреймворку для тестирования fishtest, а программистов - внести свой вклад в проект на github.

    Оставайтесь в безопасности и наслаждайтесь шахматами!

    Команда Stockfish​
    vv774252, Spike, Semion13 и 2 другим нравится это.
  2. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Я так до конца не понял причину релиза, кто нибудь знает?
    прирост не так уж и велик, особо большого скачка нет....
    25 Эло это все же не обычные 50, да и полгода ещё не прошло...
  3. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    636
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    Таково решение vondele.
    Вроде бы хотели релизы почаще выдавать. Кроме того, соотношение побед и поражений лучше, чем во времена классики:
    10 => 11
    13 => 14
  4. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.564
    Симпатии:
    2.572
    Репутация:
    110
    Адрес:
    Заир
    Оффлайн
    А что значит "Stockfish работает с нейросетью NNUE"? Как классический движок может с ней работать?
  5. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.248
    Симпатии:
    3.005
    Репутация:
    116
    Нарушения:
    31
    Оффлайн
    Еще с 12-го как работает. Оценочная фунция - нейросеть специального вида.
  6. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    636
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    Оценочная функция заменяется нейросетью. То есть если раньше статическую оценку позиции считала обычная оценочная функция, то сейчас нейросеть.
  7. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.564
    Симпатии:
    2.572
    Репутация:
    110
    Адрес:
    Заир
    Оффлайн
    То есть Стокфиш в каком-то смысле перестал быть чисто переборным движком?

    12-я версия, помнится, меня впечатлила. Резко усилилась в восьмипешечных позициях. В тематических турнирах по чигоринской испанке, по старушке, по французской била более ранние версии. Расправлялась с ними в этих построениях так, как когда-то это делала AlphaZero.

    А 13-я, 14-я - сделал с ними пару турниров на своей машине, но ничего прорывного уже не замечаю. Так, просто локальные усиления по отношению к 12-й.
  8. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.248
    Симпатии:
    3.005
    Репутация:
    116
    Нарушения:
    31
    Оффлайн
    Что значит чисто переборный? Как алгортм поиска был альфа-бетой, так и остался.
    —- добавлено: 5 июл 2021 —-
    14-я, конечно, значительно сильнее 12-й, а прошло меньше года. Ну, не знаю по ощущениям. На таком уровне сила игры настолько превосходит человека, что разницу сложно заметить.
  9. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.564
    Симпатии:
    2.572
    Репутация:
    110
    Адрес:
    Заир
    Оффлайн
    Я сужу по небольшим турнирам разных версий на моей машине. Некоторые выигрывает 12-й, некоторые 13-й, некоторые 14-й. Даже не знаешь, на кого ставить. А 11-му и более ранним в таких турнирах что-то не везёт.

    Кстати, где-нибудь устраивают бои разных версий Стокфиша в более серьёзном масштабе?
  10. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    так они сами и устраивают, регресс тесты, ссылки выше
  11. dastvik Начинающий

    • Начинающий
    Рег.:
    09.07.2021
    Сообщения:
    1
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Интересный факт, Стокфиш 14 переигрывает Fritz 6 без коня. К слову сказать Fritz 6 с рейтингом более 2600 ЭЛО переиграл бы любого современного гроссмейтера.
    —- добавлено: 9 июл 2021, опубликовано: 9 июл 2021 —-

  12. Мастер Икс Василий Щепетнев

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    3.611
    Симпатии:
    276
    Репутация:
    18
    Адрес:
    Деревня Великая Гвазда
    Оффлайн
    Ну, не любого, конечно. Крамник, ЕМНИП, с восьмым матч свел вничью и проиграл только девятому.
  13. longinean Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    12.04.2015
    Сообщения:
    2.541
    Симпатии:
    7.940
    Репутация:
    123
    Нарушения:
    31
    Оффлайн
    Ещё и две пешки сразу пожертвовал, а потом и третью
  14. Damiil_B Новичок

    • Новичок
    Рег.:
    29.09.2018
    Сообщения:
    44
    Симпатии:
    2
    Репутация:
    0
    Оффлайн
    А оценочная функция стандартная там осталась доступна или только NNUE?
    Насколько понимаю, обе там есть и чуть ли не совмещаются.
  15. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    636
    Симпатии:
    271
    Репутация:
    27
    Оффлайн
    Есть два режима - классическая оценка или гибридная (NNUE + классика). Устанавливается в настройках движка.
    Spike нравится это.
  16. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Не стал открывать новую ветку про Фэт Фритц (Толстый Фритц), поэтому решил высказаться здесь. Поводом написания этого сообщения стал вчерашний спор в чате между Комсюком и Локомотивом по поводу силы движков. Один топил за Стокфиша, другой за Фэт Фритца. Поскольку, у меня своего мнения не было, я решил провести тест, чтобы выяснить истину.
    Раньше Толстый Фритц у меня на двухядерном компе почему-то не шел. Но недавно я поставил четырхядерный проц, и вчерашний спор в чате натолкнул меня на мысль посмотреть, как дело пойдет на новом процессоре. С радостным удивлением я отметил, что Толстый на моем компе отлично заработал. Ну, раз так, то надо его проверить. Я провел два тестовых турнира, в который включил Толстого, Стока 14 и еще несколько движков из тех, кто мне нравится. В итоге участниками стали Толстый Фритц с сетью, Толстый без сети, Сток 14 с сетью, устаревший Кристал без сети, новый июньский Кристал с сетью и новый августовский СиФиш. Этот последний характерен тем, что у него в настройках есть не две, как обычно, а три опции: "классик" (без сети), "гибрид" (с сетью), и еще какая-то промежуточная опция под названием "Pure". Что это значит, я не знаю, но я заметил, что с этой настройкой СиФиш у меня комбинации решает лучше всего, поэтому я включил его в тесты именно с этой настройкой. Сразу скажу: этот движок не подкачал и взял оба раза первое место. Реальный монстр. Дело в том, что насколько я знаю, СиФиш, это тот же самый Сток, только скомпилированный на языке СИ, что дает ему прирост скорости и, соответственно, силы игры. Поэтому, как я понимаю, лучше использовать свежескомпилированные версии СиФиша, поскольку сам Сток будет тормознее своего отпрыска.
    В общем, я провел два турнира - один по минуте и второй с контролем 2+2. Играли на одном ядре, хэш 256, в шесть кругов. Результаты выкладываю.

    1 2 3 4 5 6
    1 Cfish 130821 64 NUMA pure ****** ½½½½½½ 1½1½1½ 1½11½½ 111½11 ½1½½11 22.0/30 282.50
    2 Stockfish 14 ½½½½½½ ****** ½½1½1½ 11011½ 011111 1111½1 22.0/30 277.00
    3 Fat Fritz 2 210805 NNUE 0½0½0½ ½½0½0½ ****** ½11½1½ 1½1½1½ 1111½½ 17.5/30
    4 Fat Fritz 2 210805 No NNUE 0½00½½ 00100½ ½00½0½ ****** ½½½½½1 01½1½0 11.0/30
    5 Crystal 140520 64 POPCNT 000½00 100000 0½0½0½ ½½½½½0 ****** ½11½10 9.5/30
    6 Crystal 240621 ½0½½00 0000½0 0000½½ 10½0½1 ½00½01 ****** 8.0/30


    2+2:
    1 2 3 4 5 6
    1 Cfish 130821 64 NUMA pure ****** ½½½½½1 ½½½½½½ ½1½1½1 1½1½1½ ½½11½½ 19.5/30
    2 Fat Fritz 2 210805 NNUE ½½½½½0 ****** ½1½½½½ ½1½½½½ 1½1½1½ 1½½111 19.0/30
    3 Stockfish 14 ½½½½½½ ½0½½½½ ****** 01½1½1 ½1½1½0 1½½½1½ 17.0/30
    4 Crystal 240621 ½0½0½0 ½0½½½½ 10½0½0 ****** 0½½½½1 ½½½½01 12.0/30
    5 Crystal 140520 64 POPCNT 0½0½0½ 0½0½0½ ½0½0½1 1½½½½0 ****** ½½½½½½ 11.5/30
    6 Fat Fritz 2 210805 No NNUE ½½00½½ 0½½000 0½½½0½ ½½½½10 ½½½½½½ ****** 11.0/30

    Стокфиш тоже выступил достойно, но до СиФиша здесь не дотянул.

    Что касается Толстого Фритца, то, походу, вся его сила заключается в сетке. Без сетки он уверенно занял последнее место, уступив даже не самому сильному Кристалу, при этом еще и прошлогоднему. Неяркий во всех отношениях результат.
    Что я для себя еще понял. Сеть дает прирост силы на более длинных контролях. Например, Кристал с сетью в пулю вообще обделался по самое не могу, но при 2+2 сыграл чуть получше. Второй тестовый турнир показал явное превосходство движков с сетью. Это значит, что на более длинных контролях результат будет более выраженным. Поэтому, возможно, Локомотив был прав, что Толстый Фритц может быть на самом деле сильнее, чем Стокфиш, НО! при двух условиях: Если у него подключена нормальная сеть, и если хороший длинный контроль. Без этих двух условий сила его игры весьма блеклая.
    Это лично мое оценочное суждение, не претендующее на истину. Тызыть, взгляд со стороны.
    svoitsl нравится это.
  17. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    чистая сеть, не гибрид
    svoitsl нравится это.
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    Кристал создан как решалка, а не игралка
    Толстый сворован у Стокфиша и при этом продаётся, собственно этим и возмутились разработчики Вяленого
  19. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    дураки вы оба © :lol:
    nn и Маминтов нравится это.
  20. Semion13 Ценятся на шахматной доске только хорошие ходы. ©

    • Ветеран
    Рег.:
    16.01.2015
    Сообщения:
    9.170
    Симпатии:
    14.552
    Репутация:
    1.367
    Адрес:
    Belarus, Minsk
    Оффлайн
    Vladruss, Стокфиш14 специализируется не по 1 минуте и не по две... На более серъезных конролях и несколькими ядрами он будет впереди. Тест некорректный, - что-то типа того... :)
  21. Semion13 Ценятся на шахматной доске только хорошие ходы. ©

    • Ветеран
    Рег.:
    16.01.2015
    Сообщения:
    9.170
    Симпатии:
    14.552
    Репутация:
    1.367
    Адрес:
    Belarus, Minsk
    Оффлайн
  22. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    А вот и третий :)
    Сток специализируется на всех контролях... и если взять промежуточную версию https://abrok.eu/stockfish/ , запихнуть вменяемую сеть https://tests.stockfishchess.org/nns , то можете начинать продавать!
    Только вряд ли получится, ведь у вас нет имени ChessBase
    svoitsl нравится это.
  23. Semion13 Ценятся на шахматной доске только хорошие ходы. ©

    • Ветеран
    Рег.:
    16.01.2015
    Сообщения:
    9.170
    Симпатии:
    14.552
    Репутация:
    1.367
    Адрес:
    Belarus, Minsk
    Оффлайн
    Комсюк, Сам ты такой тоже... Я на 4 ядрах проверял и сам выяснял...
  24. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    например
  25. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Надо же! Вот так живешь, и хрен кто расскажет.
  26. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Дальше-то, хоть, читал?
  27. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    17.07.2011
    Сообщения:
    16.578
    Симпатии:
    19.720
    Репутация:
    1.124
    Нарушения:
    63
    Оффлайн
    Всё я читал, это вы меня не читаете!
    Берётся Стокфиш между 13 и 14, берётся удачная сеть (но хуже, чем дефолтная у Стока), называется громко "Граф Толстой" и проводится тест с устаревшей версией, в данном случае 13
    Независимые тесты не показывают преимущества при прочих равных (Fat слабее чем Fish от того же числа), только тест продавца :)
  28. Локомотив Старожил

    • Участник
    • Старожил
    Рег.:
    30.03.2012
    Сообщения:
    4.130
    Симпатии:
    2.907
    Репутация:
    62
    Оффлайн
    Долбанутым нет покоя.

    [​IMG]
  29. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Я ничего не утверждаю, но могу провести независимое тестирование между 14-м стоком и Толстым. Какой надо делать контроль, хэш, количество партий? Какую сеть ставить?
    svoitsl нравится это.
  30. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    да, хорошо бы их свести с глазу на глаз
    Возьмите самые последние версии, какими располагаете для вашего процессора, для начальных позиций возьмите книжку типа Noomen_2Ply_Book.pgn (слишком глубокую и совсем без книжки вряд ли хорошо), TC 1'+1" думаю вполне нормально, ну остальное как у вас 1 ядро, 256 Мб,(для близких движков эти параметры влияют одинаково на оба), можете для ускорения процесса syzygy - 6 man, попробуйте для начала 10 кругов (2000 игр), займет чуть менее суток на 3 ядрах (одно оставьте для оболочки и ОС)
  31. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    А как на трех ядрах, если одно ядро?
  32. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    Это я перепутал?
    Или вы его уже успели запродать?
    Оболочка cutechess-cli например позволяет вести турнир сразу на нескольких ядрах, давая каждой игре нужное число ядер (потоков), то есть вы запросто можете проводить 3 турнира параллельно предоставляя каждому по 1 ядру, это несколько сокращает общее время
  33. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Я не знаю такую. Я тестирую в оболочке Фрица.
  34. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    279
    Симпатии:
    68
    Репутация:
    7
    Оффлайн
    не уверен, что он так умеет, хотя и мог бы , ведь денежки то они могут брать (правда не все дают...).
    Когда проводятся тестовые турниры на fishtest 60 000 игр,то их просто параллелят на много ядер и весь тест не занимает слишком много времени
  35. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    14.021
    Симпатии:
    6.767
    Репутация:
    487
    Нарушения:
    48
    Оффлайн
    Ну, я уж ничего выдумывать не буду, проведу в оболочке Фрица. только не по минуте. Весь цимес в том, чтобы проверить на более длинных контролях. Скажем, 4+2. много партий, конечно, не смогу, но штук 300 можно попробовать.
    svoitsl нравится это.

Поделиться этой страницей