Стокфиш 14

Тема в разделе "Машинное отделение", создана пользователем Rom, 3 июл 2021.

  1. Локомотив Старожил

    • Участник
    • Старожил
    Рег.:
    30.03.2012
    Сообщения:
    4.741
    Симпатии:
    3.498
    Репутация:
    95
    Оффлайн
    У черных были победы?
  2. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Ни одной. Либо белые выигрывали, либо ничья. Вот "главный" ничейный вариант.
    1. e4 d6 2. d4 Nf6 3. Nc3 g6 4. Be3

    4... Bg7
    11-я версия играла 4...c6, и её били: 5. h3 Bg7 6. f4 O-O 7. Nf3 Nbd7 8. e5 Nd5 9. Nxd5 cxd5 10. Bd3 Qb6 11. Qc1 dxe5 12. dxe5 Nc5 13. O-O.

    Это она не удерживала.
    Если продолжить с прошлой диаграммы:
    5. Qd2

    5... c6
    13-я версия спешила с 5...O-O, и после 6. O-O-O проигрывала борьбу с разносторонними рокировками.

    6. Nf3 O-O 7. a4 Nbd7 8. h3 e5

    И эту "затупившуюся" позицию 14-я и 15-я версии играли вничью.
    Ечетырник, Kalvados и Локомотив нравится это.
  3. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    Рег.:
    30.12.2009
    Сообщения:
    16.020
    Симпатии:
    8.078
    Репутация:
    519
    Нарушения:
    68
    Оффлайн
    Чего-то Стокфиш даже 15-й без сетки вообще мышей не ловит. Его даже мой старенький Эман без сетки бьет.

    3 минуты, 256 хэша

    Eman 7.40 64-bit SSE2 - Stockfish 14 5.0 - 5.0 +0/=10/-0 50.00%
    Eman 7.40 64-bit SSE2 - Stockfish 14.1 noNNUE 6.0 - 4.0 +2/=8/-0 60.00%
    Eman 7.40 64-bit SSE2 - Stockfish 15 4.0 - 6.0 +1/=6/-3 40.00%
    Eman 7.40 64-bit SSE2 - Stockfish 15 NoNNUE 6.5 - 3.5 +3/=7/-0 65.00%
  4. Spike Кот с горы

    • Участник
    Рег.:
    18.09.2015
    Сообщения:
    1.127
    Симпатии:
    889
    Репутация:
    43
    Оффлайн
    15-й вообще ничего не показал, конечно, у меня не супер-железо, но разница 14-13 была видна на таком же железе.
    Вывод - включились в гонку версий, впрочем, о том и заявлялось, где-то выше была цитата.
    Предлагаю тему переименовать в "Стокфиш 14, 14.1, 15", дабы повысить находимость и удержать от искусов темотворства неофитов.
  5. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    17.886
    Симпатии:
    21.675
    Репутация:
    1.176
    Оффлайн
    Вывод неправильный!
    Пока не набирают нужного прироста (30-50 Эло, точно не помню) — не релизят новую цифру
  6. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Тестирую вышедшую в конце июня 16-ю версию.
    Без дебютной книжки и с начальной позиции блиц-турнир нескольких Стокфишей закончился вничью, в основном там был унылый вариант 1. e4 e5 2. Nf3 Nc6 3. Bb5 Nf6 4. O-O Nxe4 5. Re1.
    Попробовал дебют с нарушенным соотношением: 1. d4 d5 2. c4 c6 3. Nf3 Nf6 4. Nc3 dxc4 5. e4 b5 6. e5 Nd5 7. a4 e6. Увы, нарушение равновесия оказалось недостаточным. Во всех партиях движки играли 8. Be2, дальше где-то проводили b2-b3 и доводили дело до ничьей. Чтобы добиться результативности, пришлось добавить в обязательную программу ещё один популярный ход: 8. axb5. Стартовая позиция:


    С точки зрения компьютерного турнира, это похоже на пенальти: либо чёрные забьют, либо белый голкипер сделает ничью. Вариант победы белых нереалистичен.
    Результат турнира: 15-я и 16-я версия продемонстрировали явное превосходство над 12-й и 13-й. Белыми спаслись, чёрными выиграли.
    upload_2023-7-10_23-48-4.png



    Ечетырник нравится это.
  7. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    есть разбалансированные дебютные книжки (+0.75) , на них и тестируют...
    16 против 15 свою разницу в Эло возьмёт (на долгой дистанции)
  8. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Это будет разница, показанная через увеличительное стекло. Ведь с нормальной книжкой почти всё сыграют вничью, хотя рейтинги будут предсказывать разгром младшей версии.

    Кстати, вот первые результаты тестов на CCRL. Там, кажется, книжка нормальная. Для всех смотрим 64 bit 4 CPU. Для 16-й версии результаты наверняка предварительные, не могла она успеть наиграть много партий.
    Stockfish 16 - 3550 (2023)
    Stockfish 15 - 3528
    Stockfish 14.1 - 3516
    Stockfish 13 - 3524
    Stockfish 12 - 3503 (2020 год релиза)
  9. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    22 пункта явно не разгром...
    Возьмите раннюю, 16-ая и на начальной позе закатает её в асфальт
  10. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    309
    Симпатии:
    77
    Репутация:
    7
    Оффлайн
    Вот результат сравнения более нового Стокфиша, чем 16-й с 14-м
    Score of ST70318 vs ST14: 32 - 0 - 168 [0.580] 200
    ... ST70318 playing White: 23 - 0 - 77 [0.615] 100
    ... ST70318 playing Black: 9 - 0 - 91 [0.545] 100
    ... White vs Black: 23 - 9 - 168 [0.535] 200
    Elo difference: 56.1 +/- 18.1, LOS: 100.0 %, DrawRatio: 84.0 %
  11. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    56 Эло хорошо, но 14-ая версия (в канве разговора с Мобуту) поздняя, надо брать досетевую...
  12. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Так этот рейтинг-лист формируется на базе партий с нормальными дебютами. Если бы они были кривые, то разрыв в рейтингах был бы гораздо больше.

    Если на 1. e4 ответит e5, то ... насколько ранней по номеру должна быть версия, чтоб проиграть?
  13. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    досетевую будет выносить (не помню номер точно, но берите 2019 год) с большой вероятностью регулярно, 200 пунктов не шутка...
  14. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Вроде бы, последняя досетевая это Stockfish 11. В 12-ю что-то такое внедрили, она вдруг резко заиграла лучше в закрытых позициях, всякая там восьмипешечная чигоринская испанка, вариант Винавера во французской или старушка с запиранием игры. Но в "нормальных" позициях особого превосходства над прежними версиями вроде не было. И на CCRL разница между 16-й и 11-й меньше 100 очков.
    Stockfish 16 - 3550 (июнь 2023)
    Stockfish 11 - 3466 (январь 2020)
  15. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.730
    Симпатии:
    3.420
    Репутация:
    125
    Адрес:
    Заир
    Оффлайн
    Хотя... 11-й таки проиграл 16-му после 1. e4 e5 на моей машине.


    kozel64a нравится это.
  16. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    309
    Симпатии:
    77
    Репутация:
    7
    Оффлайн
    последняя Stockfish 20073110 (она же Stockfish final HCE - Hand Crafted Evaluation)
    https://abrok.eu/stockfish/?page=34
    согласно https://www.sp-cc.de/
    Program Elo + - Games Score Av.Op. Draws

    1 Stockfish 230706 avx2 : 3823 8 8 7000 67.2% 3696 65.4%
    2 KomodoDragon 3.2 avx2 : 3775 6 6 11000 59.7% 3703 72.7%
    3 Berserk 11 avx2 : 3704 6 6 13000 50.0% 3705 75.9%
    4 CSTal 2.0 avx2 : 3686 6 6 11000 47.9% 3702 77.1%
    5 Ethereal 14.00 nnue : 3678 6 6 15000 47.6% 3697 75.6%
    6 Koivisto 9.2 avx2 : 3664 6 6 16000 46.7% 3689 71.9%
    7 RubiChess 230410 avx2 : 3654 6 6 16000 45.2% 3690 72.3%
    8 Revenge 3.0 avx2 : 3642 6 6 16000 47.6% 3660 75.2%
    9 Igel 3.5.0 popavx2 : 3632 6 6 11000 51.9% 3619 76.3%
    10 Clover 5 avx2 : 3628 6 6 11000 49.7% 3630 76.4%
    11 Rebel 16.1 : 3621 5 5 15000 49.3% 3625 76.4%
    12 Seer 2.6.0 avx2 : 3603 5 5 12000 49.0% 3611 74.1%
    13 Caissa 1.10 avx2 : 3587 6 6 11000 49.3% 3592 70.5%
    14 Slow Chess 2.9 avx2 : 3585 5 5 12000 48.4% 3596 72.1%
    15 Stockfish final HCE : 3581 5 5 15000 47.3% 3601 59.9%
  17. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    у него "перекошенные" дебюты вроде
  18. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    309
    Симпатии:
    77
    Репутация:
    7
    Оффлайн
    да, есть.. немного
    он использует дебюты HERT_500 testset (by Thomas Zipproth)
    но, откровенно говоря, они все же не так сильно перекошены, как например TCEC-24
    При игре сбалансированными дебютами получается такой же результат
    например для Стокфиша-16 рост порядка 20 Эло по сравнению с 15-м (разработчики пишут о 50 Эло, но это уж на сильно несбалансированных дебютах)
  19. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    309
    Симпатии:
    77
    Репутация:
    7
    Оффлайн
    https://abrok.eu/stockfish/
    Разработчики Стокфиша сделали почти революционное изменение, они полностью убрали ручную оценку, что привело к падению силы игры на 2 Эло
    Но они не унывают. надеясь, что последующая оптимизация сети и алгоритма поиска , а также облегчение разработки (код сократился на 25%) обеспечат заметный прирост.
    Жду прибавку в 10 Эло до начала осени :)
    А если по-мечтать, то может удастся вернуться на рост 50 Эло в год, как в старые добрые времена
    Тем более , что появился сильный конкурент, уже вышедший на второе место - Mystery
    Asperger нравится это.
  20. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Участник
    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    766
    Симпатии:
    1.353
    Репутация:
    37
    Нарушения:
    30
    Оффлайн
    где почитать?
  21. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    309
    Симпатии:
    77
    Репутация:
    7
    Оффлайн

Поделиться этой страницей