WildCat: нужны тестеры

Тема в разделе "Машинное отделение", создана пользователем WildCat, 26 окт 2006.

  1. Igrok7 Учаcтник

    • Участник
    Рег.:
    04.01.2007
    Сообщения:
    132
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Книга дебютов-эта палка о 2 концах.Я легко нахожу дыры во многих книгах,конечно мне её надо видеть.Книга дебютов у компа-это друг человека!А вот с 7-ми ходовыми книгами бороться намного труднее
  2. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Мне в шахматы с людьми не очень интересно бороться.

    Вот если бы в шашки...
  3. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    доверительный интервал - он и в Африке доверительный интервал :)
    Обычно используют достоверность 95%
    Что это такое - могу привести ссылки на курсы лекций по ТВ и мат. статистике.
  4. Igrok7 Учаcтник

    • Участник
    Рег.:
    04.01.2007
    Сообщения:
    132
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    "Мне в шахматы с людьми не очень интересно бороться"-почему?В игре против человека у программы,вскрываются такие недостатки,как непонимение крепости,слабая игра в некоторых эндшпилях,дыры в дебютной книге(если она конечно есть).
    "Вот если бы в шашки..."-это слишком сложная игра,мне что-нибудь попроще...
  5. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Ну шахматы-то не особенно попроще.
  6. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    По последним данным Wildcat 7 похоже не слабее в длинном контроле чем в блице.

    Блиц (CCRL 40/4):
    Код:
     Rank              Engine               ELO   +    -   Score  AvOp  Games
          Naum 2.0 32-bit                  2799  +10  -10  51.2%  -16.6  3846
       13 CM10th Paralyse                  2757  +17  -17  41.2%  +60.5  1251
       14 Glaurung 1.2.1 32-bit            2753  +11  -10  42.4%  +54.2  3500
          Glaurung 1.2.1 64-bit            2738  +17  -17  35.7% +111.6  1317
          Scorpio 1.8                      2726  +14  -14  40.5%  +70.8  2053
       15 Pro Deo 1.2                      2717  +17  -18  45.5%  +32.1  1190
       16 Slow Chess Blitz WV2.1           2711  +11  -11  40.8%  +67.1  3354
       17 Zappa 1.1 64-bit                 2706  +25  -25  41.0%  +63.1   542
    >> 18 WildCat 7                        2705  +17  -17  50.3%   -2.2  1185
       19 Pharaon 3.5.1                    2702  +15  -15  37.3%  +92.9  1613
       20 Gandalf 6                        2696  +26  -26  36.9%  +93.6   516
       21 SOS 5.1                          2687  +16  -16  44.5%  +39.9  1345
       22 Ruffian 1.0.5                    2680  +17  -17  50.7%   -4.7  1189
       23 Pseudo 0.7c                      2678  +16  -16  52.9%  -29.3  1497
       24 Delfi 5.0                        2672  +14  -15  35.4% +112.6  1845
          WildCat 6                        2664  +19  -19  54.7%  -46.0  1097
       25 Aristarch 4.50                   2662  +16  -17  42.3%  +58.3  1356
    Длинный контроль (CCRL 40/40):
    Код:
     Rank              Engine               ELO   +    -   Score  AvOp  Games
        9 Naum 2.0 32-bit                 2803  +19  -19  51.4%   -7.1   932
       13 Glaurung 1.2.1 64-bit           2769  +24  -24  46.3%  +25.4   590
       14 CM10th Paralyse                 2764  +25  -26  42.4%  +52.4   499
          Glaurung 1.2.1 32-bit           2758  +19  -19  43.7%  +44.5   959
       16 Scorpio 1.8                     2746  +19  -19  47.9%  +14.9   877
       17 Slow Chess Blitz WV2.1          2742  +17  -16  49.0%   +6.8  1206
          Zappa 1.1 64-bit                2733  +25  -25  45.5%  +32.5   507
    >> 18 WildCat 7                       2727  +21  -21  44.9%  +34.6   767
       19 Pro Deo 1.2                     2726  +23  -23  51.3%  -12.6   669
       20 Gandalf 6                       2723  +16  -16  40.0%  +68.8  1411
       22 Pharaon 3.5.1                   2713  +19  -19  44.4%  +39.4   948
          Ruffian 1.0.5                   2713  +21  -21  46.0%  +25.3   732
       23 Delfi 5.0                       2703  +20  -20  47.9%  +12.9   796
       24 Aristarch 4.50                  2699  +16  -16  43.1%  +49.9  1367
          WildCat 6                       2698  +22  -22  47.1%  +18.3   680
       25 Pseudo 0.7c                     2688  +22  -22  48.7%   +8.5   665
       30 SOS 5.1                         2656  +28  -28  43.6%  +41.8   429
    Выборка по 16 однопроцессорным движкам близким к Wildcat 7 по рейтингу, и присутсвующим в обоих листах. (Всего 17 движков).

    В наши рассчёты похоже закралось смещение рейтинга бесплатных движков (так как мы калибруем в основном по коммерческим). Похоже что 40/40 в среднем выше чем 40/4. Попробуем исправить в будущем, а пока что нужно делать поправку:

    (2799+2757+2753+2738+2726+2717+2711+2706+2705+2702+2696+2687+2680+2678+2672+2664+2662)/17 = 2709.0

    (2803+2769+2764+2758+2746+2742+2733+2727+2726+2723+2713+2713+2703+2699+2698+2688+2656)/17 = 2727.1

    2727.1 - 2709.0 = 18.1

    То есть 40/4 на 18.1 пунктов ниже чем 40/4. Поэтому нужно сравнивать 2727 (Wildcat 7 в 40/40) и 2723.1 (поправленный рейтинг Wildcat 7 в 40/4). Так что всё не так плохо, в длинном контроле даже на 4 пункта лучше чем в блице. (+- доверительный интервал).

    Вот, например, SOS 5.1 заметно сильнее играет блиц чем в длинном контроле.
  7. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Может кто-нибудь желает потестировать версию моей проги с PVS против обычной альфа-беты? Желательно провести несколько сотен партий.
  8. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    контроль?
  9. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Любой, какой будет удобнее.
  10. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    www.igorkorshunov.narod.ru/WildCat_PVS.rar

    7.12 - это альфа-бета
    7.13 - это PVS (для моей шашечной программы он лучше, поэтому решил попробовать еще и на шахматной)
  11. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    А PVS с узким окном в корне, или без узкого окна?
  12. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Кстати, даже в простой альфа-бете в корне дерева все равно PVS.
    А в PVS все ветви равноправны хотя и есть узлы PV, ALL и CUT. Тут еще есть где усилить.
  13. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Да, в корне всегда используется узкое окно.
  14. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Уровень: 3 мин./партия
    WildCat 7.12 115.0 / 222 51.80%
    WildCat 7.13 107.0 / 222 48.20%
  15. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    А какая оболочка, какие дебюты?
  16. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    1: WildCat 7.13 52,0/100
    2: WildCat 7.12 48,0/100

    Arena GUI 1'+2"/game, ArenaRandom.pgn (option "Repeat startposition with colours switched" checked)
    Hardware: Intel(R) Pentium(R) 4 CPU 2.00GHz with 383 MB Memory
    Operating system: Microsoft Windows XP Professional Service Pack 2 (Build 2600)
  17. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Похоже для блица разница очень мала. Попробую использовать информацию о типах узлов. Может это поможет.
  18. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Shredder Classic, nunn2, по 32 мв каждому движку
  19. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Скоро сделаю новую версия, без извратов в узлах PV.

    Пока попытался убрать отсечения / cокращения в узлах ALL. Глубина перебора упала просто жутко.

    [​IMG]
  20. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Я в шашках делаю все узлы равноценными. При разнице в алгоритмах в зависимости от типов узлов возрастает нестабильность перебора и иногда начинает катастрофически расти дерево...
    А силы доп. продления и отсуствие сокращений в PV что-то по моим тестам не прибавляет...

    А сокращения в PV узлах (Null-Move и LMR) делаешь?
  21. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Нет.
  22. Counter Учаcтник

    • Участник
    Рег.:
    21.01.2007
    Сообщения:
    23
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Как я понял, весь смысл PVS в том, чтобы отслеживать полностью Principal Variation, а не уменьшить дерево. Для этого не надо делать лишних отсечек в PV-узлах (например, используя TT). А если ставить цель перебрать мешьше узлов с помощью PVS, то, наверно, на последних двух полуходах PVS применять вообще не имеет смысла.
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Смысл PVS не в том чтоб отслеживать PV ветви, а в том чтоб считать с нулевым окном. :)
  24. Counter Учаcтник

    • Участник
    Рег.:
    21.01.2007
    Сообщения:
    23
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Если в Анечке используется PVS, то на сколько дерево уменьшается?
    Если для тебя главное нулевое окно, то немедля переименуй метод в NWS (Null Window Search) :)
  25. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Другое название PVS/Negascout - метод нулевой ширины.
    Используется он не потому что мы разделяем узлы по типам, а потому что есть такая теорема - PVS всегда смотрит узлов не больше чем альфа-бета, на любом дереве.
    В классическом Negascout нет никакого разделения ветвей...

    Так что не у меня это метод нулевой ширины, PVS был придуман как метод нулевой ширины.
  26. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    фтопку эту теорему
  27. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
  28. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    А у меня ни одна из 7-х версий не играет. Ни в Шредер Классик, ни во Фрице. Анализ идет, а ходов нет:(
    Может ее надо как-то по-особенному подключать? Или контроль тока определенный?
  29. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    WildCat написан под протокол Winboard, а в UCI он поддерживает только анализ.
  30. ProstoTak Старожил

    • Ветеран
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    5.479
    Симпатии:
    123
    Репутация:
    1
    Оффлайн
    Заметил такой глюк. При контроле 40 ходов за 5 минут первые 40 ходов отыграл быстро, а начиная с 41 начал думать по полторы - две минуты над ходом.
  31. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    У меня 7.13.02 конфликтует с оболочкой Шреддера. Когда запускаю матч, после пары партий, вылетает с ошибкой сначала Shredder classic, а затем WildCat 7.13.02. :(
  32. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Эта версия ничем особенным от других не отличается. И у меня работает нормально.
  33. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Значит, это Шреддер химичет. Попробую перейти на Фриц 10.
  34. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Наверно к следущему релизу сделаю UCI, чтобы не было проблем с адаптерами.
  35. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Сдаётся мне, 12-ая припечатает 13.02 с большим отрывом (около 80 ело) в моём тестировании. Непонятно почему.

Поделиться этой страницей