WildCat: нужны тестеры

Тема в разделе "Машинное отделение", создана пользователем WildCat, 26 окт 2006.

  1. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Закончилось тестирование на защите Алехина.
    Общий результат +64 после 192 партий.
    Уже можно быть уверенным, что новая версия усилилась.

    Новая по формуле (squares - 4) * 0.05, раньше было squares * 0.02.
    Причем препятствиями для мобильности считаются только пешки.
     
  2. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    А не проще ли было уменьшить стоимость слона на 0.2 пешки, а формулу заменить на squares * 0.05 ? :)
    А сами битые пешки (свои и соперника) Входят в количество возможностей?

    Я сделал "по-Каиссовски" - раз Слон их защищает (либо нападает на пешку соперника) То эти возможности включаем в количество битых полей.

    То есть при слоне на e3 - ход соперника h7-h6 не уменьшает количество возможностей слона, а вот ход g7-g5 уменьшает возможности на одну.
    То-же самое и со своими пешками.
     
  3. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Пешки не включаются в мобильность.
    Сделал так как было проще. Этот -4 вообще от балды. Он даже может слегка портит дело. Но уж показалось давать такие большие бонусы слону противоестественно.

    Самые свежие данные о тестировании: +55 после 352 игр.

    Новую Кошку уже можно скачать: http://www.igorkorshunov.narod.ru/WildCat/
     
  4. krey
    Оффлайн

    krey Михаил Кройтор Команда форума Команда форума

    Репутация:
    1
    ура!!! а теперь, давайте во вбек выйдем в премьер-лигу ;)
     
  5. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Теперь должна реально бороться за выход :)
     
  6. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    (squares - 4) * 0.05=squares*0.05-4*0.05=squares*0.05-0.2.
    Вычитанием четверки мы не меняем формулу, а уменьшаем стоимость слона на 0.2 пешки.
     
  7. krey
    Оффлайн

    krey Михаил Кройтор Команда форума Команда форума

    Репутация:
    1
    при подключении движок показывает версию 6.09.03 ;)
     
  8. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Да, +64 пункта, если верить рейтингам WBEC - должна выходить в высшую лигу...
    23-яя по силе по рейтингам WBEC - но если учесть что тестировалось на коротких контролях, а например исправление IID сказывается больше на длинных контролях - можно ожидать больше прибавки на длинных контролях.
     
  9. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Сделал так как было проще.
     
  10. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Это только под UCI. Просто неправильный текст. Теперь можно скачать заново.
     
  11. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Там мало игр. Так что элемент случайности очень важен. На IID я не особо надеюсь.
     
  12. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    А зря - я не ленился тестировать движок на длинных контролях.
    Второй ход в хеше, IID, сортировка тихих ходов по истории - сказываются только на длинных контролях.

    При этом я знаю почему у меня такой большой эффект от IID - у меня нет SEE (у меня MVV/LVA), и IID выполняет его функцию - Вытаскивает наверх более перспективные взятия (и есно это делает четче чем MVV/LVA)
     
  13. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Ты думаешь все дело в лени? Просто нет времени. Уже при 2 + 1 тестируется очень долго.
     
  14. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Можно попробовать собрать хорошую базу Тестовых позиций.
    При незначительных изменениях (именно улучшениях) переборных алгоритмов - они должны показывать правильную динамику - изменение Бренчинг фактора, ну и само количество решенных позиций и время на решение. У меня много было времени на тестирование :) Почти пол-года прошло с выхода последней версии :)
     
  15. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Тестовые позиции это не совсем то же, что и реальная партия, т.к. там еще предыдущие переборы влияние оказывают.
    Но если собрать большую базу, то тестирование можно начинать с нее. Но опять проблема: можно решать тактические позиции быстрее за счет ухудшения позиционной игры. А это очень плохо.
    А в базу позиций с стратегически правильными ходами я не верю.
     
  16. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Если у нас осталась та же ОФ, те-же переборные схемы...
    изменился только порядок ходов (сортировки), и при этом режем меньше (не режем по LMR доп. появившиеся в Хеше ходы)
    если на всех тестовых позициях умешилось время расчета на ту-же глубину, уменьшилось время решения тестовых позиций, увеличилось количество решенных позиций - то за счет чего может быть ослабление?
     
  17. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    У меня часто бывало, что тесты решает лучше, а играет хуже.
     
  18. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Это возможно при изменении переборных алгоритмов, но в случае IID и второго хода в хеше - мы их не меняем!
     
  19. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    150
  20. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    А почему WildCat 7 не хочет ходить под UCI? Думать-то думает, но не более того...Через адаптер (если его как WB подключить) всё ОК!
     
  21. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Потому что это WB-движок, а не UCI.
     
  22. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Странный WB-движок, подключающийся как UCI :)
     
  23. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Он поддерживает анализ при помощи UCI протокола. Но пока только его и поддерживает...
    Но насколько я понимаю потихоньку добавляется полная поддержка UCI (тут в архиве есть ветка где кто-то доказывает что winboard лучший, а UCI слабое подобие нормального протокола :) )
     
  24. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Тестирование версий 6.08 и 7 Александром Свириным показало преимущество новой версии +48 пунктов (каждая версия сыграла по 1000 партий)!
    Версия 6.08 по силе практически не отличается от 6 (по моими тестам, по 1600 партий).
     
  25. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
  26. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Теперь можно смело заявить, что на данный момент Кошка сильнейшая бесплатная прога в СНГ :)
     
  27. krey
    Оффлайн

    krey Михаил Кройтор Команда форума Команда форума

    Репутация:
    1
    интересно, чем объясняется результат версий против Jonny?
     
  28. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Ну почти всегда 1 из 20 результатов должен (!) выходить за рамки ожидаемого.
     
  29. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Похоже и шестая версия была сильнее всех бесплатных SmarThink-ов :)
    Правда в рейтинг-листах которые нашел я - разница не выходит за пределы доверительных интервалов.
     
  30. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Кстати, в CEGT 64-битный Смарфи всего на 17 пунктов сильнее 32-битного. Он точно битбордный?
     
  31. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    150
    2 WildCat: киса, а ты не хочешь как-нибудь научиться правильно оценивать некоторые крепости? Про слона с ладейной пешкой уж не буду, предложу ещё несколько штук:

    Это знают многие проги

    Это знают многие проги

    Шрёддер оценивает эту позицию правильно! Значит, и тебе этому вполне реально научиться. Число примеров, конечно, можно легко увеличить и добавить крепости, которые пока не может распознать ни одна прога :)
     
  32. Инсайдер
    Оффлайн

    Инсайдер Bruce Wayne

    Репутация:
    0
    Cделать он может быть и может, а зачем? На рейтинг программы это не влияет, поскольку процент партий, где это может пригодиться, ничтожно мал, и находится в пределах статистической погрешности.
     
  33. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Распознавание таких крепостей в прогах это просто PR. А мне он зачем?
     
  34. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    150
    Если задаваться целью набрать побольше рейтинг на CCRL, то незачем. Но если есть более высокие цели, например "окончательное решение человеческого вопроса", то это должно пригодиться.
     
  35. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Программы находят крепости, при увеличении глубины перебора.
    Многие крепости - например как в случае качества за пешку :) Могут быть заданы напрямую в ОФ при оценке простейших эндшпилей.

    Насчет окончательного решения человеческого вопроса... А случайно никто из Элиты не хочет сыграть мытч с Рыбкой на той-же машине на которой Крмник играл с Фрицем :)
    В Рыбке ничего нет для поиска крепостей :)