WildCat: нужны тестеры

Тема в разделе "Машинное отделение", создана пользователем WildCat, 26 окт 2006.

  1. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Закончилось тестирование на защите Алехина.
    Общий результат +64 после 192 партий.
    Уже можно быть уверенным, что новая версия усилилась.

    Новая по формуле (squares - 4) * 0.05, раньше было squares * 0.02.
    Причем препятствиями для мобильности считаются только пешки.
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    А не проще ли было уменьшить стоимость слона на 0.2 пешки, а формулу заменить на squares * 0.05 ? :)
    А сами битые пешки (свои и соперника) Входят в количество возможностей?

    Я сделал "по-Каиссовски" - раз Слон их защищает (либо нападает на пешку соперника) То эти возможности включаем в количество битых полей.

    То есть при слоне на e3 - ход соперника h7-h6 не уменьшает количество возможностей слона, а вот ход g7-g5 уменьшает возможности на одну.
    То-же самое и со своими пешками.
  3. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Пешки не включаются в мобильность.
    Сделал так как было проще. Этот -4 вообще от балды. Он даже может слегка портит дело. Но уж показалось давать такие большие бонусы слону противоестественно.

    Самые свежие данные о тестировании: +55 после 352 игр.

    Новую Кошку уже можно скачать: http://www.igorkorshunov.narod.ru/WildCat/
  4. krey Михаил Кройтор

    • Команда форума
    Рег.:
    10.04.2006
    Сообщения:
    3.709
    Симпатии:
    50
    Репутация:
    1
    Адрес:
    Кишинев
    Оффлайн
    ура!!! а теперь, давайте во вбек выйдем в премьер-лигу ;)
  5. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Теперь должна реально бороться за выход :)
  6. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    (squares - 4) * 0.05=squares*0.05-4*0.05=squares*0.05-0.2.
    Вычитанием четверки мы не меняем формулу, а уменьшаем стоимость слона на 0.2 пешки.
  7. krey Михаил Кройтор

    • Команда форума
    Рег.:
    10.04.2006
    Сообщения:
    3.709
    Симпатии:
    50
    Репутация:
    1
    Адрес:
    Кишинев
    Оффлайн
    при подключении движок показывает версию 6.09.03 ;)
  8. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Да, +64 пункта, если верить рейтингам WBEC - должна выходить в высшую лигу...
    23-яя по силе по рейтингам WBEC - но если учесть что тестировалось на коротких контролях, а например исправление IID сказывается больше на длинных контролях - можно ожидать больше прибавки на длинных контролях.
  9. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Сделал так как было проще.
  10. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Это только под UCI. Просто неправильный текст. Теперь можно скачать заново.
  11. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Там мало игр. Так что элемент случайности очень важен. На IID я не особо надеюсь.
  12. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    А зря - я не ленился тестировать движок на длинных контролях.
    Второй ход в хеше, IID, сортировка тихих ходов по истории - сказываются только на длинных контролях.

    При этом я знаю почему у меня такой большой эффект от IID - у меня нет SEE (у меня MVV/LVA), и IID выполняет его функцию - Вытаскивает наверх более перспективные взятия (и есно это делает четче чем MVV/LVA)
  13. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Ты думаешь все дело в лени? Просто нет времени. Уже при 2 + 1 тестируется очень долго.
  14. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Можно попробовать собрать хорошую базу Тестовых позиций.
    При незначительных изменениях (именно улучшениях) переборных алгоритмов - они должны показывать правильную динамику - изменение Бренчинг фактора, ну и само количество решенных позиций и время на решение. У меня много было времени на тестирование :) Почти пол-года прошло с выхода последней версии :)
  15. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Тестовые позиции это не совсем то же, что и реальная партия, т.к. там еще предыдущие переборы влияние оказывают.
    Но если собрать большую базу, то тестирование можно начинать с нее. Но опять проблема: можно решать тактические позиции быстрее за счет ухудшения позиционной игры. А это очень плохо.
    А в базу позиций с стратегически правильными ходами я не верю.
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Если у нас осталась та же ОФ, те-же переборные схемы...
    изменился только порядок ходов (сортировки), и при этом режем меньше (не режем по LMR доп. появившиеся в Хеше ходы)
    если на всех тестовых позициях умешилось время расчета на ту-же глубину, уменьшилось время решения тестовых позиций, увеличилось количество решенных позиций - то за счет чего может быть ослабление?
  17. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    У меня часто бывало, что тесты решает лучше, а играет хуже.
  18. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Это возможно при изменении переборных алгоритмов, но в случае IID и второго хода в хеше - мы их не меняем!
  19. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.966
    Симпатии:
    4.072
    Репутация:
    147
    Адрес:
    Заир
    Оффлайн
  20. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    А почему WildCat 7 не хочет ходить под UCI? Думать-то думает, но не более того...Через адаптер (если его как WB подключить) всё ОК!
  21. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Потому что это WB-движок, а не UCI.
  22. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    Странный WB-движок, подключающийся как UCI :)
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Он поддерживает анализ при помощи UCI протокола. Но пока только его и поддерживает...
    Но насколько я понимаю потихоньку добавляется полная поддержка UCI (тут в архиве есть ветка где кто-то доказывает что winboard лучший, а UCI слабое подобие нормального протокола :) )
  24. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Тестирование версий 6.08 и 7 Александром Свириным показало преимущество новой версии +48 пунктов (каждая версия сыграла по 1000 партий)!
    Версия 6.08 по силе практически не отличается от 6 (по моими тестам, по 1600 партий).
  25. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
  26. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Теперь можно смело заявить, что на данный момент Кошка сильнейшая бесплатная прога в СНГ :)
  27. krey Михаил Кройтор

    • Команда форума
    Рег.:
    10.04.2006
    Сообщения:
    3.709
    Симпатии:
    50
    Репутация:
    1
    Адрес:
    Кишинев
    Оффлайн
    интересно, чем объясняется результат версий против Jonny?
  28. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Ну почти всегда 1 из 20 результатов должен (!) выходить за рамки ожидаемого.
  29. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Похоже и шестая версия была сильнее всех бесплатных SmarThink-ов :)
    Правда в рейтинг-листах которые нашел я - разница не выходит за пределы доверительных интервалов.
  30. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Кстати, в CEGT 64-битный Смарфи всего на 17 пунктов сильнее 32-битного. Он точно битбордный?
  31. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.966
    Симпатии:
    4.072
    Репутация:
    147
    Адрес:
    Заир
    Оффлайн
    2 WildCat: киса, а ты не хочешь как-нибудь научиться правильно оценивать некоторые крепости? Про слона с ладейной пешкой уж не буду, предложу ещё несколько штук:

    Это знают многие проги

    Это знают многие проги

    Шрёддер оценивает эту позицию правильно! Значит, и тебе этому вполне реально научиться. Число примеров, конечно, можно легко увеличить и добавить крепости, которые пока не может распознать ни одна прога :)
  32. Инсайдер Bruce Wayne

    • Участник
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    700
    Симпатии:
    3
    Репутация:
    0
    Адрес:
    Gotham City
    Оффлайн
    Cделать он может быть и может, а зачем? На рейтинг программы это не влияет, поскольку процент партий, где это может пригодиться, ничтожно мал, и находится в пределах статистической погрешности.
  33. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Распознавание таких крепостей в прогах это просто PR. А мне он зачем?
  34. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.966
    Симпатии:
    4.072
    Репутация:
    147
    Адрес:
    Заир
    Оффлайн
    Если задаваться целью набрать побольше рейтинг на CCRL, то незачем. Но если есть более высокие цели, например "окончательное решение человеческого вопроса", то это должно пригодиться.
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Программы находят крепости, при увеличении глубины перебора.
    Многие крепости - например как в случае качества за пешку :) Могут быть заданы напрямую в ОФ при оценке простейших эндшпилей.

    Насчет окончательного решения человеческого вопроса... А случайно никто из Элиты не хочет сыграть мытч с Рыбкой на той-же машине на которой Крмник играл с Фрицем :)
    В Рыбке ничего нет для поиска крепостей :)

Поделиться этой страницей