WildCat: нужны тестеры

WildCat · 16 ноя 2006

Закончилось тестирование на защите Алехина.
Общий результат +64 после 192 партий.
Уже можно быть уверенным, что новая версия усилилась.

Новая по формуле (squares - 4) * 0.05, раньше было squares * 0.02.
Причем препятствиями для мобильности считаются только пешки.

NS · 16 ноя 2006

(squares - 4) * 0.05
Нажмите, чтобы раскрыть...

А не проще ли было уменьшить стоимость слона на 0.2 пешки, а формулу заменить на squares * 0.05 ?
А сами битые пешки (свои и соперника) Входят в количество возможностей?

Я сделал "по-Каиссовски" - раз Слон их защищает (либо нападает на пешку соперника) То эти возможности включаем в количество битых полей.

То есть при слоне на e3 - ход соперника h7-h6 не уменьшает количество возможностей слона, а вот ход g7-g5 уменьшает возможности на одну.
То-же самое и со своими пешками.

WildCat · 16 ноя 2006

Пешки не включаются в мобильность.

NS пишет:

А не проще ли было уменьшить стоимость слона на 0.2 пешки, а формулу заменить на squares * 0.05 ? smile
Нажмите, чтобы раскрыть...

Сделал так как было проще. Этот -4 вообще от балды. Он даже может слегка портит дело. Но уж показалось давать такие большие бонусы слону противоестественно.

Самые свежие данные о тестировании: +55 после 352 игр.

Новую Кошку уже можно скачать: http://www.igorkorshunov.narod.ru/WildCat/

krey · 16 ноя 2006

ура!!! а теперь, давайте во вбек выйдем в премьер-лигу

WildCat · 16 ноя 2006

Теперь должна реально бороться за выход

NS · 16 ноя 2006

Сделал так как было проще. Этот -4 вообще от балды. Он даже может слегка портит дело. Но уж показалось давать такие большие бонусы слону противоестественно.
Нажмите, чтобы раскрыть...

(squares - 4) * 0.05=squares*0.05-4*0.05=squares*0.05-0.2.
Вычитанием четверки мы не меняем формулу, а уменьшаем стоимость слона на 0.2 пешки.

krey · 16 ноя 2006

при подключении движок показывает версию 6.09.03

NS · 16 ноя 2006

Да, +64 пункта, если верить рейтингам WBEC - должна выходить в высшую лигу...
23-яя по силе по рейтингам WBEC - но если учесть что тестировалось на коротких контролях, а например исправление IID сказывается больше на длинных контролях - можно ожидать больше прибавки на длинных контролях.

WildCat · 16 ноя 2006

NS пишет:

Сделал так как было проще. Этот -4 вообще от балды. Он даже может слегка портит дело. Но уж показалось давать такие большие бонусы слону противоестественно.
Нажмите, чтобы раскрыть...

(squares - 4) * 0.05=squares*0.05-4*0.05=squares*0.05-0.2.
Вычитанием четверки мы не меняем формулу, а уменьшаем стоимость слона на 0.2 пешки.
Нажмите, чтобы раскрыть...

Сделал так как было проще.

WildCat · 16 ноя 2006

krey пишет:

при подключении движок показывает версию 6.09.03
Нажмите, чтобы раскрыть...

Это только под UCI. Просто неправильный текст. Теперь можно скачать заново.

WildCat · 16 ноя 2006

NS пишет:

Да, +64 пункта, если верить рейтингам WBEC - должна выходить в высшую лигу...
23-яя по силе по рейтингам WBEC - но если учесть что тестировалось на коротких контролях, а например исправление IID сказывается больше на длинных контролях - можно ожидать больше прибавки на длинных контролях.
Нажмите, чтобы раскрыть...

Там мало игр. Так что элемент случайности очень важен. На IID я не особо надеюсь.

NS · 16 ноя 2006

А зря - я не ленился тестировать движок на длинных контролях.
Второй ход в хеше, IID, сортировка тихих ходов по истории - сказываются только на длинных контролях.

При этом я знаю почему у меня такой большой эффект от IID - у меня нет SEE (у меня MVV/LVA), и IID выполняет его функцию - Вытаскивает наверх более перспективные взятия (и есно это делает четче чем MVV/LVA)

WildCat · 16 ноя 2006

Ты думаешь все дело в лени? Просто нет времени. Уже при 2 + 1 тестируется очень долго.

NS · 16 ноя 2006

Можно попробовать собрать хорошую базу Тестовых позиций.
При незначительных изменениях (именно улучшениях) переборных алгоритмов - они должны показывать правильную динамику - изменение Бренчинг фактора, ну и само количество решенных позиций и время на решение. У меня много было времени на тестирование Почти пол-года прошло с выхода последней версии

WildCat · 16 ноя 2006

Тестовые позиции это не совсем то же, что и реальная партия, т.к. там еще предыдущие переборы влияние оказывают.
Но если собрать большую базу, то тестирование можно начинать с нее. Но опять проблема: можно решать тактические позиции быстрее за счет ухудшения позиционной игры. А это очень плохо.
А в базу позиций с стратегически правильными ходами я не верю.

NS · 16 ноя 2006

Если у нас осталась та же ОФ, те-же переборные схемы...
изменился только порядок ходов (сортировки), и при этом режем меньше (не режем по LMR доп. появившиеся в Хеше ходы)
если на всех тестовых позициях умешилось время расчета на ту-же глубину, уменьшилось время решения тестовых позиций, увеличилось количество решенных позиций - то за счет чего может быть ослабление?

WildCat · 16 ноя 2006

У меня часто бывало, что тесты решает лучше, а играет хуже.

NS · 16 ноя 2006

Это возможно при изменении переборных алгоритмов, но в случае IID и второго хода в хеше - мы их не меняем!

Мобуту · 17 ноя 2006

.

immortal223 · 17 ноя 2006

А почему WildCat 7 не хочет ходить под UCI? Думать-то думает, но не более того...Через адаптер (если его как WB подключить) всё ОК!

WildCat · 17 ноя 2006

Потому что это WB-движок, а не UCI.

immortal223 · 19 ноя 2006

Странный WB-движок, подключающийся как UCI

NS · 19 ноя 2006

Он поддерживает анализ при помощи UCI протокола. Но пока только его и поддерживает...
Но насколько я понимаю потихоньку добавляется полная поддержка UCI (тут в архиве есть ветка где кто-то доказывает что winboard лучший, а UCI слабое подобие нормального протокола )

WildCat · 21 ноя 2006

Тестирование версий 6.08 и 7 Александром Свириным показало преимущество новой версии +48 пунктов (каждая версия сыграла по 1000 партий)!
Версия 6.08 по силе практически не отличается от 6 (по моими тестам, по 1600 партий).

WildCat · 21 ноя 2006

Вот таблички с результатами, если кому интересно:
www.igorkorshunov.narod.ru/AS/6_08.html
www.igorkorshunov.narod.ru/AS/7.html

WildCat · 21 ноя 2006

Теперь можно смело заявить, что на данный момент Кошка сильнейшая бесплатная прога в СНГ

krey · 21 ноя 2006

интересно, чем объясняется результат версий против Jonny?

WildCat · 21 ноя 2006

Ну почти всегда 1 из 20 результатов должен (!) выходить за рамки ожидаемого.

NS · 21 ноя 2006

WildCat пишет:

Теперь можно смело заявить, что на данный момент Кошка сильнейшая бесплатная прога в СНГ
Нажмите, чтобы раскрыть...

Похоже и шестая версия была сильнее всех бесплатных SmarThink-ов
Правда в рейтинг-листах которые нашел я - разница не выходит за пределы доверительных интервалов.

WildCat · 21 ноя 2006

Кстати, в CEGT 64-битный Смарфи всего на 17 пунктов сильнее 32-битного. Он точно битбордный?

Мобуту · 2 дек 2006

2 WildCat: киса, а ты не хочешь как-нибудь научиться правильно оценивать некоторые крепости? Про слона с ладейной пешкой уж не буду, предложу ещё несколько штук:

Это знают многие проги

Это знают многие проги

Шрёддер оценивает эту позицию правильно! Значит, и тебе этому вполне реально научиться. Число примеров, конечно, можно легко увеличить и добавить крепости, которые пока не может распознать ни одна прога

Инсайдер · 2 дек 2006

Cделать он может быть и может, а зачем? На рейтинг программы это не влияет, поскольку процент партий, где это может пригодиться, ничтожно мал, и находится в пределах статистической погрешности.

WildCat · 2 дек 2006

Распознавание таких крепостей в прогах это просто PR. А мне он зачем?

Мобуту · 2 дек 2006

Если задаваться целью набрать побольше рейтинг на CCRL, то незачем. Но если есть более высокие цели, например "окончательное решение человеческого вопроса", то это должно пригодиться.

NS · 4 дек 2006

Программы находят крепости, при увеличении глубины перебора.
Многие крепости - например как в случае качества за пешку Могут быть заданы напрямую в ОФ при оценке простейших эндшпилей.

Насчет окончательного решения человеческого вопроса... А случайно никто из Элиты не хочет сыграть мытч с Рыбкой на той-же машине на которой Крмник играл с Фрицем
В Рыбке ничего нет для поиска крепостей

Войти или зарегистрироваться

WildCat: нужны тестеры

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

krey Михаил Кройтор Команда форума Команда форума

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

krey Михаил Кройтор Команда форума Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

WildCat Коршунов Игорь Команда форума

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

Мобуту спаситель нации баннер

immortal223 Вячеслав

WildCat Коршунов Игорь Команда форума

immortal223 Вячеслав

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

WildCat Коршунов Игорь Команда форума

WildCat Коршунов Игорь Команда форума

krey Михаил Кройтор Команда форума Команда форума

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

Мобуту спаситель нации баннер

Инсайдер Bruce Wayne

WildCat Коршунов Игорь Команда форума

Мобуту спаситель нации баннер

NS Нефёдов Сергей баннер