Белка

NS · 7 ноя 2007

И в чем сомнения?

Vertu · 7 ноя 2007

Я имею ввиду, что в плане борьбы с Рыбой более полезны будут 500 партий с ней.

Vertu · 7 ноя 2007

Рыба вроде бы создавалась как "антишреддер", я упоминал об этом.

NS · 7 ноя 2007

В плане борьбы с Рыбой, в построении антиРыбного движка - конечно более полезны партии с ней. Но цель то наверно другая - сделать сильный движок.

Vertu · 7 ноя 2007

Мне кажется, что движок, успешно играющий с Рыбкой, будет весьма силен с высокой степенью вероятности.

Goranflo · 7 ноя 2007

Vertu пишет:

Мне кажется, что движок, успешно играющий с Рыбкой, будет весьма силен с высокой степенью вероятности.
Нажмите, чтобы раскрыть...

Но возможно более уязвим против других лидирующих движков. с высокой степенью вероятности!

Vertu · 7 ноя 2007

С какой стати?

Goranflo · 7 ноя 2007

Vertu пишет:

С какой стати?
Нажмите, чтобы раскрыть...

"Специалист подобен флюсу: полнота его одностороння." ©

Vertu · 7 ноя 2007

Шахматист (или программа), обыгрывающий в матче чемпиона мира, с большей вероятностью будет

а) побеждать и остальных шахматистов (программы)
б) проигрывать другим шахматистам (программам)

Я говорю (а). Вы говорите (б).
Логическую цепочку не объясните?

Goranflo · 7 ноя 2007

Vertu пишет:

Шахматист (или программа), обыгрывающий в матче чемпиона мира, с большей вероятностью будет

а) побеждать и остальных шахматистов (программы)
б) проигрывать другим шахматистам (программам)

Я говорю (а). Вы говорите (б).
Логическую цепочку не объясните?
Нажмите, чтобы раскрыть...

Шахматист - да, возможно, но не факт; программа - вовсе не обязательно!
Даже у шахматистов есть понятие "удобного/неудобного" противника, а уж у железяк и подавно...

Vertu · 7 ноя 2007

Goranflo пишет:

Шахматист - да, возможно, но не факт; программа - вовсе не обязательно!
Даже у шахматистов есть понятие "удобного/неудобного" противника, а уж у железяк и подавно...
Нажмите, чтобы раскрыть...

А вы понимаете разницу между понятиями "обязательно" и "наиболее вероятно"? Победы над Рыбкой будут снижать вероятность победы над остальными или повышать ее?

thenewone · 7 ноя 2007

Vertu,
достали
даже не смешно читать
спецьялист

Vertu · 7 ноя 2007

thenewone, тебя забыли спросить, при альтернативно одарённый

immortal223 · 7 ноя 2007

Согласен с Верту. Если двиг будет конкурировать с Рыбой, то с чего бы это вдруг он станет хуже играть с другими программами? Приведите хотя бы пару примеров схожего толка ибо только голословно все противятся тестированию исключительно против Рыбы.

Vertu · 7 ноя 2007

Закончил матч с Loop. Результаты такие же.

Rybka 2.3.2a 32-bit - Strelka 1.8 UCI 65.5 - 34.5 +48/-17/=35 65.50%
Rybka 2.3.2a 32-bit - Belka 1.8.7 62.5 - 37.5 +43/-18/=39 62.50%

Shredder 11 UCI - Strelka 1.8 UCI 60.5 - 39.5 +49/-28/=23 60.50%
Shredder 11 UCI - Belka 1.8.7 47.0 - 53.0 +30/-36/=34 47.00%

Naum 2.2 - Strelka 1.8 UCI 47.5 - 52.5 +33/-38/=29 47.50%
Naum 2.2 - Belka 1.8.7 37.0 - 63.0 +17/-43/=40 37.00%

Loop 13.6 - Strelka 1.8 UCI 52.5 - 47.5 +38/-33/=29 52.50%
Loop 13.6 - Belka 1.8.7 43.0 - 57.0 +26/-40/=34 43.00%

Партии - http://slil.ru/25069797

Видимо, белкины нововведения оказались удачными. 800 партий с 4 разными движками показали рост результатов на 3 - 13.5%.

На этом Белку тестировать заканчиваю, с ней более-менее всё ясно. Запускаю тест 6 новых бета-версий Стрелки от Юрия Осипова. Это займет минимум несколько дней даже с контролем 1+1.

thenewone · 7 ноя 2007

Vertu,
интересно зачем продолжаешь тестировать против разных движков? Ведь против одной Рыбки будет достаточно?

WildCat · 7 ноя 2007

Vertu пишет:

Мне кажется, что движок, успешно играющий с Рыбкой, будет весьма силен с высокой степенью вероятности.
Нажмите, чтобы раскрыть...

Пока мы имеем движок успешно сливающий Рыбе. И если новая версия будет сливать примерно так же, то это не значит что она не стала лучше. Тестирование и нужно для того, чтобы определить стала ли лучше новая версия. Для этого 500 партий против разных движков более полезны, чем 500 партий только против одной Рыбы.

VP · 7 ноя 2007

У меня контроль повыше 3'+1" с пондерингом. Оболочка-ШреддерКлассик.
Результаты по моему отличаются от 1+1
———————————-
Код:
Rybka 2.3.2a 32-bit - Belka 1.8.7           74.5    -    25.5        74.50%
Rybka 2.3.2a 32-bit - Strelka 1.8 UCI        76.0    -    24.0        76.00%
                                                              
—————————————
Spike 1.2 Turin - Belka 1.8.7                    42.0    -    58.0        42.00%
Spike 1.2 Turin - Strelka 1.8 UCI               44.0    -    56.0        44.00%

thenewone · 7 ноя 2007

Vertu пишет:

Реакция НА д{cenzored}а.
Нажмите, чтобы раскрыть...

Vertu, дорогой,
я так и знал, что с человеком, который не может управиться с е-почтой и самое обычное мыло не может послать, но считает себя экспертом по движкам, лучше не связываться.
Продолжайте тесты. Лучше, конечно, против одной Рыбки, но c'est la vie...

NS · 7 ноя 2007

Согласен с Верту. Если двиг будет конкурировать с Рыбой, то с чего бы это вдруг он станет хуже играть с другими программами? Приведите хотя бы пару примеров схожего толка ибо только голословно все противятся тестированию исключительно против Рыбы.
Нажмите, чтобы раскрыть...

Неголословно:
1. Рыбка на 200 пунктов сильнее Стрелки, сответственно для достижения такой-же достоверности как и в аналогичном матче с движком играющим примерно в такую-же силу как и Стрелка - потребуется больше партий.

Наверно даже этого достаточно...

2. Изменение весов признаков в ОФ с тестированием только на одном сопернике практически гарантированно уменьшает силу игры программы (при этом улучшается результат личном матче именно с этим соперником) - это Вам подтвердит практически любой шахматный программист который такую глупость совершал (тестирование силы на матче с одним соперником)

Использовать такой метод можно только из безысходности - если нескольких соперников нет...

3. Даже в теории - в матричных играх нельзя искать оптимальную стратегию на матчах с одним соперником. Для поиска оптимальной стратегии используются матчи с набором соперников.

4. намного проще найти 50 адекватных начальных позиций и провести гаунлет с 20 соперниками, чем найти 1000 разных адекватных начальных позиций и провести матч с одном соперником.

5. при настройке с тестированием на одном сопернике программа найдет его слабую точку и будет в неё долбить, при этом у других программ этой слабой точки может не быть.

6. При игре с заведомо более сильным соперником лучшая стратегия это "сушить", а это не лучшая стратегия при игре с равными по силе и более слабыми соперниками.

Chemer · 7 ноя 2007

Как оценивать "сухость" позиции?

NS · 7 ноя 2007

Никак не оценивать. Начнешь на Рыбке настраивать Оф - сама научится сушить.
Если с ассиметричной Оф - даешь сопернику бОльшие веса всех "плюсовых" позиционных признаков - и программа начинает "сушить". Даешь сопернику бонус по количеству материала на доске (фигуры соперника ценишь больше своих) - программа начинает стремиться к разменам.

Vertu · 7 ноя 2007

NS, выглядит логично, на на практике, как сказал Иммо, таких случаев не бывало.

NS · 7 ноя 2007

Сколько шахматных программ написал Иммо? Даже у меня бывало. И покажите мне хоть один плюс в проведении тестовых матчей только с одним движком. В данном случае с Рыбкой.
Минусов я вижу кучу, плюса ни одного.

Vertu · 7 ноя 2007

NS, покажете мне хоть один движок, превосходящий одного оппонента, и уступающий при этом остальным, более слабым?

NS · 7 ноя 2007

http://computerchess.org.uk/ccrl/40...print=Details&eng=Toga II 1.3.1#Toga_II_1_3_1
взял первый попавшийся движок. Завышение силы с Фрицем 9 +93 пункта, с CM10th Paralyse +105 пунктов.

http://computerchess.org.uk/ccrl/40...s&eng=Rybka 2.3.2a 32-bit#Rybka_2_3_2a_32-bit

Завышение силы с Шреддером 10 +100 пунктов Эло. Если бы оценивали Рыбку на одном Шреддере - то сила была-бы показана 3117, вместо реальных 3017.

Vertu · 7 ноя 2007

NS пишет:

Завышение силы с Шреддером 10 +100 пунктов Эло. Если бы оценивали Рыбку на одном Шреддере - то сила была-бы показана 3117, вместо реальных 3017.
Нажмите, чтобы раскрыть...

Это не признак того, что Райлих настраивал Рыбку в основном на Шреддере, как я и говорил? И ведь неплохо получилось.

Vertu · 7 ноя 2007

Да Тога там сильней Фрица, но она же не слабее СМ, так какое этот пример имеет отношение к вопросу?
upd. сорри, не туда посмотрел.

NS · 7 ноя 2007

Что неплохо? У него завышении силы на Шреддере +100 пунктов. Если бы он настраивал на тестовой группе - то получил бы просто на 100 пунктов более сильный движок (3117). Вместо завышения на одном движке, на который он своё творение науськивал.

NS · 7 ноя 2007

Да Тога там сильней Фрица, но она же не слабее СМ, так какое этот пример имеет отношение к вопросу?
Нажмите, чтобы раскрыть...

Прямое. Нельзя достоверно оценить силу (и соотвественно прибавку) на матчах с одним движком, так как движки бывают удобные и неудобные по стилю.

Вы не ответили на мой вопрос - хоть одно преимущество от матчей с Рыбкой (вместо тестовой группы) - где оно?

Vertu · 7 ноя 2007

NS пишет:

Что неплохо? У него завышении силы на Шреддере +100 пунктов. Если бы он настраивал на тестовой группе - то получил бы просто на 100 пунктов более сильный движок (3117). Вместо завышения на одном движке, на который он своё творение науськивал.
Нажмите, чтобы раскрыть...

Вот тупой-то этот Райлих! Не знает таких элементарных вещей

Vertu · 7 ноя 2007

NS пишет:

Вы не ответили на мой вопрос - хоть одно преимущество от матчей с Рыбкой (вместо тестовой группы) - где оно?
Нажмите, чтобы раскрыть...

Преимущество - в сосредоточении усилий (программистов и тестеров) на одной точке. Лучше покорить один Эверест, чем 3 Эльбруса.

NS · 7 ноя 2007

Бред. Запустить гаунлет с 20 движками на 50 тестовых позиций проще чем запустить матч на 1000 позиций с Рыбкой. Где взять эту 1000 стартовых позиций?
И я уже писал - для той-же достоверности с Рыбкой придется наиграть больше партий.
И хуже замерим из-за того что движок будет только один.

И главное зачем? Зачем тратить больше времени и играть больше партий для той-же достоверности, и еще рисковать тем что можем выпустить более слабую версию будучи уверенным что она сильнее, да еще вдобавок и не будет возможности узнать сколько именно прибавки мы получили (не говоря о том что возможно прибавки совсем нет)

Vertu · 7 ноя 2007

Повторяю: Райлих сконцентировался на борьбе с тогдашним N1 Шреддером - получил сильнейший в мире движок.

NS · 7 ноя 2007

Дело наверно не в том на борьбе с кем он сконцентрировался.

Войти или зарегистрироваться

Белка

NS Нефёдов Сергей баннер

Vertu Старожил

Vertu Старожил

NS Нефёдов Сергей баннер

Vertu Старожил

Goranflo баннер

Vertu Старожил

Goranflo баннер

Vertu Старожил

Goranflo баннер

Vertu Старожил

thenewone Евгений Манев

Vertu Старожил

immortal223 Вячеслав

Vertu Старожил

thenewone Евгений Манев

WildCat Коршунов Игорь Команда форума

VP Учаcтник

thenewone Евгений Манев

NS Нефёдов Сергей баннер

Chemer Максим

NS Нефёдов Сергей баннер

Vertu Старожил

NS Нефёдов Сергей баннер

Vertu Старожил

NS Нефёдов Сергей баннер

Vertu Старожил

Vertu Старожил

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

Vertu Старожил

Vertu Старожил

NS Нефёдов Сергей баннер

Vertu Старожил

NS Нефёдов Сергей баннер