Белка

Тема в разделе "Машинное отделение", создана пользователем WildCat, 3 ноя 2007.

  1. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    И в чем сомнения? :)
     
  2. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Я имею ввиду, что в плане борьбы с Рыбой более полезны будут 500 партий с ней.
     
  3. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Рыба вроде бы создавалась как "антишреддер", я упоминал об этом.
     
  4. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    В плане борьбы с Рыбой, в построении антиРыбного движка - конечно более полезны партии с ней. Но цель то наверно другая - сделать сильный движок.
     
  5. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Мне кажется, что движок, успешно играющий с Рыбкой, будет весьма силен с высокой степенью вероятности.
     
  6. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Но возможно более уязвим против других лидирующих движков. с высокой степенью вероятности!
     
  7. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    С какой стати?
     
  8. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    "Специалист подобен флюсу: полнота его одностороння." ©
     
  9. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Шахматист (или программа), обыгрывающий в матче чемпиона мира, с большей вероятностью будет

    а) побеждать и остальных шахматистов (программы)
    б) проигрывать другим шахматистам (программам)

    Я говорю (а). Вы говорите (б).
    Логическую цепочку не объясните?
     
  10. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Шахматист - да, возможно, но не факт; программа - вовсе не обязательно!
    Даже у шахматистов есть понятие "удобного/неудобного" противника, а уж у железяк и подавно...
     
  11. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    А вы понимаете разницу между понятиями "обязательно" и "наиболее вероятно"? Победы над Рыбкой будут снижать вероятность победы над остальными или повышать ее?
     
  12. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Vertu,
    достали
    даже не смешно читать
    спецьялист
     
  13. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    thenewone, тебя забыли спросить, при альтернативно одарённый
     
  14. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Согласен с Верту. Если двиг будет конкурировать с Рыбой, то с чего бы это вдруг он станет хуже играть с другими программами? Приведите хотя бы пару примеров схожего толка ибо только голословно все противятся тестированию исключительно против Рыбы.
     
  15. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Закончил матч с Loop. Результаты такие же.

    Rybka 2.3.2a 32-bit - Strelka 1.8 UCI 65.5 - 34.5 +48/-17/=35 65.50%
    Rybka 2.3.2a 32-bit - Belka 1.8.7 62.5 - 37.5 +43/-18/=39 62.50%

    Shredder 11 UCI - Strelka 1.8 UCI 60.5 - 39.5 +49/-28/=23 60.50%
    Shredder 11 UCI - Belka 1.8.7 47.0 - 53.0 +30/-36/=34 47.00%

    Naum 2.2 - Strelka 1.8 UCI 47.5 - 52.5 +33/-38/=29 47.50%
    Naum 2.2 - Belka 1.8.7 37.0 - 63.0 +17/-43/=40 37.00%

    Loop 13.6 - Strelka 1.8 UCI 52.5 - 47.5 +38/-33/=29 52.50%
    Loop 13.6 - Belka 1.8.7 43.0 - 57.0 +26/-40/=34 43.00%

    Партии - http://slil.ru/25069797

    Видимо, белкины нововведения оказались удачными. 800 партий с 4 разными движками показали рост результатов на 3 - 13.5%.

    На этом Белку тестировать заканчиваю, с ней более-менее всё ясно. Запускаю тест 6 новых бета-версий Стрелки от Юрия Осипова. Это займет минимум несколько дней даже с контролем 1+1.
     
  16. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Vertu,
    интересно зачем продолжаешь тестировать против разных движков? Ведь против одной Рыбки будет достаточно?
     
  17. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Пока мы имеем движок успешно сливающий Рыбе. И если новая версия будет сливать примерно так же, то это не значит что она не стала лучше. Тестирование и нужно для того, чтобы определить стала ли лучше новая версия. Для этого 500 партий против разных движков более полезны, чем 500 партий только против одной Рыбы.
     
  18. VP
    Оффлайн

    VP Учаcтник

    Репутация:
    0
    У меня контроль повыше 3'+1" с пондерингом. Оболочка-ШреддерКлассик.
    Результаты по моему отличаются от 1+1
    ———————————-
    Код:
    Rybka 2.3.2a 32-bit - Belka 1.8.7           74.5    -    25.5        74.50%
    Rybka 2.3.2a 32-bit - Strelka 1.8 UCI        76.0    -    24.0        76.00%
                                                                  
    —————————————
    Spike 1.2 Turin - Belka 1.8.7                    42.0    -    58.0        42.00%
    Spike 1.2 Turin - Strelka 1.8 UCI               44.0    -    56.0        44.00%
     
  19. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Vertu, дорогой,
    я так и знал, что с человеком, который не может управиться с е-почтой и самое обычное мыло не может послать, но считает себя экспертом по движкам, лучше не связываться.
    Продолжайте тесты. Лучше, конечно, против одной Рыбки, но c'est la vie...
     
  20. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Неголословно:
    1. Рыбка на 200 пунктов сильнее Стрелки, сответственно для достижения такой-же достоверности как и в аналогичном матче с движком играющим примерно в такую-же силу как и Стрелка - потребуется больше партий.

    Наверно даже этого достаточно...

    2. Изменение весов признаков в ОФ с тестированием только на одном сопернике практически гарантированно уменьшает силу игры программы (при этом улучшается результат личном матче именно с этим соперником) - это Вам подтвердит практически любой шахматный программист который такую глупость совершал (тестирование силы на матче с одним соперником)

    Использовать такой метод можно только из безысходности - если нескольких соперников нет...

    3. Даже в теории - в матричных играх нельзя искать оптимальную стратегию на матчах с одним соперником. Для поиска оптимальной стратегии используются матчи с набором соперников.

    4. намного проще найти 50 адекватных начальных позиций и провести гаунлет с 20 соперниками, чем найти 1000 разных адекватных начальных позиций и провести матч с одном соперником.

    5. при настройке с тестированием на одном сопернике программа найдет его слабую точку и будет в неё долбить, при этом у других программ этой слабой точки может не быть.

    6. При игре с заведомо более сильным соперником лучшая стратегия это "сушить", а это не лучшая стратегия при игре с равными по силе и более слабыми соперниками.
     
  21. Chemer
    Оффлайн

    Chemer Максим

    Репутация:
    0
    Как оценивать "сухость" позиции?
     
  22. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Никак не оценивать. Начнешь на Рыбке настраивать Оф - сама научится сушить.
    Если с ассиметричной Оф - даешь сопернику бОльшие веса всех "плюсовых" позиционных признаков - и программа начинает "сушить". Даешь сопернику бонус по количеству материала на доске (фигуры соперника ценишь больше своих) - программа начинает стремиться к разменам.
     
  23. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    NS, выглядит логично, на на практике, как сказал Иммо, таких случаев не бывало.
     
  24. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Сколько шахматных программ написал Иммо? Даже у меня бывало. И покажите мне хоть один плюс в проведении тестовых матчей только с одним движком. В данном случае с Рыбкой.
    Минусов я вижу кучу, плюса ни одного.
     
  25. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    NS, покажете мне хоть один движок, превосходящий одного оппонента, и уступающий при этом остальным, более слабым?
     
  26. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    http://computerchess.org.uk/ccrl/40...print=Details&eng=Toga II 1.3.1#Toga_II_1_3_1
    взял первый попавшийся движок. Завышение силы с Фрицем 9 +93 пункта, с CM10th Paralyse +105 пунктов.

    http://computerchess.org.uk/ccrl/40...s&eng=Rybka 2.3.2a 32-bit#Rybka_2_3_2a_32-bit

    Завышение силы с Шреддером 10 +100 пунктов Эло. Если бы оценивали Рыбку на одном Шреддере - то сила была-бы показана 3117, вместо реальных 3017.
     
  27. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Это не признак того, что Райлих настраивал Рыбку в основном на Шреддере, как я и говорил? И ведь неплохо получилось.
     
  28. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Да Тога там сильней Фрица, но она же не слабее СМ, так какое этот пример имеет отношение к вопросу?
    upd. сорри, не туда посмотрел.
     
  29. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Что неплохо? У него завышении силы на Шреддере +100 пунктов. Если бы он настраивал на тестовой группе - то получил бы просто на 100 пунктов более сильный движок (3117). Вместо завышения на одном движке, на который он своё творение науськивал.
     
  30. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Прямое. Нельзя достоверно оценить силу (и соотвественно прибавку) на матчах с одним движком, так как движки бывают удобные и неудобные по стилю.

    Вы не ответили на мой вопрос - хоть одно преимущество от матчей с Рыбкой (вместо тестовой группы) - где оно?
     
  31. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Вот тупой-то этот Райлих! :) Не знает таких элементарных вещей :lol:
     
  32. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Преимущество - в сосредоточении усилий (программистов и тестеров) на одной точке. Лучше покорить один Эверест, чем 3 Эльбруса.
     
  33. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Бред. Запустить гаунлет с 20 движками на 50 тестовых позиций проще чем запустить матч на 1000 позиций с Рыбкой. Где взять эту 1000 стартовых позиций?
    И я уже писал - для той-же достоверности с Рыбкой придется наиграть больше партий.
    И хуже замерим из-за того что движок будет только один.

    И главное зачем? Зачем тратить больше времени и играть больше партий для той-же достоверности, и еще рисковать тем что можем выпустить более слабую версию будучи уверенным что она сильнее, да еще вдобавок и не будет возможности узнать сколько именно прибавки мы получили (не говоря о том что возможно прибавки совсем нет)
     
  34. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Повторяю: Райлих сконцентировался на борьбе с тогдашним N1 Шреддером - получил сильнейший в мире движок.
     
  35. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Дело наверно не в том на борьбе с кем он сконцентрировался.