Белка

Тема в разделе "Машинное отделение", создана пользователем WildCat, 3 ноя 2007.

  1. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    И в чем сомнения? :)
  2. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Я имею ввиду, что в плане борьбы с Рыбой более полезны будут 500 партий с ней.
  3. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Рыба вроде бы создавалась как "антишреддер", я упоминал об этом.
  4. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    В плане борьбы с Рыбой, в построении антиРыбного движка - конечно более полезны партии с ней. Но цель то наверно другая - сделать сильный движок.
  5. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Мне кажется, что движок, успешно играющий с Рыбкой, будет весьма силен с высокой степенью вероятности.
  6. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Но возможно более уязвим против других лидирующих движков. с высокой степенью вероятности!
  7. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    С какой стати?
  8. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    "Специалист подобен флюсу: полнота его одностороння." ©
  9. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Шахматист (или программа), обыгрывающий в матче чемпиона мира, с большей вероятностью будет

    а) побеждать и остальных шахматистов (программы)
    б) проигрывать другим шахматистам (программам)

    Я говорю (а). Вы говорите (б).
    Логическую цепочку не объясните?
  10. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Шахматист - да, возможно, но не факт; программа - вовсе не обязательно!
    Даже у шахматистов есть понятие "удобного/неудобного" противника, а уж у железяк и подавно...
  11. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    А вы понимаете разницу между понятиями "обязательно" и "наиболее вероятно"? Победы над Рыбкой будут снижать вероятность победы над остальными или повышать ее?
  12. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    Vertu,
    достали
    даже не смешно читать
    спецьялист
  13. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    thenewone, тебя забыли спросить, при альтернативно одарённый
  14. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    Согласен с Верту. Если двиг будет конкурировать с Рыбой, то с чего бы это вдруг он станет хуже играть с другими программами? Приведите хотя бы пару примеров схожего толка ибо только голословно все противятся тестированию исключительно против Рыбы.
  15. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Закончил матч с Loop. Результаты такие же.

    Rybka 2.3.2a 32-bit - Strelka 1.8 UCI 65.5 - 34.5 +48/-17/=35 65.50%
    Rybka 2.3.2a 32-bit - Belka 1.8.7 62.5 - 37.5 +43/-18/=39 62.50%

    Shredder 11 UCI - Strelka 1.8 UCI 60.5 - 39.5 +49/-28/=23 60.50%
    Shredder 11 UCI - Belka 1.8.7 47.0 - 53.0 +30/-36/=34 47.00%

    Naum 2.2 - Strelka 1.8 UCI 47.5 - 52.5 +33/-38/=29 47.50%
    Naum 2.2 - Belka 1.8.7 37.0 - 63.0 +17/-43/=40 37.00%

    Loop 13.6 - Strelka 1.8 UCI 52.5 - 47.5 +38/-33/=29 52.50%
    Loop 13.6 - Belka 1.8.7 43.0 - 57.0 +26/-40/=34 43.00%

    Партии - http://slil.ru/25069797

    Видимо, белкины нововведения оказались удачными. 800 партий с 4 разными движками показали рост результатов на 3 - 13.5%.

    На этом Белку тестировать заканчиваю, с ней более-менее всё ясно. Запускаю тест 6 новых бета-версий Стрелки от Юрия Осипова. Это займет минимум несколько дней даже с контролем 1+1.
  16. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    Vertu,
    интересно зачем продолжаешь тестировать против разных движков? Ведь против одной Рыбки будет достаточно?
  17. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Пока мы имеем движок успешно сливающий Рыбе. И если новая версия будет сливать примерно так же, то это не значит что она не стала лучше. Тестирование и нужно для того, чтобы определить стала ли лучше новая версия. Для этого 500 партий против разных движков более полезны, чем 500 партий только против одной Рыбы.
  18. VP Учаcтник

    • Участник
    Рег.:
    06.05.2007
    Сообщения:
    181
    Симпатии:
    0
    Репутация:
    0
    Адрес:
    Красноярск
    Оффлайн
    У меня контроль повыше 3'+1" с пондерингом. Оболочка-ШреддерКлассик.
    Результаты по моему отличаются от 1+1
    ———————————-
    Код:
    Rybka 2.3.2a 32-bit - Belka 1.8.7           74.5    -    25.5        74.50%
    Rybka 2.3.2a 32-bit - Strelka 1.8 UCI        76.0    -    24.0        76.00%
                                                                  
    —————————————
    Spike 1.2 Turin - Belka 1.8.7                    42.0    -    58.0        42.00%
    Spike 1.2 Turin - Strelka 1.8 UCI               44.0    -    56.0        44.00%
  19. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    Vertu, дорогой,
    я так и знал, что с человеком, который не может управиться с е-почтой и самое обычное мыло не может послать, но считает себя экспертом по движкам, лучше не связываться.
    Продолжайте тесты. Лучше, конечно, против одной Рыбки, но c'est la vie...
  20. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Неголословно:
    1. Рыбка на 200 пунктов сильнее Стрелки, сответственно для достижения такой-же достоверности как и в аналогичном матче с движком играющим примерно в такую-же силу как и Стрелка - потребуется больше партий.

    Наверно даже этого достаточно...

    2. Изменение весов признаков в ОФ с тестированием только на одном сопернике практически гарантированно уменьшает силу игры программы (при этом улучшается результат личном матче именно с этим соперником) - это Вам подтвердит практически любой шахматный программист который такую глупость совершал (тестирование силы на матче с одним соперником)

    Использовать такой метод можно только из безысходности - если нескольких соперников нет...

    3. Даже в теории - в матричных играх нельзя искать оптимальную стратегию на матчах с одним соперником. Для поиска оптимальной стратегии используются матчи с набором соперников.

    4. намного проще найти 50 адекватных начальных позиций и провести гаунлет с 20 соперниками, чем найти 1000 разных адекватных начальных позиций и провести матч с одном соперником.

    5. при настройке с тестированием на одном сопернике программа найдет его слабую точку и будет в неё долбить, при этом у других программ этой слабой точки может не быть.

    6. При игре с заведомо более сильным соперником лучшая стратегия это "сушить", а это не лучшая стратегия при игре с равными по силе и более слабыми соперниками.
  21. Chemer Максим

    • Участник
    Рег.:
    14.09.2006
    Сообщения:
    1.674
    Симпатии:
    13
    Репутация:
    0
    Адрес:
    Запорожье
    Оффлайн
    Как оценивать "сухость" позиции?
  22. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Никак не оценивать. Начнешь на Рыбке настраивать Оф - сама научится сушить.
    Если с ассиметричной Оф - даешь сопернику бОльшие веса всех "плюсовых" позиционных признаков - и программа начинает "сушить". Даешь сопернику бонус по количеству материала на доске (фигуры соперника ценишь больше своих) - программа начинает стремиться к разменам.
  23. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    NS, выглядит логично, на на практике, как сказал Иммо, таких случаев не бывало.
  24. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Сколько шахматных программ написал Иммо? Даже у меня бывало. И покажите мне хоть один плюс в проведении тестовых матчей только с одним движком. В данном случае с Рыбкой.
    Минусов я вижу кучу, плюса ни одного.
  25. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    NS, покажете мне хоть один движок, превосходящий одного оппонента, и уступающий при этом остальным, более слабым?
  26. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    http://computerchess.org.uk/ccrl/40...print=Details&eng=Toga II 1.3.1#Toga_II_1_3_1
    взял первый попавшийся движок. Завышение силы с Фрицем 9 +93 пункта, с CM10th Paralyse +105 пунктов.

    http://computerchess.org.uk/ccrl/40...s&eng=Rybka 2.3.2a 32-bit#Rybka_2_3_2a_32-bit

    Завышение силы с Шреддером 10 +100 пунктов Эло. Если бы оценивали Рыбку на одном Шреддере - то сила была-бы показана 3117, вместо реальных 3017.
  27. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Это не признак того, что Райлих настраивал Рыбку в основном на Шреддере, как я и говорил? И ведь неплохо получилось.
  28. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Да Тога там сильней Фрица, но она же не слабее СМ, так какое этот пример имеет отношение к вопросу?
    upd. сорри, не туда посмотрел.
  29. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Что неплохо? У него завышении силы на Шреддере +100 пунктов. Если бы он настраивал на тестовой группе - то получил бы просто на 100 пунктов более сильный движок (3117). Вместо завышения на одном движке, на который он своё творение науськивал.
  30. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Прямое. Нельзя достоверно оценить силу (и соотвественно прибавку) на матчах с одним движком, так как движки бывают удобные и неудобные по стилю.

    Вы не ответили на мой вопрос - хоть одно преимущество от матчей с Рыбкой (вместо тестовой группы) - где оно?
  31. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Вот тупой-то этот Райлих! :) Не знает таких элементарных вещей :lol:
  32. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Преимущество - в сосредоточении усилий (программистов и тестеров) на одной точке. Лучше покорить один Эверест, чем 3 Эльбруса.
  33. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Бред. Запустить гаунлет с 20 движками на 50 тестовых позиций проще чем запустить матч на 1000 позиций с Рыбкой. Где взять эту 1000 стартовых позиций?
    И я уже писал - для той-же достоверности с Рыбкой придется наиграть больше партий.
    И хуже замерим из-за того что движок будет только один.

    И главное зачем? Зачем тратить больше времени и играть больше партий для той-же достоверности, и еще рисковать тем что можем выпустить более слабую версию будучи уверенным что она сильнее, да еще вдобавок и не будет возможности узнать сколько именно прибавки мы получили (не говоря о том что возможно прибавки совсем нет)
  34. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Повторяю: Райлих сконцентировался на борьбе с тогдашним N1 Шреддером - получил сильнейший в мире движок.
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Дело наверно не в том на борьбе с кем он сконцентрировался.

Поделиться этой страницей