Белка

Тема в разделе "Машинное отделение", создана пользователем WildCat, 3 ноя 2007.

  1. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Ясное дело, что не только в этом. Но думаю, что его методика тестирования играла не последнюю роль.
     
  2. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    И откуда тебе известна его методика тестироваия?
     
  3. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Методика неизвестна, но то, что спарринги он гонял в основном со Шреддером, писал сам Райлих. Настройку Рыбки "под Шреддера" подтверждает и их личный счет, ты сам о нём писал:

     
  4. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я устал от этого разговора.
    ИМХО Vertu, вы просто "гоните пургу"
    Я ветку засорять прекращаю...
     
  5. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Я просто угораю...
    Раньше я думал, что абсолютно все знают точно, как надо делать две вещи - воспитывать детей и тренировать футбольную команду.
    Оказывается я был неправ - все и каждый умеют писать и тестировать шахматные движки!
    И при этом проявляют просто удивительную осведомленность в технологии процесса. Словно все время за спиной у Райлиха стояли...
    :lol:
     
  6. Renegat23
    Оффлайн

    Renegat23 баннер

    Репутация:
    0
    Да, Goranflo. И лучше всех это умеет, по всей видимости, некий Vertu.
    :lol:
     
  7. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Н-да, вот это, видимо, называется возражениями по существу... Вы бы хоть сами тесты какие-нибудь сделали, вместо того чтобы словесный мусор сюда постить.

    NS сам пишет, что Райлих на Шреддер "своё творение науськивал" (и Райлих это писал - посмотрите архивы ТокЧесс). А когда я говорю о том же самом - это называется "гнать пургу". Вобщем, с NS давно всё понятно, этот будет спорить до упора независимо ни от чего, даже от собственных слов.
     
  8. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Хватит уже чушь молоть. Васик науськивал свою программу на Шреддера когда и так уже стал сильнейшим (или почти сильнейшим) в мире. Просто нашел себе развлчение.

    Будет Стрелка вторая по силе в мире, тогда можно начинать прицеливаться на Рыбку. А сейчас-то какой смысл?
     
  9. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Наскольно я помню, Васик говорил только о том, что тесты против Шреддера были приоритетными. Из этого не выходит, что других тестов против других программ не было!

    Вообще на личности не стоит переходить. Просто вы друг друга не поняли.
    Никто, ведь, не будет спорить, что, победив Рыбку (более 100ело сильнее, чем любая другая программа) в матче из 500 партий, Стрелка почти наверняка будет сильнейшей прогой. Это и утверждает Vertu и я с этим полностью согласен.
    Но и NS не менее прав, утвереждая, что тестировать прогу только против одной Рыбки неправильно, ибо мы будем получать недостоверные результаты усиления программы, все доказательства коему NS привел . Я лично с этим также согласен.
     
  10. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    СЗОТ:
    "-И ты прав, и ты прав!
    -Ребе, но так же не бывает!
    - И ты прав!"
    ©
    :lol:
     
  11. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Goranflo, тоже юмор.
     
  12. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
     
  13. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Результаты:

    Belka 1.8.7, Blitz:1'+1"

    Belka 1.8.7 - Loop 13.6 59.0 - 41.0 +44/-26/=30 59.00%
    Belka 1.8.7 - Ktulu 8.0 64.5 - 35.5 +51/-22/=27 64.50%
    Belka 1.8.7 - Spike 1.2 Turin 67.5 - 32.5 +54/-19/=27 67.50%
    Belka 1.8.7 - Zappa Mexico 67.5 - 32.5 +53/-18/=29 67.50%
    Belka 1.8.7 - Shredder 11 UCI 49.0 - 51.0 +36/-38/=26 49.00%

    Belka 1.8.7 - 307.5/500

    Strelka 1.8, Blitz:1'+1"

    Strelka 1.8 UCI - Spike 1.2 Turin 64.0 - 36.0 +49/-21/=30 64.00%
    Strelka 1.8 UCI - Ktulu 8.0 73.5 - 26.5 +63/-16/=21 73.50%
    Strelka 1.8 UCI - Loop 13.6 53.5 - 46.5 +35/-28/=37 53.50%
    Strelka 1.8 UCI - Zappa Mexico 69.0 - 31.0 +53/-15/=32 69.00%
    Strelka 1.8 UCI - Shredder 11 UCI 37.5 - 62.5 +24/-49/=27 37.50%

    Strelka 1.8 UCI - 297.5/500
     
  14. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Общий рейтинг по Spike=2700:

    1 Shredder 11 UCI 2858
    2 Belka 1.8.7 2818
    3 Strelka 1.8 UCI 2804
    4 Loop 13.6 2768
    5 Spike 1.2 Turin 2700
    6 Zappa Mexico 2680
    7 Ktulu 8.0 2674
     
  15. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Просьба ко всем тестерам переименовать движки так, как они называются в первом посте.
     
  16. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    А это шо за зверь? :)
     
  17. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Shredder 11 UCI с буквой "I" в названии. :)
     
  18. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Пока имеем такие результаты.
    Общий прирост в силе после 1900 партий каждой версии: +41.
    Отдельно по каждому тестеру:
    VP: +42 (по 1000 партий)
    Fruit: +17 (по 500 партий)
    Vertu: +78 (по 400 партий)

    Теперь нужно порешать возникшие проблемы.
    VP предлагаю перейти на режим ponder-off, т.к. есть проблемы с просрочками времени.

    Vertu и Fruit разделите нормально движки между собой.
    Получилось так, что Shredder 11, Loop 13.6 есть у обоих, а Hiarcs 11.1, Fruit 2.3, Glaurung 1.2.1 никто из вас не взял.
     
  19. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Если взять только партии против Рыбки, то прирост состовляет +14 пунктов (300 партий). Т.е. другие движки лучше помогают заметить усиление.
     
  20. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    А почему +17? У меня вроде получилось +14.
    Я возьму Fruit 2.3:)
    Кстати, Юрий Осипов, когда прислал свои 6 версий Стрелки, написал: Мне интересно, как эти модификации меняют игру именно в сравнении с версией 1.8. Поэтому, лучше всего стравливать каждую из этих версий только с версией 1.8.
    Поэтому я сейчас запустил матч Strelka 1.8 UCI - Strelka 2.0
    Пока так:

    1 Strelka 1.8 UCI +9/-5/=12 57.69 15.0/26
    2 Strelka 2.0 +5/-9/=12 42.31 11.0/26
     
  21. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Потому, что у меня пункты Сонаса. Они отличаются от Эло незначительно.
    Стравливать с предыдущими версиями можно только в самых крайних случаях (когда больше не с кем). Я окончательно бросил этим заниматься, т.к. накопилось слишком много печального опыта.
     
  22. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    В том-то и дело, что Юрий попросил именно это. Стравить с предыдущей версией.
     
  23. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Аналогично...
    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.0      +30/-29/=41 50.50   50.5/100
    2   Strelka 1.8 UCI  +29/-30/=41 49.50   49.5/100
    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.1      +25/-24/=51 50.50   50.5/100
    2   Strelka 1.8 UCI  +24/-25/=51 49.50   49.5/100
    Семпрон 3000+, разогнан до 2100, ОЗУ 2 Гб, кэш 128,
    книги отключены, подрублен файл 50.pgn

    Тестирую дальше...
     
  24. Renegat23
    Оффлайн

    Renegat23 баннер

    Репутация:
    0
    А где вы взяли Strelka 2.1 ?
     
  25. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Конечно у автора, что за вопрос....
     
  26. Vertu
    Оффлайн

    Vertu Старожил

    Репутация:
    4
    Я сыграл и выложил 800 партий, а не 400. Ты ничего не пропустил?
     
  27. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Каждая по 400. Если вместе, то 800.
     
  28. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Продолжение
    1 Strelka 2.0 +26/-25/=61 50.45 56.5/112
    2 Strelka 1.8 UCI +25/-26/=61 49.55 55.5/112
     
  29. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Похоже, разница в силе между Стрелками 2.х и Стрелкой 1.8 совсем небольшая и нужно больше партий с различными соперниками, чтобы узнать рейтинговое её выражение.
     
  30. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    То же продолжение:

    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.2      +24/-22/=54 51.00   51.0/100
    2   Strelka 1.8 UCI  +22/-24/=54 49.00   49.0/100
     
  31. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Насколько я понял, проверяются корректирующие настройки...
     
  32. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Тогда на 100 партиях никак не проверить. Постраюсь сыграть 500 партий версией 2.0
     
  33. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Кстати, какая-то из 6 версий почти Belka. Надо узнать какая и исключить её из тестирования - и так, понятно, что она сильнее 1.8
     
  34. Goranflo
    Оффлайн

    Goranflo баннер

    Репутация:
    674
    Мне интересно повторить те же матчи на с конролем 2+1, 3+1,5+1.
    и сравнить с минутками...
     
  35. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Белка - это Стрелка 2.5. Можно ее не тестировать, если нет охоты.

    В других версиях изменения могут быть такими небольшими, что на небольшом числе партий они будут незаметны. Например, в Стрелке 2.0 исправлена функция see_move - она стала более правильной (что должно быть в плюс), но немного более медленной (что идет в минус). Психологически хочется оставить правильный вариант этой функции, но нужно проверить - что перевешивает - плюсы или минусы.