Белка

Discussion in 'Машинное отделение' started by WildCat, 3 Nov 2007.

  1. Vertu Старожил

    • Участник
    • Старожил
    Member Since:
    22.12.2006
    Message Count:
    972
    Likes Received:
    44
    Репутация:
    4
    Оффлайн
    Ясное дело, что не только в этом. Но думаю, что его методика тестирования играла не последнюю роль.
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    И откуда тебе известна его методика тестироваия?
  3. Vertu Старожил

    • Участник
    • Старожил
    Member Since:
    22.12.2006
    Message Count:
    972
    Likes Received:
    44
    Репутация:
    4
    Оффлайн
    Методика неизвестна, но то, что спарринги он гонял в основном со Шреддером, писал сам Райлих. Настройку Рыбки "под Шреддера" подтверждает и их личный счет, ты сам о нём писал:

  4. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Я устал от этого разговора.
    ИМХО Vertu, вы просто "гоните пургу"
    Я ветку засорять прекращаю...
  5. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    Я просто угораю...
    Раньше я думал, что абсолютно все знают точно, как надо делать две вещи - воспитывать детей и тренировать футбольную команду.
    Оказывается я был неправ - все и каждый умеют писать и тестировать шахматные движки!
    И при этом проявляют просто удивительную осведомленность в технологии процесса. Словно все время за спиной у Райлиха стояли...
    :lol:
  6. Renegat23 Заслуженный

    • Заслуженный
    Member Since:
    08.02.2007
    Message Count:
    1.823
    Likes Received:
    3
    Репутация:
    0
    Оффлайн
    Да, Goranflo. И лучше всех это умеет, по всей видимости, некий Vertu.
    :lol:
  7. Vertu Старожил

    • Участник
    • Старожил
    Member Since:
    22.12.2006
    Message Count:
    972
    Likes Received:
    44
    Репутация:
    4
    Оффлайн
    Н-да, вот это, видимо, называется возражениями по существу... Вы бы хоть сами тесты какие-нибудь сделали, вместо того чтобы словесный мусор сюда постить.

    NS сам пишет, что Райлих на Шреддер "своё творение науськивал" (и Райлих это писал - посмотрите архивы ТокЧесс). А когда я говорю о том же самом - это называется "гнать пургу". Вобщем, с NS давно всё понятно, этот будет спорить до упора независимо ни от чего, даже от собственных слов.
  8. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Хватит уже чушь молоть. Васик науськивал свою программу на Шреддера когда и так уже стал сильнейшим (или почти сильнейшим) в мире. Просто нашел себе развлчение.

    Будет Стрелка вторая по силе в мире, тогда можно начинать прицеливаться на Рыбку. А сейчас-то какой смысл?
  9. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Наскольно я помню, Васик говорил только о том, что тесты против Шреддера были приоритетными. Из этого не выходит, что других тестов против других программ не было!

    Вообще на личности не стоит переходить. Просто вы друг друга не поняли.
    Никто, ведь, не будет спорить, что, победив Рыбку (более 100ело сильнее, чем любая другая программа) в матче из 500 партий, Стрелка почти наверняка будет сильнейшей прогой. Это и утверждает Vertu и я с этим полностью согласен.
    Но и NS не менее прав, утвереждая, что тестировать прогу только против одной Рыбки неправильно, ибо мы будем получать недостоверные результаты усиления программы, все доказательства коему NS привел . Я лично с этим также согласен.
  10. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    СЗОТ:
    "-И ты прав, и ты прав!
    -Ребе, но так же не бывает!
    - И ты прав!"
    ©
    :lol:
  11. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Goranflo, тоже юмор.
  12. immortal223 Вячеслав

    • Участник
    Member Since:
    22.02.2006
    Message Count:
    2.412
    Likes Received:
    15
    Репутация:
    0
    Оффлайн
  13. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Результаты:

    Belka 1.8.7, Blitz:1'+1"

    Belka 1.8.7 - Loop 13.6 59.0 - 41.0 +44/-26/=30 59.00%
    Belka 1.8.7 - Ktulu 8.0 64.5 - 35.5 +51/-22/=27 64.50%
    Belka 1.8.7 - Spike 1.2 Turin 67.5 - 32.5 +54/-19/=27 67.50%
    Belka 1.8.7 - Zappa Mexico 67.5 - 32.5 +53/-18/=29 67.50%
    Belka 1.8.7 - Shredder 11 UCI 49.0 - 51.0 +36/-38/=26 49.00%

    Belka 1.8.7 - 307.5/500

    Strelka 1.8, Blitz:1'+1"

    Strelka 1.8 UCI - Spike 1.2 Turin 64.0 - 36.0 +49/-21/=30 64.00%
    Strelka 1.8 UCI - Ktulu 8.0 73.5 - 26.5 +63/-16/=21 73.50%
    Strelka 1.8 UCI - Loop 13.6 53.5 - 46.5 +35/-28/=37 53.50%
    Strelka 1.8 UCI - Zappa Mexico 69.0 - 31.0 +53/-15/=32 69.00%
    Strelka 1.8 UCI - Shredder 11 UCI 37.5 - 62.5 +24/-49/=27 37.50%

    Strelka 1.8 UCI - 297.5/500
  14. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Общий рейтинг по Spike=2700:

    1 Shredder 11 UCI 2858
    2 Belka 1.8.7 2818
    3 Strelka 1.8 UCI 2804
    4 Loop 13.6 2768
    5 Spike 1.2 Turin 2700
    6 Zappa Mexico 2680
    7 Ktulu 8.0 2674
  15. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Просьба ко всем тестерам переименовать движки так, как они называются в первом посте.
  16. immortal223 Вячеслав

    • Участник
    Member Since:
    22.02.2006
    Message Count:
    2.412
    Likes Received:
    15
    Репутация:
    0
    Оффлайн
    А это шо за зверь? :)
  17. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Shredder 11 UCI с буквой "I" в названии. :)
  18. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Пока имеем такие результаты.
    Общий прирост в силе после 1900 партий каждой версии: +41.
    Отдельно по каждому тестеру:
    VP: +42 (по 1000 партий)
    Fruit: +17 (по 500 партий)
    Vertu: +78 (по 400 партий)

    Теперь нужно порешать возникшие проблемы.
    VP предлагаю перейти на режим ponder-off, т.к. есть проблемы с просрочками времени.

    Vertu и Fruit разделите нормально движки между собой.
    Получилось так, что Shredder 11, Loop 13.6 есть у обоих, а Hiarcs 11.1, Fruit 2.3, Glaurung 1.2.1 никто из вас не взял.
  19. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Если взять только партии против Рыбки, то прирост состовляет +14 пунктов (300 партий). Т.е. другие движки лучше помогают заметить усиление.
  20. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    А почему +17? У меня вроде получилось +14.
    Я возьму Fruit 2.3:)
    Кстати, Юрий Осипов, когда прислал свои 6 версий Стрелки, написал: Мне интересно, как эти модификации меняют игру именно в сравнении с версией 1.8. Поэтому, лучше всего стравливать каждую из этих версий только с версией 1.8.
    Поэтому я сейчас запустил матч Strelka 1.8 UCI - Strelka 2.0
    Пока так:

    1 Strelka 1.8 UCI +9/-5/=12 57.69 15.0/26
    2 Strelka 2.0 +5/-9/=12 42.31 11.0/26
  21. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Потому, что у меня пункты Сонаса. Они отличаются от Эло незначительно.
    Стравливать с предыдущими версиями можно только в самых крайних случаях (когда больше не с кем). Я окончательно бросил этим заниматься, т.к. накопилось слишком много печального опыта.
  22. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    В том-то и дело, что Юрий попросил именно это. Стравить с предыдущей версией.
  23. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    Аналогично...
    Code:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.0      +30/-29/=41 50.50   50.5/100
    2   Strelka 1.8 UCI  +29/-30/=41 49.50   49.5/100
    Code:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.1      +25/-24/=51 50.50   50.5/100
    2   Strelka 1.8 UCI  +24/-25/=51 49.50   49.5/100
    Семпрон 3000+, разогнан до 2100, ОЗУ 2 Гб, кэш 128,
    книги отключены, подрублен файл 50.pgn

    Тестирую дальше...
  24. Renegat23 Заслуженный

    • Заслуженный
    Member Since:
    08.02.2007
    Message Count:
    1.823
    Likes Received:
    3
    Репутация:
    0
    Оффлайн
    А где вы взяли Strelka 2.1 ?
  25. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    Конечно у автора, что за вопрос....
  26. Vertu Старожил

    • Участник
    • Старожил
    Member Since:
    22.12.2006
    Message Count:
    972
    Likes Received:
    44
    Репутация:
    4
    Оффлайн
    Я сыграл и выложил 800 партий, а не 400. Ты ничего не пропустил?
  27. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Каждая по 400. Если вместе, то 800.
  28. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Продолжение
    1 Strelka 2.0 +26/-25/=61 50.45 56.5/112
    2 Strelka 1.8 UCI +25/-26/=61 49.55 55.5/112
  29. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Похоже, разница в силе между Стрелками 2.х и Стрелкой 1.8 совсем небольшая и нужно больше партий с различными соперниками, чтобы узнать рейтинговое её выражение.
  30. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    То же продолжение:

    Code:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.2      +24/-22/=54 51.00   51.0/100
    2   Strelka 1.8 UCI  +22/-24/=54 49.00   49.0/100
  31. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    Насколько я понял, проверяются корректирующие настройки...
  32. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Тогда на 100 партиях никак не проверить. Постраюсь сыграть 500 партий версией 2.0
  33. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Кстати, какая-то из 6 версий почти Belka. Надо узнать какая и исключить её из тестирования - и так, понятно, что она сильнее 1.8
  34. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    27.956
    Likes Received:
    30.205
    Репутация:
    674
    Оффлайн
    Мне интересно повторить те же матчи на с конролем 2+1, 3+1,5+1.
    и сравнить с минутками...
  35. Осипов Юрий Учаcтник

    • Участник
    Member Since:
    18.06.2007
    Message Count:
    399
    Likes Received:
    475
    Репутация:
    11
    Location:
    Правда
    Оффлайн
    Белка - это Стрелка 2.5. Можно ее не тестировать, если нет охоты.

    В других версиях изменения могут быть такими небольшими, что на небольшом числе партий они будут незаметны. Например, в Стрелке 2.0 исправлена функция see_move - она стала более правильной (что должно быть в плюс), но немного более медленной (что идет в минус). Психологически хочется оставить правильный вариант этой функции, но нужно проверить - что перевешивает - плюсы или минусы.

Share This Page