Белка

Тема в разделе "Машинное отделение", создана пользователем WildCat, 3 ноя 2007.

  1. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Ясное дело, что не только в этом. Но думаю, что его методика тестирования играла не последнюю роль.
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    И откуда тебе известна его методика тестироваия?
  3. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Методика неизвестна, но то, что спарринги он гонял в основном со Шреддером, писал сам Райлих. Настройку Рыбки "под Шреддера" подтверждает и их личный счет, ты сам о нём писал:

  4. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Я устал от этого разговора.
    ИМХО Vertu, вы просто "гоните пургу"
    Я ветку засорять прекращаю...
  5. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Я просто угораю...
    Раньше я думал, что абсолютно все знают точно, как надо делать две вещи - воспитывать детей и тренировать футбольную команду.
    Оказывается я был неправ - все и каждый умеют писать и тестировать шахматные движки!
    И при этом проявляют просто удивительную осведомленность в технологии процесса. Словно все время за спиной у Райлиха стояли...
    :lol:
  6. Renegat23 Заслуженный

    • Заслуженный
    Рег.:
    08.02.2007
    Сообщения:
    1.823
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Да, Goranflo. И лучше всех это умеет, по всей видимости, некий Vertu.
    :lol:
  7. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Н-да, вот это, видимо, называется возражениями по существу... Вы бы хоть сами тесты какие-нибудь сделали, вместо того чтобы словесный мусор сюда постить.

    NS сам пишет, что Райлих на Шреддер "своё творение науськивал" (и Райлих это писал - посмотрите архивы ТокЧесс). А когда я говорю о том же самом - это называется "гнать пургу". Вобщем, с NS давно всё понятно, этот будет спорить до упора независимо ни от чего, даже от собственных слов.
  8. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Хватит уже чушь молоть. Васик науськивал свою программу на Шреддера когда и так уже стал сильнейшим (или почти сильнейшим) в мире. Просто нашел себе развлчение.

    Будет Стрелка вторая по силе в мире, тогда можно начинать прицеливаться на Рыбку. А сейчас-то какой смысл?
  9. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Наскольно я помню, Васик говорил только о том, что тесты против Шреддера были приоритетными. Из этого не выходит, что других тестов против других программ не было!

    Вообще на личности не стоит переходить. Просто вы друг друга не поняли.
    Никто, ведь, не будет спорить, что, победив Рыбку (более 100ело сильнее, чем любая другая программа) в матче из 500 партий, Стрелка почти наверняка будет сильнейшей прогой. Это и утверждает Vertu и я с этим полностью согласен.
    Но и NS не менее прав, утвереждая, что тестировать прогу только против одной Рыбки неправильно, ибо мы будем получать недостоверные результаты усиления программы, все доказательства коему NS привел . Я лично с этим также согласен.
  10. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    СЗОТ:
    "-И ты прав, и ты прав!
    -Ребе, но так же не бывает!
    - И ты прав!"
    ©
    :lol:
  11. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Goranflo, тоже юмор.
  12. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
  13. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Результаты:

    Belka 1.8.7, Blitz:1'+1"

    Belka 1.8.7 - Loop 13.6 59.0 - 41.0 +44/-26/=30 59.00%
    Belka 1.8.7 - Ktulu 8.0 64.5 - 35.5 +51/-22/=27 64.50%
    Belka 1.8.7 - Spike 1.2 Turin 67.5 - 32.5 +54/-19/=27 67.50%
    Belka 1.8.7 - Zappa Mexico 67.5 - 32.5 +53/-18/=29 67.50%
    Belka 1.8.7 - Shredder 11 UCI 49.0 - 51.0 +36/-38/=26 49.00%

    Belka 1.8.7 - 307.5/500

    Strelka 1.8, Blitz:1'+1"

    Strelka 1.8 UCI - Spike 1.2 Turin 64.0 - 36.0 +49/-21/=30 64.00%
    Strelka 1.8 UCI - Ktulu 8.0 73.5 - 26.5 +63/-16/=21 73.50%
    Strelka 1.8 UCI - Loop 13.6 53.5 - 46.5 +35/-28/=37 53.50%
    Strelka 1.8 UCI - Zappa Mexico 69.0 - 31.0 +53/-15/=32 69.00%
    Strelka 1.8 UCI - Shredder 11 UCI 37.5 - 62.5 +24/-49/=27 37.50%

    Strelka 1.8 UCI - 297.5/500
  14. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Общий рейтинг по Spike=2700:

    1 Shredder 11 UCI 2858
    2 Belka 1.8.7 2818
    3 Strelka 1.8 UCI 2804
    4 Loop 13.6 2768
    5 Spike 1.2 Turin 2700
    6 Zappa Mexico 2680
    7 Ktulu 8.0 2674
  15. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Просьба ко всем тестерам переименовать движки так, как они называются в первом посте.
  16. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    А это шо за зверь? :)
  17. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Shredder 11 UCI с буквой "I" в названии. :)
  18. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Пока имеем такие результаты.
    Общий прирост в силе после 1900 партий каждой версии: +41.
    Отдельно по каждому тестеру:
    VP: +42 (по 1000 партий)
    Fruit: +17 (по 500 партий)
    Vertu: +78 (по 400 партий)

    Теперь нужно порешать возникшие проблемы.
    VP предлагаю перейти на режим ponder-off, т.к. есть проблемы с просрочками времени.

    Vertu и Fruit разделите нормально движки между собой.
    Получилось так, что Shredder 11, Loop 13.6 есть у обоих, а Hiarcs 11.1, Fruit 2.3, Glaurung 1.2.1 никто из вас не взял.
  19. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Если взять только партии против Рыбки, то прирост состовляет +14 пунктов (300 партий). Т.е. другие движки лучше помогают заметить усиление.
  20. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    А почему +17? У меня вроде получилось +14.
    Я возьму Fruit 2.3:)
    Кстати, Юрий Осипов, когда прислал свои 6 версий Стрелки, написал: Мне интересно, как эти модификации меняют игру именно в сравнении с версией 1.8. Поэтому, лучше всего стравливать каждую из этих версий только с версией 1.8.
    Поэтому я сейчас запустил матч Strelka 1.8 UCI - Strelka 2.0
    Пока так:

    1 Strelka 1.8 UCI +9/-5/=12 57.69 15.0/26
    2 Strelka 2.0 +5/-9/=12 42.31 11.0/26
  21. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Потому, что у меня пункты Сонаса. Они отличаются от Эло незначительно.
    Стравливать с предыдущими версиями можно только в самых крайних случаях (когда больше не с кем). Я окончательно бросил этим заниматься, т.к. накопилось слишком много печального опыта.
  22. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    В том-то и дело, что Юрий попросил именно это. Стравить с предыдущей версией.
  23. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Аналогично...
    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.0      +30/-29/=41 50.50   50.5/100
    2   Strelka 1.8 UCI  +29/-30/=41 49.50   49.5/100
    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.1      +25/-24/=51 50.50   50.5/100
    2   Strelka 1.8 UCI  +24/-25/=51 49.50   49.5/100
    Семпрон 3000+, разогнан до 2100, ОЗУ 2 Гб, кэш 128,
    книги отключены, подрублен файл 50.pgn

    Тестирую дальше...
  24. Renegat23 Заслуженный

    • Заслуженный
    Рег.:
    08.02.2007
    Сообщения:
    1.823
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    А где вы взяли Strelka 2.1 ?
  25. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Конечно у автора, что за вопрос....
  26. Vertu Старожил

    • Участник
    • Старожил
    Рег.:
    22.12.2006
    Сообщения:
    972
    Симпатии:
    44
    Репутация:
    4
    Оффлайн
    Я сыграл и выложил 800 партий, а не 400. Ты ничего не пропустил?
  27. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Каждая по 400. Если вместе, то 800.
  28. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Продолжение
    1 Strelka 2.0 +26/-25/=61 50.45 56.5/112
    2 Strelka 1.8 UCI +25/-26/=61 49.55 55.5/112
  29. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Похоже, разница в силе между Стрелками 2.х и Стрелкой 1.8 совсем небольшая и нужно больше партий с различными соперниками, чтобы узнать рейтинговое её выражение.
  30. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    То же продолжение:

    Код:
    1 Минут/Игру + 1 Секунд/Ход  2007
    
                         
    1   Strelka 2.2      +24/-22/=54 51.00   51.0/100
    2   Strelka 1.8 UCI  +22/-24/=54 49.00   49.0/100
  31. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Насколько я понял, проверяются корректирующие настройки...
  32. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Тогда на 100 партиях никак не проверить. Постраюсь сыграть 500 партий версией 2.0
  33. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Кстати, какая-то из 6 версий почти Belka. Надо узнать какая и исключить её из тестирования - и так, понятно, что она сильнее 1.8
  34. Goranflo Заслуженный

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    27.951
    Симпатии:
    30.204
    Репутация:
    674
    Оффлайн
    Мне интересно повторить те же матчи на с конролем 2+1, 3+1,5+1.
    и сравнить с минутками...
  35. Осипов Юрий Учаcтник

    • Участник
    Рег.:
    18.06.2007
    Сообщения:
    399
    Симпатии:
    475
    Репутация:
    11
    Адрес:
    Правда
    Оффлайн
    Белка - это Стрелка 2.5. Можно ее не тестировать, если нет охоты.

    В других версиях изменения могут быть такими небольшими, что на небольшом числе партий они будут незаметны. Например, в Стрелке 2.0 исправлена функция see_move - она стала более правильной (что должно быть в плюс), но немного более медленной (что идет в минус). Психологически хочется оставить правильный вариант этой функции, но нужно проверить - что перевешивает - плюсы или минусы.

Поделиться этой страницей