Исследование Фрукта

Тема в разделе "Машинное отделение", создана пользователем WildCat, 15 дек 2006.

  1. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Захотелось кое-что протестировать во Фрукте.
    Фрукт будет играть против своих модификаций, чтобы нам стало очевидно в чем же сила.

    На первый раз будем проверять безопасность короля.
    Насколько я понял Фруктовская безопасность состоит из двух частей: пешечный щит и фигурная атака на короля.

    Будет турнир 2 + 1 с участием:

    Оригинальные версии:
    Fruit 2.2.1
    Fruit 2.1
    Fruit 2.0

    Мои компиляции:
    FruitIK 2.1.0 - просто моя компиляция (VC++ 7.0) без каких-либо изменений
    FruitIK 2.1.1 - без атаки на короля
    FruitIK 2.1.2 - без атаки на короля и без пешечного щита
    FruitIK 2.1.3 - без пешечного щита

    И, на всякий случай, звезда шахматных полей СНГ:
    WildCat 7

    Какие будут прогнозы, кроме того, что Fruit 2.2.1 >> Fruit 2.1 >> Fruit 2.0?

    PS ">>" означает "круче чем".
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Прогнозы -
    2.1.0>2.1.2 на 150 пунктов.
    2.1.0>2.1.1 на 100 пунтков.

    насчет без пешечного щита...
    А как во Фрукте посчитать защищенность не рассчитывая щит?
  3. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Привет Игорь. Это интересно но я бы сделал не так.

    1. Нужно убрать фрукт 2.2.1 так как код закрыт (то есть мы не сможем сказать почему он сильнее). Тестировать фрукт 2.2.1 в этом контексте это трата времени.

    2. Лучше тестировать не фрукт против фрукта а против набора из порядка 10 близких по силе оппонентов, в гаунтлете. Я могу помочь подобрать оппонентов если нужно. :)

    Я бы также убрал фрукт 2.0 вообще-то. Как вариант можно взять за базу тогу и провести такой же эксперимент - выключать разные части и смотреть как меняется сила.
  4. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Вроде никакой другой защищенности во Фрукте нет.
  5. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Kirr!
    Оригинальные версии Фрукта добавлены просто ради любопытства. Основное здесь это тестировние 4 экспериментальных версий между собой.
    Против набора других будет медленно и не так интересно.
  6. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    FruitIK 2.1.3 - без пешечного щита
    получается с атакой на короля, но без пешечного щита...
    Но в расчете атаки во Фрукте ведь используется пешечный щит!?!
  7. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Почему?
    Много раз слышал подобные утверждения.
    Есть ли какое-то теоретическое обоснование, или правдоподобное объяснение "на пальцах"?
  8. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    один соперник может быть удобен/неудобен.
    И чтоб уменьшить возможность искажения связанную с удобством конкретного соперника - делают тестовую группу разных по стилю соперников.
  9. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Да нет по-моему. Просто считается сколько каких фигур атакуют короля.
  10. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Я текст Фрукта не смотрел, но в Тоге есть зависимость между Щитом и оценкой атаки...
    в зависимости от пешечного прикрытия разные варианты.
  11. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Если играют два почти одинаковых движка (Фрукт против Фрукта), как один из них может быть удобен или неудобен другому?
  12. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Как это? Легко :)
    Это где видано чтоб силу движка измеряли в матче с похожим по стилю (почти идентичным) движком?
    На практике он тоже будет только с Фруктом играть? :)
    Тесты с предыдущими версиями и т.д. - абсолютно неинформативны.
    И не отражают действительную прибавку силы.
  13. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Вот я и хочу понять, это очередное "где видано" и "абсолютно неинформативны" - исключительно экспериментальные данные, или как-то можно теоретически сей факт обосновать?
  14. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Можно. Допустим две версии. в одной ошибка, другая целенаправленно долбает в эту ошибку.
    Версия которая долбает выиграет с большим перевесом. Хотя средний соперник в эту дыру бить не будет.
  15. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Главный аргумент: всё равно движку придётся бороться с другими движками, а не с версиями самого себя (например в тестах CCRL). Поэтому интереснее узнать сильнее ли модификация против других движков чем узнать сильнее ли она против своих же версий. Тестирование со своими же версиями основано на предположении что если модификация сильнее то она будет сильнее и против себя и против других движков, но лично мне это совсем не очевидно. Модификация может быть сильнее против своих версий за счёт ослабления какого-то аспекта игры, за которое свои же версии почему-то не наказывают. А другие движки могут наказать. Поэтому всегда нужен набор оппонентов а не один оппонент. (Набор из 10 версий того же движка это не набор, это тот же один оппонент).
  16. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Кроме NS больше никто прогнозов делать не будет?
  17. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Если одна модификация выигрывает другую, то вероятность что она будет сильнее против других очень высока.
    Другое дело, что таких матчах разница в силе между версиями оказывается завышенной из-за того, о чем говорил NS в посте №14.
    Но меня больше интересует просто наличие преимущества, а не его точное определение. В этом смысле мой турнир - это хороший вариант.
  18. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Может быть люди просто не в курсе как именно Фрукт оценивает атаку на короля и пешечный щит.
    Так я могу рассказать в общих чертах.

    PS. На самом деле правильно говорить "пешечное прикрытие", но "щит" мне кажется более романтичным :)
  19. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    У меня пешечное прикрытие (правда не такое как в Фрукте) прибавляет 50 пунктов.
    поэтому считаю что разница в силе между версиями 2.1.1 и 2.1.2 должна быть 50 пунктов.
    Насчет атаки - по идее она должна прибавлять больше чем щит, думаю что в 2 раза, поэтому и оцениваю доп. прибавку от неё в 100 пунктов. Итого получается что защищенность дает 150...
  20. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Есть ли уже какие-нибудь результаты?
  21. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Результаты есть. Но хочется чтобы еще кто-нибудь высказал свои соображения.
    А то получается спецом по шахматному программированию себя чувствует только NS. Неужели здесь больше никого нет?
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Хорошо, мой прогноз таков:

    первая четвёрка:

    Fruit 2.2.1
    Fruit 2.1
    Fruit 2.0
    + WildCat возможный на любом из 4-х мест в этой четвёрке

    а изменённые версии будут внизу таблицы:

    FruitIK 2.1.0 - просто моя компиляция (VC++ 7.0) без каких-либо изменений
    FruitIK 2.1.1 - без атаки на короля
    FruitIK 2.1.3 - без пешечного щита
    FruitIK 2.1.2 - без атаки на короля и без пешечного щита

    Прогноз тривиальный, сделан просто по здравому смыслу. На гордое звание спеца по шахпрограммированию отнюдь не претендую.
  23. Dallaylaen Константин Уварин

    • Новичок
    Рег.:
    30.10.2006
    Сообщения:
    22
    Симпатии:
    0
    Репутация:
    0
    Адрес:
    Москва
    Оффлайн
    Предположим, мы добавили в движок Универсальный Алгоритм Поиска Крепостей. Версия без него будет неудобна, т.к. видит те же ходы, только дальше, и позиция против нее всегда будет чуть-чуть хуже. Итого =много+ничего-мало — сила упала. При этом против, например, Крамника сила вырастет (т.к. мы не будем пускать его в крепости / будем строить крепости против него). Равно как и против более сильных движков.

    Кстати, такой движок будет средне играть в турнирах и ме-едленно запиливать соперников в матчах.
  24. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Что 2.1.0 будет даже хуже и 2.0 и WildCat 7? Это почему?
  25. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    из-за компилятора, вестимо
  26. krey Михаил Кройтор

    • Команда форума
    Рег.:
    10.04.2006
    Сообщения:
    3.709
    Симпатии:
    50
    Репутация:
    1
    Адрес:
    Кишинев
    Оффлайн
    я тоже считаю, что первым будет фрукт 221, потом уже будет борьба за 2-4 места между кошкой и фрукт 21 и 210. а внизу будет фрукт 20
  27. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    А как экспериментальные расположутся?
  28. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Fruit 2.1.0 работает на 80% скорости Fruit 2.1. Ниже Fruit 2.0 упасть не должен.
  29. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Сравнивать Фрукт 2.0, Фрукт 2.1 и Фрукт 2.1.0 между собой абсолютно неинтересно, тем более имея рейтинг-листы и зная падение быстродействия на версии 2.1.0
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Ты явно забыл приписать фразу: "Вопрос закрыт!" :)
  31. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Фрукт 2.0 =0

    Фрукт 2.1 +60
    WildCat 7 +60
    Фрукт 2.1.0 +40
  32. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Фрукт 2.2.1 +140
  33. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    2.1.2 -110
    2.1.1 -60
  34. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Пока результаты такие:
    Код:
    1. Fruit 2.2.1   117.5 / 169
    2. Fruit 2.1     107.5 / 169
    3. FruitIK 2.1.1  93.5 / 169
    4. FruitIK 2.1.0  86.5 / 169
    5. WildCat 7      71.5 / 169
    6. FruitIK 2.1.2  71.5 / 169
    7. FruitIK 2.1.3  64.5 / 169
    8. Fruit 2.0      63.5 / 169
    Видно, что атака на короля во Фрукте полная лажа.
    А без пешечного щита вообще никак.

    Неожидано большая разница между 2.1.0 и 2.1, которые различаются только по скорости.
  35. TopicStarter Overlay

    WildCat Коршунов Игорь

    • Команда форума
    Рег.:
    04.05.2006
    Сообщения:
    3.599
    Симпатии:
    4
    Репутация:
    0
    Адрес:
    Гомель
    Оффлайн
    Ты думаешь, что Кошка играет в силу Фрукта 2.1?

Поделиться этой страницей