3-й Чемпионат СНГ среди шахматных движков

Discussion in 'Машинное отделение' started by SDChess, 1 May 2006.

  1. Сергей Марков Учаcтник

    • Участник
    Member Since:
    13.05.2006
    Message Count:
    136
    Likes Received:
    6
    Репутация:
    0
    Оффлайн
    Фсем превед :)

    Насчет "Патриота" хочу немного ситуацию прояснить. Есть подозрения, что это действительно клон, хотя в настоящий момент это не доказано. Было выдвинуто несколько версий о том, клоном какой программы он является. В настоящий момент мы сделали очень простую вещь: сыграли множество партий Патриотом против Фрукта, Тоги, Gambit Fruit, Crafty. Скоро будут готовы результаты по сопоставлению оценок и ожидаемых ходов по методике, предложенной вот здесь:

    http://computerchess.org.uk/ccrl/4040/correlation.html

    Вышла некоторая задержка, Кирилл, видимо, сейчас занят, а писать самому утилиту для расчета мне влом, да и времени почти нет. Когда Кудрявцев спросил у меня: не против ли я участия Patriot, я сказал, что не против. На это было две причины:

    1. Факт клонирования не доказан (анализ в цитируемом документе крайне сомнителен)
    2. Дисквалификация возможна и после завершения турнира.

    Ну и потом, в прошлом чемпионате SmarThink все же выиграл :)

    http://oulenspiegel.livejournal.com
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Есть еще открытые исходники SlowChess и Glauring.
  3. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    и презумпция невиновности:)
  4. Сергей Марков Учаcтник

    • Участник
    Member Since:
    13.05.2006
    Message Count:
    136
    Likes Received:
    6
    Репутация:
    0
    Оффлайн
    Хм. Насчет SlowChess для меня новость, кстати :)
    А Glaurung, наверное, тоже не новые версии?

    Кстати, Торд кое-какие из моих идей использовал. Мы в свое время с ним менялись исходниками.
  5. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    Глаурунг открыт полностью - и последние версии тоже. хороший, грамотный движок. единственное, что Торд не всегда сразу показывает сам движок. скажу по секрету, что он свои бетки тихо выкладывает у себя на сайте, на страничке к которой просто так не попадешь - знать ее надо... и никому про бетку не говорит ;) ну, почти никому.
  6. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Привет всем! Сорри за задержки с ответами, я только что вернулся из отпуска! Спасибо Сергею за партии, попробую добавить и проанализировать в ближайшее время нашим тестом корреляции.
  7. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Так.. Партии от Сергея обнаружить пока не удалось, наверное их у меня ещё нет. Поэтому пока что обработал матчи проведённые мной и Рэем (Ray Banks). Результаты - здесь. Результаты корреляции: таблица количества предсказанных ходов и таблица корреляции оценок позиции. Пока что только три матча, в блице (эквивалент 8 минут на 40 ходов на процессоре Athlon 64 3800+).

    Первое что можно сказать: убедительных признаков клона пока что обнаружить не удалось. Правда пока что отсутствует матч Партиот - Крафти. Кроме того, мы тестировали Патриот 1.3.0, клоном фрукта вроде бы считается Партиот 2.0.

    Из протестированных пар ближе всего Каисса 1.8а и Крафти 19.19: процент взаимно предсказанных ходов: 64.0%. Это хоть и не мало, но недостаточно для утверждения что один движок - клон другого. Может быть не та версия Крафти?

    Об интерпретации результатов: Слабая корреляция не является доказательством отсутствия клона. Возможно клонер внёс достаточно изменений для того чтобы движок заиграл ощутимо по-другому. С другой стороны, сильная корреляция это почти наверняка клон. Сильной корреляции здесь пока что нет, если интересно можете посмотреть примеры в полных таблицах CCRL [url=""http://www.computerchess.org.uk/ccrl/4040/correlation.html]здесь[/url].

    Что дальше? Если у кого-то есть упомянутые движки, и желание помочь в сложном деле выяснении истины, проводите матчи и присылайте партии. Можете тестировать любые подозрительные движки. Любой контроль времени, кроме буллета (чем длинне тем лучше), любые дебютные книжки, желательно Ponder Off. Партии должны быть в формате PGN, для анализа корреляции PGN должен содержать оценку позиции после каждого хода, глубину перебора, времея затраченное на ход, и ожидаемый ход противника. Стандартные PGN из любого интерфейса Chessbase подойдут, комментарии могут быть как в старом так и в новом формате.

    Сергей, если пришлёшь упомянутые партии, буду рад добавить!
  8. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    по этому поводу хочу спрсить, тогда если я сделаю клон какого-либо движка - по кореляции можно выяснить это? даже если изменения затронут, и ощутимо, оценочную функцию... напрмер, я могу установить в ОФ коэффициент безопасности короля на 1,5 увеличить значимость пешечных цепей, ослабить силу 2-х слонов... поставить, наконец, случайный коэффициент от 0.9 до 1.2. в таком случае поможет ли статистика?!
  9. TopicStarter Overlay

    SDChess Учаcтник

    • Участник
    Member Since:
    01.05.2006
    Message Count:
    268
    Likes Received:
    61
    Репутация:
    6
    Оффлайн
  10. WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Патриот 2.0 клон Тоги II 0.93

    Ходили слухи, что Patriot 1.3.0 клон какой-то старой версии Крафти, но никто не проверял. Поэтому, Патриот 1.3.0 пока нельзя считать клоном.
  11. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Чем больше изменение тем меньше корреляция. Если до неузнаваемости изменить оценочную функцию, будет совсем другой движок. Например изменением настроек The King 3.33 можно получить движок играющий совсем не как The King. Насколько сильно какой параметр влияет на корреляцию - никто вроде бы не изучал.

    Другой вопрос - будет ли ваш клон так же силён как оригинал. Если просто взять готовый движок и начать крутить параметры, улучшение получить очень трудно. Ведь автор и сам уже всё подкрутил по-оптимуму.

    Поможет ли статистика? Если клонер - лентяй, то поможет. Если не лентяй и всё поменял до неузнаваемости - наверное не поможет. Экспериментов пока что не было. Так что отсутствие корреляции нельзя считать доказательством отсутствия клонирования. С другой стороны, наличие сильной корреляции почти наверняка выявляет клона, так как вероятность что два человека напишут движки предсказывающие 70% ходов друг друга - близка к нулю.

    К вопросу о том насколько сильно надо поменять движок чтобы корреляции не было - смотрите статистику CCRL. Все известные клоны (Тога) и версии одного и того же движка показывают сильную корреляцию. Даже Hiarcs 9 и Hiarcs 10, между которыми разница в рейтинге 134 пункта, предсказывают 71 процент ходов друг друга. Toga 1.1a и Fruit 2.2.1 близки как две копии одного движка, несмотря на то что Тога была клонирована в версии 0.93 (или раньше), от фрукта версии 2.1. То есть даже последующее развитие обоих движков не уменьшило их сходство.

    Может быть кто-нибудь проведёт пару тройку матчей подозреваемых движков? Было бы очень интересно. Я посчитаю корреляцию.
  12. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    а сколько партий нужно для подсчета кореляции? и кого с кем?
  13. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Чем больше тем лучше. 15-20 - нормально для грубой оценки. 50-100 - уже можно делать выводы. Контроль времени может быть любой кроме очень быстрого. Хороший контроль порядка 10 минут на 40 ходов и всё что длиннее. Чем длиннее тем лучше.

    Кого и с кем - подозреваемых. :) Например, как сказал WildCat, Patriot 1.3.0 c каким-нибудь из старых Крафти. Или Patriot 2.0 с фруктом 2.1 - это будет особенно интересно!
  14. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    хорошо, я проведу 40 партий с контролем 5+2 между Patriot 1.3.0 и Crafty 17.4, 19.03.
  15. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    1 Как можно самому подсчитать корреляцию, в домашних условиях, так сказать?:)

    2 Очень интересен был бы матч Patriot 2.0 с Patriot 1.3.0 или Kaissa 1.7!!!
  16. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Спасибо, буду ждать партии! :)

    Пока никак - мы пока что не распостраняем наши программы. Когда будет чуть больше времени постараюсь выделить эту часть в отдельную программу и выложить в открытый доступ. Но наш метод подробно описан на страницах корреляции, если кому-то не терпится то это вобщем-то легко закодировать самому.

    Несомненно! Если проведёте такой матч, будет очень интересно посмотреть корреляцию! Кстати матч Patriot 1.3.0 с Patriot 2.0 - действительно был бы очень интересен - если корреляции нет то это дополнительный признак того что 2.0 - это не развитие версии 1.3.0.
  17. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Жаль, конечно, что не распространяете программы!.....По какой причине,если не секрет?

    Запустил турнир в контроле 5+2:
    1 Crafty 18.12
    2 Kaissa 1.8
    3 Patriot 1.3.0
    4 Patriot 2.0
    В конце недели пришлю партии (кстати, куда?).........
  18. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Чтобы сохранить на время отличительную особенность нашего проекта. Кроме того эти программы пока что сложно использовать. Мы их выпустим когда они буду более готовы, и когда в нашей базе будет больше партий.

    Отлично! Буду ждать партии!

    Patriot 2.0 - вроде бы клон фрукта, фрукт не участвует в турнире? Кстати, надеюсь ваш ник не означает что вы представитель команды фрукта? :)

    Мой адрес здесь, либо можете выложить где-нибудь и запостить здесь ссылку. :)



    Да, забыл сказать: Для рассчёта корреляции нужны PGN файлы где ходы с комментариями выглядят так:
    Code:
    29. Rb7 {(Rf7-c7) [%eval 88,11] [%emt 0:00:19]} b4 {[%eval 37,13] [%emt 0:00:18]}
    либо так:
    Code:
    33. Bxc7 {1.52/14 102} f6 {(Nxc3) 0.78/15 26}
    Контроль времени - любой кроме буллета, минимум где-то 5 минут на 40 ходов, лучше 10. Чем длиннее тем качественнее оценка корреляции. Но нужно также много партий, где-то 20-30 минимум, лучше 50-100.
  19. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    К команде Фрукта, конечно же, отношения не имею. :) Мне вообще больше нравится Smarthink, хотя и Фрукт программа не плохая......
    Фрукт не участвует у меня...Цель турнира выявить приемственность между версиями....Если её нет, то это ещё одно доказательство клонирования. Если же, она есть, то, наоборот...
    Турнир проходит в оболочке Shredder 9 и выходит что-то вроде:
    8 Nb3 0.16/10 11 Bb6 -0.42/14 12 (Bd6) 9...
    Контроль времени, как и обещал, 5+2
  20. TopicStarter Overlay

    SDChess Учаcтник

    • Участник
    Member Since:
    01.05.2006
    Message Count:
    268
    Likes Received:
    61
    Репутация:
    6
    Оффлайн
    Завершен турнир восьми, в котором разыгрывались места с 7 по 14! Завершился турнир сильнейших с контролем 5 минут на 40 ходов! Продолжается главный турнир...
    Новости можно посмотреть здесь
    http://sdchess.narod.ru/tournaments/Cis3_final.htm
  21. WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Забыли еще Каиссу 1.0 :)

    И хорошо бы было провести несколько матчей между одной и той же версией разных программ. Просто чтобы узнать какую близость они покажут. Ведь оценки программ прыгают от хода к ходу. И свои ходы не всегда могут предсказать.

    Вместо близости оценок лучше находить коэф.корреляции, строить уравнения регрессии. Тогда будут зависимости лучше находится. А так достаточно Eval() * 2 + 50. И уже будет считаться, что оценка совсем иная и ничем не похожа :)
  22. WildCat Коршунов Игорь

    • Команда форума
    Member Since:
    04.05.2006
    Message Count:
    3.599
    Likes Received:
    4
    Репутация:
    0
    Location:
    Гомель
    Оффлайн
    Патриот это еще не проблема. В принципе я не против клонов. Ведь Рыбка тоже клон???

    А проблема это Арена! Только сейчас заметил, что использовалась эта оболочка. Но она так затормаживает движки, которые выводят информацию в процессе перебора.
    Факт, то что 5 минут на партию совершенно невозможно играть из-за проигрышей по времени. Насколько это важно при других контролях я не исследовал. Но все равно использование оболочки с такой дурной репутацией...

    Есть же WinBoard. Может и не очень удобен, зато репутация самая наилучшая. А вообще, довольно странно, что нет других оболочек.
    Говорят, что оболочка Shredder тоже очень хорошая. Может кто-нибудь дать попользоваться? Krey?
  23. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    попользоваться дать могу. тебе ссылку для скачки дать или прислать на email?
  24. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    У меня выводит информацию во время перебора (раз в секунду), но стоит Аварийка (Аварийное завершение перебора, без порчи Хеша и т.д.), и флаг программа не роняет и с контролем 1+1 Но затормаживает движок на коротких контролях конечно достаточно сильно.
    + При включенном пондере у неё иногда случается беда - она забывает послать stop/ponderhit, но случается это достаточно редко.
  25. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.122
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Вот с этого момента поподробнее, пожалуйста.
  26. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Оценка в последних версиях практически та-же, что и в Тоге.
    Кстати, в Naum-е похоже тоже.
  27. Kirr Администратор

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    1.208
    Likes Received:
    22
    Репутация:
    8
    Оффлайн
    Отлично! Главное чтобы всё это было в PGN.

    В качестве такой оценки можно приблизительно взять самые близкие показатели из тестов CCRL. Например Ktulu 7.1 - 7.5 или Fruit 2.2.1 - Toga II 1.0. Там есть и ещё несколько близких пар. Процент предсказанных ходов - в пределах 70 - 80%.

    Тест который нельзя обмануть - это пондер хит (процент предсказанных ходов). Как бы клонер не маскировал оценку, ходы на доске делать всё же надо. Оценку можно изменить так что и уравнения регрессии не помогут. Поэтому корреляция оценок - это тест для "честного" клонера, а пондер хит - для хитрого. :)

    Я против клонов - они портят статистику и рейтинги. Рыбка не клон, но последнии версии как-то всё больше похожи на фрукт...

    С такой же как в Тоге она и играла бы как Тога. А между ними 167 очков разницы (в нашем листе). Близость есть, но недостаточная чтобы что-то утверждать. (IMHO).

    Наум вроде в порядке в наших тестах.
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Разве? Вроде у него оценка ну очень похожа на Тоговскую.
    А вот ходы другие делает. То есть переборные алгоритмы свои.
    Хотя может я и ошибаюсь.
  29. krey Михаил Кройтор

    • Команда форума
    Member Since:
    10.04.2006
    Message Count:
    3.709
    Likes Received:
    50
    Репутация:
    1
    Location:
    Кишинев
    Оффлайн
    2 Kirr
    Партии, игранные патриотом 1.3.0 против крафти 17.4 и 18.10 (всего 40 партий).
  30. TopicStarter Overlay

    SDChess Учаcтник

    • Участник
    Member Since:
    01.05.2006
    Message Count:
    268
    Likes Received:
    61
    Репутация:
    6
    Оффлайн
    Чемпионат СНГ финишировал!
    Поздравляем всех участников и победителей!
    Чемпион стран СНГ 2006 года - SmarThink Сергея Маркова, Россия! Наши поздравления Сергею!
    Итоговые результаты, включая партии и турнирные таблицы можно посмотреть здесь
    http://sdchess.narod.ru/tournaments/Cis3_final.htm

Share This Page