Вероятность ничьей

Тема в разделе "Машинное отделение", создана пользователем Kirr, 14 апр 2009.

  1. TopicStarter Overlay

    Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Недавно заинтересовался процентом ничьих. Предположил, что вероятность ничьей должна зависеть от разницы в рейтинге игроков (что очевидно) и от среднего рейтинга (у гроссмейстеров ничьих больше). Решил посмотреть на базе партий из своего турнира движков:

    [​IMG]
    <процент ничьих> = 31.87296 - 0.04936 * <разница в рейтинге>

    [​IMG]
    <процент ничьих> = -46.54273 + 0.02904 * <средний рейтинг>
    (на втором графике к числам по оси Х нужно прибавить 2000, чтобы получить рейтинги)

    Похоже что зависимость есть в обоих случаях, поэтому посчитал зависимость от обеих величин:
    <процент ничьих> = -25.38374 - 0.02806 * <разница в рейтинге> + 0.02162 * <средний рейтинг>

    Эти результаты: 1) для движков 2) в блице 3) данных всё же маловато. Есть версия что процент ничьих так же зависит от контроля времени.

    База партий немного однобока: узкий диапозон рейтингов движков, и ещё более узкий диапозон разниц рейтингов в парах. Интересно было бы сравнить с более разносторонней базой. Есть гипотеза, что при увеличении разброса рейтингов и разниц рейтингов вероятность ничьей придётся предсказывать какой-то нелинейной зависимостью.

    В контексте сравнения людей и движков: Интересно круче ли наклон регрессии у человеческого графика в обоих случаях. :)
  2. Осипов Юрий Учаcтник

    • Участник
    Рег.:
    18.06.2007
    Сообщения:
    399
    Симпатии:
    475
    Репутация:
    11
    Адрес:
    Правда
    Оффлайн
    Проводить прямую линию через такое облако значений - очень смело.
    Нет ли желания посчитать статистическую значимость полученных коэффициентов регрессии?
  3. PP Заблокирован

    • Заблокирован
    Рег.:
    21.02.2006
    Сообщения:
    1.023
    Симпатии:
    148
    Репутация:
    5
    Нарушения:
    31
    Оффлайн
    Сначала проще посмотреть с помощью ANOVA на более простую модель типа
    <процент ничьих> = D + C * <движок> + B * <разница в рейтинге> + A * <средний рейтинг>
    vs.
    <процент ничьих> = D + B * <разница в рейтинге> + A * <средний рейтинг>
    где движок переменная со значениями 0 и 1, а уже потом смотреть на взаимодействие переменной движок с
    другими.
  4. TopicStarter Overlay

    Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Надо, конечно, посчитать.

    Не совсем понял что за величина <движок>? - 1 если играет движок, 0 если человек? По какой базе партий тогда считать? Нужно ведь по идее чтобы контроль времени похожий был, чтобы так совмещать в одну модель.
  5. EgisLT Учаcтник

    • Участник
    Рег.:
    14.12.2007
    Сообщения:
    431
    Симпатии:
    12
    Репутация:
    0
    Оффлайн
    Какои формат базы? Можно ли через вашу програму пропустить Megabase?
  6. PP Заблокирован

    • Заблокирован
    Рег.:
    21.02.2006
    Сообщения:
    1.023
    Симпатии:
    148
    Репутация:
    5
    Нарушения:
    31
    Оффлайн
    Насчёт <движок> Вы поняли верно. Про разницу в контроле я не подумал, но по идее надо и контроль вводить как переменную.
  7. TopicStarter Overlay

    Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Формат PGN, база доступна для всех желающих. Прогнать мегабазу пока нельзя, моя прога заточена под инфраструктуру моего сайта. Может сделаю независимую версию.
  8. TopicStarter Overlay

    Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Выложил графики и формулы на отдельную страничку. Там же можно увидеть интервалы достоверности коэффициентов (по просьбе Юрия).

    В итогде я пришёл к выводу, что колонка "процент ничьих" в рейтинг листах - бесполезна. Ничего интересного об отдельном движке из неё мы узнать не можем. Поэтому в рейтинг листе турнира KCEC вместо этой колонки я теперь показываю "ничейность" каждого движка, посчитанную как отношение реального числа ничьих к ожидаемому.

    Наиболее "ничейный" движок - Chispa 4.0.3 - он сделал 178.3% от ожидаемого числа ничьих. (Интервал погрешности: ±22.9%)

    Антиничейные движки: Twisted Logic 20080404x (77.8%±5.2%), Thor's Hammer 2.28 32-bit (78.0%±10.6%), The Baron 1.8.1 (80.9%±7.4%).

Поделиться этой страницей