Вероятность ничьей

Тема в разделе "Машинное отделение", создана пользователем Kirr, 14 апр 2009.

  1. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    Недавно заинтересовался процентом ничьих. Предположил, что вероятность ничьей должна зависеть от разницы в рейтинге игроков (что очевидно) и от среднего рейтинга (у гроссмейстеров ничьих больше). Решил посмотреть на базе партий из своего турнира движков:

    [​IMG]
    <процент ничьих> = 31.87296 - 0.04936 * <разница в рейтинге>

    [​IMG]
    <процент ничьих> = -46.54273 + 0.02904 * <средний рейтинг>
    (на втором графике к числам по оси Х нужно прибавить 2000, чтобы получить рейтинги)

    Похоже что зависимость есть в обоих случаях, поэтому посчитал зависимость от обеих величин:
    <процент ничьих> = -25.38374 - 0.02806 * <разница в рейтинге> + 0.02162 * <средний рейтинг>

    Эти результаты: 1) для движков 2) в блице 3) данных всё же маловато. Есть версия что процент ничьих так же зависит от контроля времени.

    База партий немного однобока: узкий диапозон рейтингов движков, и ещё более узкий диапозон разниц рейтингов в парах. Интересно было бы сравнить с более разносторонней базой. Есть гипотеза, что при увеличении разброса рейтингов и разниц рейтингов вероятность ничьей придётся предсказывать какой-то нелинейной зависимостью.

    В контексте сравнения людей и движков: Интересно круче ли наклон регрессии у человеческого графика в обоих случаях. :)
     
  2. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Проводить прямую линию через такое облако значений - очень смело.
    Нет ли желания посчитать статистическую значимость полученных коэффициентов регрессии?
     
  3. PP
    Оффлайн

    PP Заблокирован

    Репутация:
    5
    Сначала проще посмотреть с помощью ANOVA на более простую модель типа
    <процент ничьих> = D + C * <движок> + B * <разница в рейтинге> + A * <средний рейтинг>
    vs.
    <процент ничьих> = D + B * <разница в рейтинге> + A * <средний рейтинг>
    где движок переменная со значениями 0 и 1, а уже потом смотреть на взаимодействие переменной движок с
    другими.
     
  4. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    Надо, конечно, посчитать.

    Не совсем понял что за величина <движок>? - 1 если играет движок, 0 если человек? По какой базе партий тогда считать? Нужно ведь по идее чтобы контроль времени похожий был, чтобы так совмещать в одну модель.
     
  5. EgisLT
    Оффлайн

    EgisLT Учаcтник

    Репутация:
    0
    Какои формат базы? Можно ли через вашу програму пропустить Megabase?
     
  6. PP
    Оффлайн

    PP Заблокирован

    Репутация:
    5
    Насчёт <движок> Вы поняли верно. Про разницу в контроле я не подумал, но по идее надо и контроль вводить как переменную.
     
  7. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    Формат PGN, база доступна для всех желающих. Прогнать мегабазу пока нельзя, моя прога заточена под инфраструктуру моего сайта. Может сделаю независимую версию.
     
  8. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    Выложил графики и формулы на отдельную страничку. Там же можно увидеть интервалы достоверности коэффициентов (по просьбе Юрия).

    В итогде я пришёл к выводу, что колонка "процент ничьих" в рейтинг листах - бесполезна. Ничего интересного об отдельном движке из неё мы узнать не можем. Поэтому в рейтинг листе турнира KCEC вместо этой колонки я теперь показываю "ничейность" каждого движка, посчитанную как отношение реального числа ничьих к ожидаемому.

    Наиболее "ничейный" движок - Chispa 4.0.3 - он сделал 178.3% от ожидаемого числа ничьих. (Интервал погрешности: ±22.9%)

    Антиничейные движки: Twisted Logic 20080404x (77.8%±5.2%), Thor's Hammer 2.28 32-bit (78.0%±10.6%), The Baron 1.8.1 (80.9%±7.4%).