Доверительные интервалы для рейтингов

Тема в разделе "Машинное отделение", создана пользователем Igrok7, 9 янв 2007.

  1. Igrok7
    Оффлайн

    Igrok7 Учаcтник

    Репутация:
    0
    Меня интересует как считать доверительные интервалы.Например,какова будет погрешность рейтинга если сыграно 25 партий?Или сколько надо сыграть партий,чтобы погрешность была не более 50 пунктов?
     
  2. MaxP
    Оффлайн

    MaxP Максим

    Репутация:
    0
    Доверительные интервалы считает EloStat. При 25 сыгранных партиях погрешность будет примерно +-130 пунктов (95 %)
    Чтобы разбросы были менее 50 пунктов (с 95% точностью) нужно около 90 партий.
     
  3. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Не факт что EloStat доверительные интервалы считает правильно... (то-же самое с BayesElo)
    Для расчета рейтингов и у меня и у WilldCat-а есть собственные написанные программы (больше я доверяю тому что написал сам) + я написал несколько программ для расчета доверительных интервалов.
     
  4. MaxP
    Оффлайн

    MaxP Максим

    Репутация:
    0
    NS
    Ну так выложи куда-нибудь эти программы с подробными инструкциями, будем ими рейтинги считать :)
     
  5. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Чтоб выложить их нужно нормально оформить - честно говоря на это никак не хватает времени...
    Но как нибудь дойдут руки.
    Сейчас для меня важнее мой новый переборный алгоритм. Предварительные результаты - он лучше и PVS и Альфа-Беты... При любой глубине >=3 (при глубине меньше 3 - и PVS без хеша, и мой алгоритм без хеша проигрывают Альфа-Бете, но это абсолютно неважно, программы считают дальше)
     
  6. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Интересно, теперь ждём результатов уже на практических партиях - сколько пунктов рейтинга даёт новый алгоритм при разных контролях?
     
  7. MaxP
    Оффлайн

    MaxP Максим

    Репутация:
    0
    Сергей, можешь прислать мне на мыло, я протестирую.
     
  8. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я пока тестирую на идеальной игре, перебор сразу на требуемую глубину, без хеша, в каждой позиции по 20 возможных ходов, ходы случайным образом перемешены. Сотни тысяч тестовых позиций для каждого алгоритма, наборы тестовых позиций для всех переборных алгоритмов идентичны.
    До практических партий дойдет немного позже.
    Спасибо!
    Но нет смысла - у меня три компа дома :) Для тестирования нужен только один.
     
  9. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Немного. Много прибавки по сравнению с чистой Альфа-Бетой получить практически невозможно, так как слишком хорошо все умеют сортировать ходы.
     
  10. Igrok7
    Оффлайн

    Igrok7 Учаcтник

    Репутация:
    0
    Так что формулы для доверительного интервала нет,используются численные методы?
     
  11. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Конечно нет. По уму Доверительные интервалы расчитываются через вероятности рейтинга при полученных фиксированных рейтингах соперников. Готовой формулы нет.