Доверительные интервалы для рейтингов

Igrok7 · 9 янв 2007

Меня интересует как считать доверительные интервалы.Например,какова будет погрешность рейтинга если сыграно 25 партий?Или сколько надо сыграть партий,чтобы погрешность была не более 50 пунктов?

MaxP · 9 янв 2007

Доверительные интервалы считает EloStat. При 25 сыгранных партиях погрешность будет примерно +-130 пунктов (95 %)
Чтобы разбросы были менее 50 пунктов (с 95% точностью) нужно около 90 партий.

NS · 9 янв 2007

Не факт что EloStat доверительные интервалы считает правильно... (то-же самое с BayesElo)
Для расчета рейтингов и у меня и у WilldCat-а есть собственные написанные программы (больше я доверяю тому что написал сам) + я написал несколько программ для расчета доверительных интервалов.

MaxP · 9 янв 2007

NS
Ну так выложи куда-нибудь эти программы с подробными инструкциями, будем ими рейтинги считать

NS · 9 янв 2007

Чтоб выложить их нужно нормально оформить - честно говоря на это никак не хватает времени...
Но как нибудь дойдут руки.
Сейчас для меня важнее мой новый переборный алгоритм. Предварительные результаты - он лучше и PVS и Альфа-Беты... При любой глубине >=3 (при глубине меньше 3 - и PVS без хеша, и мой алгоритм без хеша проигрывают Альфа-Бете, но это абсолютно неважно, программы считают дальше)

WinPooh · 9 янв 2007

Интересно, теперь ждём результатов уже на практических партиях - сколько пунктов рейтинга даёт новый алгоритм при разных контролях?

MaxP · 9 янв 2007

Сергей, можешь прислать мне на мыло, я протестирую.

NS · 9 янв 2007

Интересно, теперь ждём результатов уже на практических партиях - сколько пунктов рейтинга даёт новый алгоритм при разных контролях?
Нажмите, чтобы раскрыть...

Я пока тестирую на идеальной игре, перебор сразу на требуемую глубину, без хеша, в каждой позиции по 20 возможных ходов, ходы случайным образом перемешены. Сотни тысяч тестовых позиций для каждого алгоритма, наборы тестовых позиций для всех переборных алгоритмов идентичны.
До практических партий дойдет немного позже.

Сергей, можешь прислать мне на мыло, я протестирую.
Нажмите, чтобы раскрыть...

Спасибо!
Но нет смысла - у меня три компа дома Для тестирования нужен только один.

NS · 9 янв 2007

Интересно, теперь ждём результатов уже на практических партиях - сколько пунктов рейтинга даёт новый алгоритм при разных контролях?
Нажмите, чтобы раскрыть...

Немного. Много прибавки по сравнению с чистой Альфа-Бетой получить практически невозможно, так как слишком хорошо все умеют сортировать ходы.

Igrok7 · 9 янв 2007

Так что формулы для доверительного интервала нет,используются численные методы?

NS · 9 янв 2007

Конечно нет. По уму Доверительные интервалы расчитываются через вероятности рейтинга при полученных фиксированных рейтингах соперников. Готовой формулы нет.

Войти или зарегистрироваться

Доверительные интервалы для рейтингов

Igrok7 Учаcтник

MaxP Максим

NS Нефёдов Сергей баннер

MaxP Максим

NS Нефёдов Сергей баннер

WinPooh В.М. Команда форума

MaxP Максим

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

Igrok7 Учаcтник

NS Нефёдов Сергей баннер