Обсуждаем математическую статистику и рейтинг-системы

Тема в разделе "Машинное отделение", создана пользователем WildCat, 8 авг 2006.

  1. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Чем объяснить что у Главрука ошибка рейтинга (-) больше, чем (+)? А у Скорпио наоборот. Так сразу неочевидно.
     
  2. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Тем что результат больше или меньше 50% :)
    Можно посмотреть на таблицу -
     
  3. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
  4. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Можно это объяснить, а то не хочется думать?
     
  5. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    По этой табличке получается что при разницев 200 пунктов результат - +200, Допуск (-200/+400) То есть от +0 до +600
     
  6. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Перепутал, у Главрука ошибка (+) больше, хотя по логике вроде ошибка (-) должна быть больше (как минимум не меньше).
     
  7. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Да, Если возмем среднеквадратичное, и по приближенным правилам - допуск тройное среднеквадратичное - по очкам получим +5,-5 (Для примера)
    Но разница в пять очков в разные стороны дает разные цифры рейтинга.
    Например 75% +15% = 90% примерно +200 пунктов
    75% -15% =60% примерно -130 пунктов
     
  8. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Что-то я не понимаю как по этой табличке допуски считать.
     
  9. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Да, должна быть "-" больше...
     
  10. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Если я правильно понял, ты хочешь сказать, что Главрук набрал 16.7% плюс-минус какая-то ошибка. И если эту ошибку переводить в Эло, то и получаются неодинаковые числа. Это чисто выверты Эло системы. Лучше использовать рейтинг Сонаса.
     
  11. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Там есть другая (в этой же ветке), с нарастающим итогом.
    Обычно считают допуск 0.3% - то есть границы - берем с обоих краев точки с 0.3% нарастающим итогом.
    Но это немного другая таблица - по известной разнице в силе получаем допуск результатов - насколько в конкретном матче может показать отклонение силы.
    Значит всё верно - если наоборот смотреть силу по известному результату, то если результат меньше 50%, то допуск в "+" должен быть больше допуска в "-"
     
  12. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Завист что считать вывертом. Если игрок А на 50 пунктов сильнее Б, а Б на 50 пунктов сильнее С - как в системе Сонаса считается разница сил А и С? В Эло - сложением (Для этого и была выбрана логарифмическая шкала)

    На самом деле при любой системе рейтингов допуск не будет симметричным. Могу проверить.
     
  13. morkoffkin
    Оффлайн

    morkoffkin Учаcтник

    Репутация:
    0
    WinPooh считает как и NS? Печально. Вспомнили бы для приличия правило Байеса.
     
  14. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Я ничего не считаю. Считает программа EloStat, встроенная в Арену.
    Со временем думаю попробовать и другие инструменты - например, BayesElo. Или свою собственную утилиту.

    Пока что статистика слишком мала, и использование любой сколь угодно навороченной математики будет явным завышением точности. Сейчас меня интересует в большей степени ранкинг, а не рейтинг.
     
  15. MaxP
    Оффлайн

    MaxP Максим

    Репутация:
    0
    WinPooh
    А чем отличается EloStat от BayesElo?
     
  16. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    NS!
    Как раз в Эло ничего нельзя складывать. Именно из-за этого Сонас и придумал систему где 50 + 50 = 100.
     
  17. morkoffkin
    Оффлайн

    morkoffkin Учаcтник

    Репутация:
    0
    Сонаса вообще серьезно воспринимать нельзя. Тогда уж лучше e-рейтинг :)
     
  18. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я отлично помню правило Байеса, но при чем оно тут?
     
  19. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Опять не разбираясь в вопросе.
    Допуск в 0.3% погрешности (99.7%) попадания в интервал является общепризнанным.
    1. Я посчитал точные вероятности исходя из предпологаемых вероятностей результата отдельной партии.
    Отмерив по 0.15% процента (или 0.3- результат от этого особо не изменится) вероятности с каждого края я получаю область с 99.7% вероятность.
    А приближенные методы использует те. кто не в состоянии использовать точные.

    И раз уж сказали "А" - тогда пожалуйста уж скажите и "Б".
    Что Вас не устраивает в моих расчетах?
     
  20. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    NS!
    Приведи еще раз свои расчеты, но очень подробно, а то я не догоняю, откуда что берется.
     
  21. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Пусть вероятность проигрыша в партии V00, ничьи VO1, победы V02
    Тогда после первого тура вероятность набрать:
    0.0 V10=V00
    0.5 V11=V01
    1.0 V12=V02
    После второго тура вероятность набрать
    0.0 V20=V10 (вероятность того, что после первого тура у нас 0.0 очков)*V00 (вероятность поражения)
    0.5 V21=V10*V01+V11*V00
    (вероятность что ноль очков* Вероятность ничьи + Вероятность что 0.5 очков * вероятность поражения)
    1.0 V22=V10*V02+V11*V01+V12*V00
    (вер. 0.0 * вер победы + вер. 0.5* вер. ничьи + вер. 1.0 * вер. поражения)
     
  22. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Для подсчета вероятностей результата после N-го тура
    VNP - где N - номер тура, а P результат (в очковом выражении P/2)
    VNP=V(N-1)P * V00 +V(N-1)(P-1)*V01+V(N-1)(P-2)*V02
    Для отрицательных P Вероятность естественно равна нулю.
     
  23. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Вероятности я как-нибудь и сам бы посчитал (кстати, тут нужна не формула Байеса, а другая, но забыл как называется). Вопрос в другом. Как определить величину ошибки с вероятностью 95%, 99%, 99.7%?
    И почему ошибка получается не симметричной?
     
  24. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Давайте возьмем пример из реальной жизни: WildCat 6 - Yace Paderborn - +24 -17 =9.
    мат. ожидание количества очков Кошки 0.57 (+56 пунктов рейтинга).
    дисперсия - 0,204183673
    сигма - 0,451866876
    получается доверительный интервал (0,44475127; 0,69524873) для 95% уровня надежности.
    Т.е. с 95% уверенностью мы можем считать, что рейт Кошки от -44,19898381 до +156,1989838 рейта Яса.

    Интервал симметричный. Не могу понять откуда может появиться ассиметрия. Это может быть только для случаев, когда движок набирает под 100% очков.
     
  25. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Результат должен быть нессиметричным для любого результата отличного от 50%..
    Три доверительных интервала были сделаны для конкретного случая. Когда в эти интервалы попадает при допуске в Одно квадратичное, Два и три соответственно.
    Не помню для какого распределения, но можно найти в интернете.
    Но мои Таблицы для известной разницы в силе, для предсказания результата.
    Могу нарисовать обратные Таблицы - Для известного результата расчитать допуск силы (вероятность попадания разницы силы в данный интервал)

    Откуда берется ассиметрия я вроде уже объяснял...
     
  26. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Нарисуй таблицы для примера, что я привел, и объясни откуда берется ассимертия.
     
  27. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    ОК. Только на работу приеду :)
     
  28. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
  29. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Вспомнил это правило :) При чем тут оно? Мы совсем другие проблемы обсуждаем, как мне кажется.
     
  30. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Насколько я знаю, в мат. статистике доверительные интервалы всегда симметричны.
     
  31. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Нет, в случае использования ручных (приближенных) методов счета - да, обычно симметричны.
    В случае НОРМАЛЬНОГО распределения (да и любого "симметричного" распределения) - Да, симметричны.
    Но откуда тут симметричное распределение???? Достаточно посмотреть на таблицу, чтоб увидеть что оно абсолютно несимметрично.
    http://kasparovchess.crestbook.com/viewpoll.php?pid=19873#p19873
     
  32. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Про "странности" доверительных интервалов Элостата в своё время много говорили на WB-форуме:
    http://www.volker-pittlik.name/wbforum/viewtopic.php?t=949

    Наверное, действительно, со временем перейду на Байеса.
     
  33. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Сейчас я посчитаю для приведенного случая (+24-17=9), и сравним.
    Но симметричный допуск не может быть в принципе.
    Байес применяется только в том случае, если распределение рейтингов в природе неравномерно. Но значительных поправок это не даст. И распределение рейтингов в принципе очень условная вещь.
    (то есть для случая таблиц которые я приводил - Байес совсем не при чем, morkoffkin-а как обычно клинит. Байес применяется есно только для обратной задачи, в случае неравномерного распределения рейтингов в природе)
    //
    Доверительный интервал я посчитаю для формулы зависимости результата от рейтинга 1/(1+10^(РазницаРейтингов/400)), хотя по сравнению с таблицей она дает небольшую погрешность.

    Вероятность ничьи беру 9/50=18% независимо от разницы рейтингов.
     
  34. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    NS!
    Относительно ~16.6 она лишь чуть-чуть несимметрична. И еще не факт что несимметрична. Так сразу это увидеть трудно. Ясно лишь, что вблизи границ будет ассиметрия. А вблизи матожидания очень даже симметрично.
     
  35. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Она почти симметрична по рейтингу или очкам?
    Вблизи мат ожидания, если берем допуск на 99.7% она нессиметрична на 200! пунктов -200,+400.
    Средннее (матожидание) 16,5 а никак не 16,6 :)