Реформировать систему рейтингов!

Discussion in 'Кухня' started by Арбатовец, 7 Dec 2006.

  1. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
  2. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    143
    Да, занятный результат...
     
  3. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Причем допустим в больших шахматах - инфляция рейтинга возможна только у Суперэлиты (из-за наличия большого числа швейцарок, в которых только суперэлита может позволить себе не участвовать)
    Хотя частенько организуют несколько турниров с разными взносами в которых получается такое-же распределение согласно рейтингу (взносы разные, и зависят от рейтингов)
    Например в Питере - Два турнира мемориала Чигорина.

    А вот в блиц -
    В Питере принято делить на лиги по рейтингу...
    Именно эту ситуацию эмулирует программа - например 20 участников в каждой лиге, 5 лиг, реальная сила от 2000 до 2500, начальный рейтинг равен реальной силе (берется либо по разряду, либо исходя из рейтинга ФИДЕ), лиги согласно силе. И в итоге получает Высшая лига абсолютно нереальный рейтинг.
     
  4. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    И кстати, то что предлагается в (0) как раз и вызывает Гиперинфляцию рейтингов Элиты,
    а вот игра сильных и слабых игроков в смешанных турнирах - абсолютно честна и не искажает рейтинги.
     
  5. atoku
    Оффлайн

    atoku Модератор

    Репутация:
    0
    NS, +1

    На самом деле, чувствует мое сердце, что все это можно доказать и без программы, математически. Но без программы не докажешь это шахматистам.

    Господа, а ведь это бомба! По-сути, это развенчивает миф об элите. С другой стороны, мне кажется, еще в программе надо учесть среднюю вероятность ничьи.

    Кстати, было бы интересно проверить, кто на самом деле из "элиты" был бы выше в общем зачете, те кто при том же рейтинге делаеть больше ничьих или меньше? Вот это эксперимент! Может развенчать многие предубеждения :)
     
  6. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    В программе учитана средняя вероятность ничьи :)
    Она там считается по формуле предложенной разработчиками BayesElo, и проверенной на огромном числе результатов реальных партий.


    А математически - в высший лиге средний рейтинг растет при любом изменении состава,
    и никогда не может уменьшиться.
    (то есть высшая лига собирает на себе все колебания рейтинга в "+")
    А в низшей лиге - Средний рейтинг падает при любом изменении состава, и никогда не может увеличиться,
    при этом низшая лига собирает все случайные колебания рейтинга в "-"

    И существующее распределение рейтингов среди Элиты нарушает все законы статистики, когда группа лидеров должна играть примерно в одну силу - но на самом деле почему-то между ними весьма большая разница в силе - и тестовая программа показывает почему так получается.
     
  7. ProstoTak
    Оффлайн

    ProstoTak Старожил

    Репутация:
    1
    В том что у элиты завышен рейтинг виноват Иванчук. У него очень часты перепады формы. Когда у него спад он вылетает из элиты и идёт в народ. Со временем наступает очередной подъём силы Василь Михалыча и он, ободрав народ как липку на рейтинг, возвращается в элиту, где этот народный рейтинг во время очередного спада силы и сливает элите. Что делать тем кому не нравится, что у элиты завышен рейтинг? Нужно сделать Иванчуку предложение от которого тот не сможет отказаться. Суть предложения в том, чтобы когда Иванчук поднимет рейтинг в элите, не дожидаясь спада, мотнулся в народ и там слил свой рейтинг. А в очередном супере, куда его уже успеют пригласить пока он находился ещё в элите, опять обобрать элиту на рейтинг. Дождаться пригашения в очередной супер и опять слинять в народ сливать рейтинг.
     
  8. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Перепады Формы только убыстряют рост инфляции элиты, но и без перепадов формы инфляция рейтингов происходит достаточно быстро - просто на том что результат партии всегда случаен, а вероятности разных результатов зависят от разницы в силе.
    В матче равных соперников вполне возможен результат +5...+10, что и даст разброс рейтингов игроков с одинаковой силой в +-50 пунктов Эло.
    Нужны алгоритмы похожие на ЭлоСтат и БайесЭло (в приведенном выше случае они не дают сбоя), но учитывающие возможность изменения силы игроков во времени.
     
  9. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    NS, 5 баллов. Похоже действительно можно доказать что у элиты завышен рейтинг. Хорошо что рейтинги программ свободны от этого явления.

    Возможный вариант исправления системы: считать партии только за прошедший год. Для динамики можно пересчитывать каждый месяц (хоть каждый день), но считать только партии сыгранные не больше чем 365 дней назад от дня обсчёта. Считать программой Bayeselo (можно и ELOstat). В результате: инфляция отсутствует как класс, игрок который не играл год выпадает из рейтинг-листа что тоже неплохо. Можно даже позволить себе пару перепадов формы в год. Если год - слишком мало, то можно взять больший промежуток, но снизится динамичность.

    Нужно придумать как учитывать более старые партии с каким-нибудь маленьким коэффициэнтом, чтобы они имели меньше веса.
     
  10. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я в принципе способен написать программу для статистического расчета рейтингов с поправкой на динамику изменения силы во времени. Но могу приступить только в Январе.
    С математикой и ЭлоСтата и БайесЭло я знаком. В принципе ничего сложного.
    То есть не надо учитывать старые партии, рейтинг считается по полной базе, задается начальное распределение рейтингов, и распределение изменения (распределение дельты) в следующем году (в следующем периоде когда есть доступные партии того-же игрока).
    Метод такой-же - максимизация вероятности случившихся результатов.
     
  11. fso
    Оффлайн

    fso Учаcтник

    Репутация:
    0
    І все-таки треба врахувати, що майже _кожен_ шахіст еліти періодично спускається з небес на землю і перевіряє гравців нижчих ліг, погодьтеся.
    Бо у вас все-таки надто абсолютний поділ.

    Ну от Свідлер в Суперфіналі, Іванчук... Та майже всі.
     
  12. Васильок
    Оффлайн

    Васильок Гребенюк Семен

    Репутация:
    0
    fso, а ты об этом откуда знаешь? Неужели, ты к нам спустился с небес?
     
  13. fso
    Оффлайн

    fso Учаcтник

    Репутация:
    0
    Яких іще небес? :) Просто новини часом почитую, от і знаю. Та, може не до любителів спускаються, там уже й не цікаво спостерігати за рахунками 100-0, але до "звичайних смертних" гросів - так вже точно.

    До речі, повсюдне введення системи нокаутів для ВСІХ шахових турнірів швидко нівелює всякі там розбиття на ліги, кожен оупен буде супертурніром(в останніх турах), рейтинги можна буде рахувати за підсумками матчів, не буде проблеми з е-рейтингами чи бухальцями і т. д. і т. п. !!!
     
  14. Арбатовец
    Оффлайн

    Арбатовец Учаcтник

    Репутация:
    0
    Господа! Физик не потерпел бы мерительной линейки, сделанной из резины. Именно в подобную линейку превращается Эло-рейтинг при смешивание "сильно неравносильных" игроков. Зрить надо в корень - математическую формулу для коэффициента ЭЛО. Её надо адаптировать к контрастным швейцаркам. Эта задача для математиков. Дерзайте! ... И поменьше гонора, г-н Африканец! Молодость - не заслуга и к тому же продукт скоропортящийся. Умерьте своё высокомерие...
     
  15. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Математика доказывает что шкала Эло значительно лучше линейных шкал.
    Физик - потерпел бы. Кругом физические процессы описываются нормальным распределением, то есть как раз резинкой :)
     
  16. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Математика не знает слова "лучше". В противном случае она превращается в физику :)
     
  17. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Знает :)
    Прикладная математика. Все рассуждения по поводу преимущества того или иного выч. метода строятся на рассуждениях Лучше/Хуже.
    Например: Что лучше - NegaScout или чистая Альфа-Бета?