Философские проблемы ранжирования

Тема в разделе "Кухня", создана пользователем e271, 29 янв 2008.

  1. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Я тоже не говорил, что годится. Для оценки результата в турнире годится обычная система 0, 1/2, 1

    Что значит годиться? Как раз и НЕ ВСЕГДА. Действительно для "упорядоченного" турнира да. Но как тольуо вы переходите к достаточно большому круговику или швейцарке, то абсолютные очки просто не работают. Если конечно для вас законы логики что-то значат. И никакой Бергер в качестве доп показателя не спасает ситуацию

    А е рейтинг легко справляется с массивами от 2 до ..... (у меня 2000) Причем одной и той же логикой.
    http://potemkin.myff.ru/viewtopic.php?id=58



    Эло имеет другие цели. Уже это - недостаток. Соревновательный процесс один а логика кусочная...

    Жеребьевка первого тура в швейцарке, например
    Такую же функцию выполняет с успехом и е-рейтинг рассчитанный по предыдущим результатам
  2. Vladimirovich Консультант

    • Ветеран
    • Старожил
    Рег.:
    27.09.2006
    Сообщения:
    6.007
    Симпатии:
    810
    Репутация:
    31
    Адрес:
    https://quantoforum.ru/
    Оффлайн
    Уважаемый e271, заглядывал я на эту страничку, прежде чем с Вами говорить о e-рейтинге
    Эло проще - это мое IMHO. Я конечно велик :lol: но и у народа не плохо бы спросить.
    А почему бы и не взять логарифм? Ведь, если я правильно понимаю, имеют значение только разница рейтингов? А если x1>x2 то и ln(x1) > ln(x2). Это всего лишь иллюстрация к тому, что разница между делением и вычитанием с точки зрения алгоритма рейтинга качественно непринципиальна.
    Только количественно.

    Кстати, извините, Эло использует erf, а не логарифм. Почему - потому что erf это интеграл от распределения Гаусса. Вот оно и есть наиболее физично. Вы можете и arctg использовать, но слово физично здесь будет неуместно. Это будет всего лишь значить, что функция распределения не Гауссова а 1/(1+x2)

    Меня очень мало интересуют проблемы призового фонда :) . Большей частью размер последнего приза :) . Что находится в полном противоречии с интересами гроссмейстеров. Поэтому все разночтения в методике подсчета рейтинга с целью распределения призового фонда суть естественный шум на фоне антагонистических интересов играющих :)

    Сомнительное допущение. Не шахматное.

    Все участники равны, но некоторые равнее, чем другие :)
    Использование стартовых рейтингов означает большую точность в смысле предсказаний.
    Тем не менее, все это требует доказательств. В отличие от нХологов здесь все гораздо проще. Дискуссии не нужны. Собственно задача похоже лежит в области вариационного исчисления - подобрать f и k функции, обеспечивающие экстремум функционала. А вот функционал задается Вами, с учетом Ваших же критериев по справедливости или точности прогнозов. На базе известных турниров.
    Какие критерии, такой и результат будет.

    Признания могут быть произведены, когда будут показаны результаты сравнения e-рейтинга с другими методами в смысле предсказания. ( Найти экстремум функционала)
    Меня все пока устраивает. И как турниры считаются, и Эло в смысле сравнительной оценки игроков. Главное не делать из Эло культа.
    Еще раз подчеркну, что ЭЛО - это так, для грубой оценки. К букмекерам я с ним естественно не пойду :).
    По поводу итогов меня полностью устраивает текущая система, которя проще чем e-рейтинг в разы.

    Пожалуйста, определитесь с направлением дискуссии. Итоги и предсказания это действительно разные вещи.
  3. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Эло проще - это мое IMHO. Я конечно велик но и у народа не плохо бы спросить.

    С учетом Меня все пока устраивает.

    Предлагаю на этом остановитьься :)
  4. Magin Учаcтник

    • Участник
    Рег.:
    04.07.2007
    Сообщения:
    114
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Хм. Может, немного не в тему, но тоже задумался о системе "справедливого" расчета рейтинга. IMHO, вариация различных формул не может быть большой, так как довольно много инвариантов (логических ограничений).

    1. Мне нравится идея (инвариант) баланса. Я его понимаю так, что сколько игрок А получает пунктов рейтинга - столько же снимается с игрока Б (с которым сыграна партия или матч). Отсюда ясно, что ничья - это "0", "+1" - выигрыш, "-1" - проигрыш. Обозначая результат через w, получаем: w = [-1; 1], причем w(A) + w(Б) = 0.

    Если силы (рейтинг) игроков равны, то формула расчета очевидна:

    dR = k * w; (1)

    здесь k - количество пунктов за победу.

    2. Вторая идея (инвариант) тоже вроде как логична. Чем больше разница в классе между победившим и проигравшим, - тем меньше пунктов получает победитель и меньше снимается с проигравшего. И наоборот, если выигрывает слабейший - ему начисляется больше.
    При этом надо учитывать еще один инвариант - при любой разнице в силе выигравший всегда плюсует рейтинг, а проигравший минусует.

    Насколько больше - задаем следующим допущением. При разнице класса игроков (отношение рейтингов) в 2 раза, прирост рейтинга при выигрыше сильнейшего тоже должен быть меньше в 2 раза относительно прироста при равной силе игроков. При разнице в три 3 раза - прирост рейтинга меньше в 3 раза и т.д.


    Наличие разницы в классе приводит к появлению смещения (стоимости результата w) в формуле (1):

    dR = k * (w +/- h); (2)

    Знак "+" или "-" перед смещением зависит от того, рейтинг какого игрока рассчитывается. Для сильнейшего знак "-" (при победе он получит меньше), для слабейшего - "+". (Наверное, можно выразить и через логарифмы, но мы хотим сохранить прозрачным "физический смысл" формул).

    Смещение h лежит в диапазоне от 0 (равные по силе), до 1 (разница в классе огромна). Вычисляется просто:

    h = 1 - Rmin/Rmax; (3)

    здесь Rmin - рейтинг слабейшего игрока; Rmax - рейтинг сильнейшего.

    Теперь можно считать изменение рейтинга игроков после каждой партии. Далее в примерах везде k = 12 (пунктов).

    Пример 1. Силы игроков равны (h = 0).
    Тогда для w(A) = 1 (выиграл А), получаем: dR(А) = 12; dR(Б) = -12.

    Пример 2. Игрок А сильнее игрока Б в 2 раза (h = 0.5).
    Тогда для w(A) = 1, получаем: dR(А) = 6; dR(Б) = -6.
    При ничьей А теряет рейтинг: w(A) = 0: dR(А) = -6; dR(Б) = 6.
    При проигрыше: w(A) = -1: dR(А) = -18; dR(Б) = +18.

    Пример 3. Игрок А сильнее игрока Б в 3 раза (h = 2/3).
    Тогда для w(A) = 1, получаем: dR(А) = 4; dR(Б) = -4.
    w(A) = 0: dR(А) = -8; dR(Б) = 8.
    w(A) = -1: dR(А) = -20; dR(Б) = +20.

    Максимальная потеря (и прирост) рейтинга составляет 2k.
    Порядок выигрышей/проигрышей имеет значение (при условии, что рейтинг пересчитывается после каждой партии). Лучше выигрывать в конце (чем вначале). Но это вроде бы тоже выглядит логичным.

    Возможно, что стоит учитывать прочие "неравные условия" (фора, цвет, возраст :). С точки зрения предложенного подхода - это усложнение расчета смещения h.

    Общая сумма рейтингов в такой системе отражает количество шахматистов (при условии, что начальный рейтинг у всех одинаковый). Вообще баланс удобен тем, что можно считать различные "корреспонденции рейтинга", куда сколько утекло, откуда притекло.
  5. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Порядок выигрышей/проигрышей имеет значение (при условии, что рейтинг пересчитывается после каждой партии). Лучше выигрывать в конце (чем вначале). Но это вроде бы тоже выглядит логичным.

    Да это логично при прогнозировании. При определении СИЛЫ

    При ОЦЕНКЕ выполненной РАБОТЫ (результата) основное услсовие - равенство всех партий.
  6. Magin Учаcтник

    • Участник
    Рег.:
    04.07.2007
    Сообщения:
    114
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Да, возможно, что такой инвариант (независимость от порядка партий турнира или матча) имеет место быть. С точки зрения предложенного выше способа расчета такую независимость реализовать легко - надо результат (w) в формулах расчета приращения брать суммарный. Но вообще я в таком утверждении не уверен.

    Где проходит та граница гранулярности, в пределах которой промежуточные результаты не должны влиять на рейтинг? Это турнир (матч), серия турниров, или временной отрезок - квартал, год? Почему рейтинг (оценка работы, Вашими словами) после двух турниров должен (может) зависеть от порядка их проведения (обсчета), а в пределах одного турнира нет?

    В связи с этим вспоминаются протяженные во времени соревнования, типа первого матча Карпов-Каспаров. Ведь тогда по сути признали, что результат ничейный (такая субъективная оценка выполненной работы). Я думаю, что это на самом деле где-то близко к истине, если считать по предложенной выше системе. Пять первых выигрышей Карпова, последующие ничьи и три выигрыша Каспарова при пересчете каждой партии и дадут где-то равенство сил (рейтингов).

    Вообще интересно, как игроки отнесутся к тому, что можно вначале проиграть 5 партий матча, затем выиграть 4 и по итогам тебя признают победителем? По-моему, такая возможность разнообразит тактику матчевой борьбы. В конце концов, в забегах на длинные дистанции выигрывает не тот, кто дольше всех бежал первым, а тот, кто первым был на финише.

    Кстати, различные коэффициенты в швейцарках - это и есть попытка учесть (при равенстве очков), кому было труднее. При обсчете рейтинга после каждой партии подобного рода проблемы должны исчезнуть.
  7. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    после двух турниров должен (может) зависеть от порядка их проведения (обсчета), а в пределах одного турнира нет?

    Нет если мы не задаемся специально (например введя экспоненту времени) то все турниры имеют одинаковый вес и все партии тоже. Наша задача оценить РАБОТУ.

    Почему не должно быть зависимости от последовательности партий. Это вытекает из требования равных условий для всех. Допустим один участник встречается сначала с сильными а потом со слабыми а другой наоборот. Тогда первый будет иметь преимущество, поскольку его поражения в последовательном алгоритме "забудуться" а "победы" в последних турах запомняться. Но мы же договорились, что все партии должны иметь одинаковый вес.
  8. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Вообще интересно, как игроки отнесутся к тому, что можно вначале проиграть 5 партий матча, затем выиграть 4 и по итогам тебя признают победителем? Это справедливо при определении СИЛЫ, но не справедливо по отношению к выполненной работе.
  9. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кстати, различные коэффициенты в швейцарках - это и есть попытка учесть (при равенстве очков), кому было труднее. При обсчете рейтинга после каждой партии подобного рода проблемы должны исчезнуть.

    Если вы говорите об Эло то обсчет после каждого тура приводит к неравенству значимости партий.
    Что касается е-рейтинга, то здесь каждый раз пересчитываются ВСЕ результаты.

    Доп коэффициенты имеют существенный недостаток, который незаметен в однородных турнирах но сильно проявляется в неоднородных. Ведь доп коэффициент ВСЕГДА меньше чем пол очка. Благодаря этому возникает ущербная стратегия "прохода по тылам" Когда игроку выгодно проиграть в первых турах чтобы потом играть с более слабыми соперниками.
    Уже одного этого уродливого явления достаточно чтобы похоронить абсолютные очки (по крайней мере в швейцарках. Но увы костность она на то и костность ....
  10. Magin Учаcтник

    • Участник
    Рег.:
    04.07.2007
    Сообщения:
    114
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Я что-то теряю нить - что понимается под РАБОТОЙ? Кто больше всех выполнил работы в турнире - это что дает? Первое место или что? Работу шахматиста можно оценить количеством выполненных им ходов (продолжительностью партий) и дать за это приз. Но мы же вроде о другом? О результатах?

    Я не увидел (или не понял) неравенства условий. Надо пример более конкретный, чтоб можно было посчитать - формулы-то простые.

    Я небольшие прикидки провел. Допустим, два игрока, А и Б, имеют перед турниром одинаковый рейтинг R. При этом они последовательно встречаются с игроками В и Г. В - игрок с высоким рейтингом (в 2 раза больше R), а игрок Г - с низким (в 2 раза меньше R). В первом туре А встречается с В, а Б - с Г. А проигрывает, Б выигрывает. Во втором туре наоборот. И А и Б набирают по очку (у слабого), но в разном порядке.

    Так вот, расчет (по приведенным выше формулам) показывает, что если не учитывать изменение рейтингов игроков Б и Г после первого тура, а считать их постоянными (как будто это игроки с постоянным рейтингом в каждом туре), то действительно выгодно вначале проиграть сильному (В), а затем выиграть у слабого (Г) - итоговый рейтинг у игрока А выше. Если же учитывать изменение рейтингов В и Г после результатов 1 тура, то ситуация меняется на противоположную - выше рейтинг у Б (прирост рейтинга А во 2 туре мал). Так что все не так однозначно.

    И вообще при учете изменения рейтинга Г (после первого тура) нельзя однозначно утверждать, что выгоднее для А - выигрывать у слабого и проигрывать сильному, или наоборот. Все зависит от результата Б и Г.

    Короче, в шахматы надо играть, а не "расклады прикидывать". Все эти "выгоды" - это доли процента рейтинга. При распределении мест организаторы могут их не учитывать. То есть коэффициенты Бухгольца и пр. при предложенном способе расчета - это всего лишь точность обсчета - сколько знаков в итоговом изменении рейтинга учитываем - и не надо ничего придумывать.
  11. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    :)


    Работа - тот труд, который совершил шахматист.

    РАБОТА = ЧИСЛО ПАРТИЙ * УРОВЕНЬ
    УРОВЕНЬ - е-рейтинг.
    как приближенная оценка - некая логарифмическая функция от перформанса ЭЛО.

    В круговике или в швейцарке где число партий одинаково РАБОТА пропорциональна е-рейтингу.

    Таким образом е-рейтинг с одной строны является мерилом работы или распределения призового фонда а с другой стороны как инструмент прогнозирования в предположении что в ближайшем будущем все будет так как было в прошлом.
  12. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Так что все не так однозначно.
    Да конечно. Главное что НЕРАВЕНСТВО есть
  13. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    И вообще при учете изменения рейтинга Г (после первого тура) нельзя однозначно утверждать, что выгоднее для А - выигрывать у слабого и проигрывать сильному, или наоборот. Все зависит от результата Б и Г.

    Дело не в том что нельза предсказать а в том что УСЛОВИЯ НЕ РАВНЫЕ. Бегуны бегут по дистанциям разной трудности, котороая определяется жребием. Ну типа проводим соревнования по бегу но дистанция у одних 90 у других 110 ... :)
  14. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Короче, в шахматы надо играть, а не "расклады прикидывать".
    :) Ну мы же не это обсуждаем.
    Вот смотрите. Турнир чемпионата мира. Ставки на сотни тысяч. Расписано все до мельчайших деталей. А итог определяется ЛАПТЯМИ. Ну типа повар готовил сто блюд пришли гости свалили все в один чан и раздали...

    Все эти "выгоды" - это доли процента рейтинга.
    Иногда именно они определяют чемпион ты или нет. Да что там говорить один темп и ты в дамках или наоборот :)
  15. Magin Учаcтник

    • Участник
    Рег.:
    04.07.2007
    Сообщения:
    114
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Не согласен с такой аналогией. Дело в том, что мы не распределяем трудные и легкие дистанции заранее. Никто заведомо не знает, у кого дистанция окажется труднее. Мы считаем рейтинг по ходу для всех, никакого неравенства.

    Вот если бы в одном турнире один играл все время с сильными и набрал на полочка меньше чем тот, который играл все время со слабыми - тогда да, присуждение победы по очкам несправедливо. Но при рейтинговом обсчете такая ситуация просто невозможна - за победу над слабым дают мало пунктов.

    Я уже приводил примеры выше, - поэтому повторюсь. Замораживание рейтинга игроков в процессе турнира или матча - это и есть, IMHO, неучет реальной ситуации.
  16. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    (Провокационная тема, поэтому не удержался)

    По-моему Е нечётко поставил вопрос. Ранжирование это ведь просто определение порядка, как 1-й, 2-й и т.д. Ранжирование не может точно предсказывать будущие результаты, для предсказаний нужно больше данных. Наверное имелось ввиду "для чего считают рейтинг?".

    Сразу нужно заметить что оценка прошлых достижений это очень субъективный вопрос. Ведь достижения можно оценивать очень по-разному. Например, как суммарный уровень турниров выигранных участником. Или как "работу" - число партий * уровень © Е. Или как угодно ещё. Нужно как-то выбрать единую систему или хотя бы принцип оценки достижений, с которым все были бы согласны (более или менее). По необходимости таким принципом как раз и является привязка оценки прошлых достижений к предсказанию будущих результатов. Это даёт оценке достижений объективность. Многие (как показывает эта ветка) не отдают себе отчёт в необходимости такой привязки. Рейтинг, оценивающий прошлые достижения, обязан быть эквивалентен рейтингу, предсказывающему будущие результаты, иначе дискуссия просто теряет смысл. Так как понятия о справедливости у каждого свои.

    Тут нужно заметить что хотя эквивалентность рейтинга для оценки прошлого и для предсказания будущего - это неоходимость, одномерность рейтинга необходимой не является. Мы используем одномерные рейтинги только потому что они проще. (Их проще считать, публиковать, сравнивать, меряться ими, и т.д.) Я считаю что одного измерения мало для точных предсказаний человеческих результатов - слишком много факторов остаются неучтёнными. Главный фактор это динамика силы игры от времени. Кто-то может играть ровно, кто-то чередовать взлёты и падения, кто-то просто быстро растёт, кто-то наоборот стареет. Вероятность роста или падения и его скорость у каждого своя. Но система ЭЛО использует для всех одну формулу.

    Есть, конечно, множество методов рассчёта рейтинга. Это обусловлено тем, что до сих пор никто не занялся серьёзно сравнением и оценкой разных способов. Нужно провести серьёзную работу на реальных данных, и установить какой метод получает рейтинги более точно предсказывающие будущие результаты. Этот метод и нужно использовать. Но пока что используются методы полученные на глаз.

    О е-рейтинге. Я понимаю что можно нарисовать красивые формулы, и на примере двух-трёх турниров показать "справедливость". Вместо этого нужно на большом объёме реальных данных показать что е-рейтинг лучше других систем. То есть, что он предсказывает будущие результаты точнее чем ЭЛО (как минимум). Пока этого нет все разговоры будут пустыми. Система ЭЛО - это стандарт для рассчёта человеческих рейтингов. Чтобы заменить стандарт на что-то новое нужны твёрдые цифры. (На случай если я ошибаюсь и е-рейтинг не претендует на замену ЭЛО, тогда вопросов конечно нет).

    Одной из актуальных проблем человеческих рейтингов является их инертность. Но это проблема не метода а реализации. Рейтинги нужно обсчитывать и публиковать каждый день или хотя бы каждую неделю, а не раз в несколько месяцев как сейчас. Конечно для этого нужно выделить средства, нанять специалистов (например меня), время на разработку.

    Кстати, одномерные рейтинги, мне кажется, неплохо подходят для оценки силы программ. Так как программы не меняют силу игры от времени (если обучение выключено). Многомерные рейтинги могут помочь и здесь, но для программ это менее актуально.
  17. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кирр
    Нужно провести серьёзную работу на реальных данных, и установить какой метод получает рейтинги более точно предсказывающие будущие результаты. Этот метод и нужно использовать. Но пока что используются методы полученные на глаз.


    Пожалуйста
    http://www.mratings.com/cf/compare.htm
    http://rsport.netorn.ru/cf/rankrank.htm
    http://www.nutshellsports.com/wilson/
  18. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Тут нужно заметить что хотя эквивалентность рейтинга для оценки прошлого и для предсказания будущего - это неоходимость, одномерность рейтинга необходимой не является.

    При оценке прошлого одномерность рейтинга необходимомть, поскольку решается задача отбора. Для прогнозирования естественно желателен многомерный рейтинг.
    Здесь и происходит стыковка
    Мы имеем реальность последовательную и многомерную
    Оценивая пришлое мы пренебрегаем последовательностью (е-рейтинг)
    Для прогнозирования пренебрегаем многомерностью (Эло)

    Естественно что используя е-рейтинг мы можем прогнозировать (пренебрегая динамикой результатов) Таким образом полагая что серия 00001111 ничем не отличается от серии 11110000. е рейтинг дает 50% на 50% Эло в этом случае даст например 55% на 45% является ли различие в 5% значимым зависит от стат характеристик событий .

    Точно также мы можем использовать Эло для оценки прошлого.
    матрицу

    А Х 1 1 0 1
    B 0 Х 1 1 1
    C 0 0 X 1 1
    Е 1 0 0 X 0
    D 0 0 0 1 X

    Эло оценит для Е также как и матрицу (при одинаковой последовательности побед и поражений)

    А Х 1 1 1 0
    B 0 Х 1 1 1
    C 0 0 X 1 1
    Е 0 0 0 X 1
    D 0 0 0 0 X

    А е-рейтинг по разному (пренебрегая ролью последовательности)

    НО! Для оценки прошлой работы важна именно независимость от последовательности. Разгружая вагон нам не важно в какие минуты вы тащили мешок а в какие не тащили. Важно что вагон разгружен зп определенный период.
  19. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кирр
    Рейтинг, оценивающий прошлые достижения, обязан быть эквивалентен рейтингу, предсказывающему будущие результаты, иначе дискуссия просто теряет смысл. Так как понятия о справедливости у каждого свои.

    Но предсказывающий не в смысле букмеккерской, а в смысле сравнения массивов.

    Ранжирование "на будущее"
    должно обеспечить максимально верное предсказание не на победу с определенным соперником а на победу со случайным соперником. И здесь мы вновь приходим к ОДНОМЕРНОМУ ранжированию. А у букмеккеров вы имеете дело с определенным соперником.
  20. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кирр
    (Провокационная тема, поэтому не удержался)

    Ты как будто оправдываешься перед группой товарищей :)
  21. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Не понял, при чём тут эти ссылки о футболе?

    И, e271, научитесь наконец пользоваться тегом quote! А то невнимательный читатель может подумать что мои умные мысли в ваших постах - на самом деле ваши! Это просто. Всё что сказано не вами окружаете тегами [ quote] и [ /quote] (без пробела после '[').
  22. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кирр
    Не понял, при чём тут эти ссылки о футболе?


    В этой теме нет никакой разницы футбол, шахматы или бкг в мешках. Проблемы ранжирования на основе модели парного сравнения одни и те-же. Математика одна и таже. В тех ссылках которые я привед в ответ на твое восклицание, что надо бы этим заняться, более 100 различных алгоритмов. Примерно 50% "Эло-образные" 20% "е-образные" и 30% - "без-образные" т.е. эмпирические, "коммерческие". И кроме того 2 модели "переборные" то есть проблема ранжирования решается в лоб перебором с минимизацией ошибок.

    На своей странице я их ранжирую с учетом веса ошибок...
  23. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Для точного прогнозирования желателен многомерный рейтинг, тут мы похоже согласны друг с другом. Но, как я показал, для объективности оценки прошлого нужно чтобы использовался тот же рейтинг что и для предсказаний будущего, то есть тот же многомерный. Значит нужно наряду с рейтингом (многомерным) иметь и способ его проекции на одну ось. Это несложно придумать, но это зависит, конечно, от структуры рейтинга (от смысла его измерений).

    Вот вариант универсального способа получения рангов из многомерного рейтинга: Симулируется виртуальный круговой турнир (два круга, например), состоящий из всех участников. Результаты турнира предсказываются по рейтингам (так как рейтинг у нас многомерный и оптимизирован для предсказаний). По результатам считаются абсолютные очки и всё, готовы ранги. Конечно нужно либо сразу считать всё как распределения вероятностей, либо повторять симуляцию много раз.

    Не понял, как можно пренебрегать динамикой результатов. А если серия 00001111 растянута на 10 лет? Тогда тоже можно пренебречь динамикой? В этом ведь и сложность человеческих рейтингов что нужно учитывать динамику. И ЭЛО учитывает динамику.

    Во второй матрице ошибка. А вообще вы этим примером с двумя матрицами что хотите сказать? Что е-рейтинг лучше чем Эло? Непонятно.. Вижу что оценят по-разному, и что?

    Если считать независимо от последовательности, то есть резальтаты 10-летней давности обсчитывать наравне со вчерашними, то такой рейтинг не сможет ничего предсказывать. Следовательно он не будет являться объективным и по отношению к прошлому. То есть это будет просто некий субъективный способ оценки прошлых заслуг, один из миллиона возможных, ничем реально не обоснованный.
  24. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    А то невнимательный читатель может подумать что мои умные мысли в ваших постах - на самом деле ваши! :D:lol::D

    Ну сам понимаешь. Сейчас всем трудно .... :)
  25. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн

    Кирр
    Значит нужно наряду с рейтингом (многомерным) иметь и способ его проекции на одну ось. Это несложно придумать, но это зависит, конечно, от структуры рейтинга (от смысла его измерений).


    Это и делает е-рейтинг. Напрямую. То есть не через трансформирование "парных рейтингов" а влоб на прямом анализе результатов в предположении что все партии имеют одинаковый вес независимо от последовательности.

    Матрицы поправил

    Я коворю не о том что лучше и хуже. Я сравниваю два подхода последовательный и параллельный и где когда и почему он соответствует логике задачи
  26. Vladimirovich Консультант

    • Ветеран
    • Старожил
    Рег.:
    27.09.2006
    Сообщения:
    6.007
    Симпатии:
    810
    Репутация:
    31
    Адрес:
    https://quantoforum.ru/
    Оффлайн
    :D
  27. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Каждому - свое. :)
  28. Kirr Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    1.208
    Симпатии:
    22
    Репутация:
    8
    Оффлайн
    Что-то мне не очевидно что нет разницы. В фуболе иногда бывают соревнования где нет ничьих. Тепмы роста/падения, вероятность и амплитуда колебаний силы в футболе могут отличаться от шахматных. Универсальности силы игры или зависимость силы игры от конкретного соперника - может отличаться между футболом и шахматами. Общее число участников в футболе и в шахматах отличается на порядки. Распределение силы по множеству участников тоже наверное отличается. Отличий хоть отбавляй. По-моему это ещё нужно доказать что футбольные выкладки применимы к шахматам и наоборот. Например, футбол и волейбол я бы ещё понял... Или может шахматы и шоги.. А такие разные виды как футбол и шахматы... Уж лучше бег в мешках, он хоть не командный. :)

    Кстати, в шахматах количество соревнований и результатов на порядки больше чем в футболе. Это большой плюс, так как можно точнее настроить и точнее оценить качество рассчёта рейтингов. Следовательно для оценки шахматных рейтингов естественно и правильно использовать шахматные данные.
  29. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Кирр, я не обманываю :) Математика (алгебра) одна и та же. Меняются константы.

    Маленькое замечание - речь идет об АМЕРИКАНСКОМ ФУТБОЛЕ. Там в 1А лиге играет 120 команд 12 туров (чем не швейцарка) Но футбол не шахматы и оперативная жеребьевка не приемлема в силу организационной инертности футбола. Это же не со стола на стол пересесть. Там проблема ранжирования стоит остро. Надо определить пару участников финального матча. Это тебе не матч Крамник-Ананд. Тут деньги серьезные ...

    Еще раз Crestom Богом клянусь с точки зрения математики и шахматы и конкурс пианистов им Чайковского - одно и то же :)

    Чего они там делают НЕВАЖНО важно что один сравнивается с другим итог сравнения - А лучше Б (больше, сильнее, меньше, быстрее, точнее, красивее, хитрее, и тд) И таких сравнений - матрица. или точнее КУБ с учетом последовательностей. Вот его и надо упорядочить
  30. Chess diletant Учаcтник

    • Участник
    Рег.:
    02.02.2007
    Сообщения:
    324
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Не хочется вступать в дискуссию, но вот этого места не понял. Простите пожалуйста, а как их не учитывать с разныим весом? Для оценки силы Ананда нужно учитывать его результаты в 15 летнем возрасте? Нет, наверное. Поэтому любой механизм подсчета обрезает старые результаты, придавая больший вес новым. Система Эло делает это экспоненциально (аккуратно). Если же например как в теннисе придать соревнованиям равный вес и просуммировать/усреднить все за какойто период (например перфоманс), то обрезание осуществляется более грубо -просто входящим в этот период присваивается вес 1 и 0 всем остальным. Так что любая система учитывает партии с разным весом, иначе бы самая первая партия шахматиста учитывалась бы наравне с самой последней.
  31. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    не учитывать с разныим весом? Для оценки силы Ананда нужно учитывать его результаты в 15 летнем возрасте?

    Если хотим оценить СИЛУ в данный момент - НАДО УЧИТЫВАТЬ

    Если хотим оценить УРОВЕНЬ зв какой-то период (выполненная работа = УРОВЕНЬ на число нартий) то НЕ НАДО

    Дело тут вот в чем. Мы хотим оценить деятельность за какой то период. Выбираем показатель (в данном случае уровень) Естественно мы должны считать, что он жестко привязан к к объекту ранжирования (шахматисту) И не изменяется во время процесса, а зависит от всего массива информации ЦЕЛИКОМ.

    Кстати. Почему Эло не годиться (в философском конечно плане) для ранжирования с целью оценки прошлого периода. Да потому что "последовательный конус" не охватывает всего массива результатов.

    НО! Результат - партии величина релятивистская. Если завтра вы выиграете у Cresta мы не можем определенно утверждать что вы сильнее его играете (ну например на Эло 2100 :) ) Вполне возможно что он просто заболел корью. Вот если и дальше он будет проигрывать таким чайникам как Вы, то тогда мы посчитаем что он просто сдал. А если будет выигрывать у таких монстров как я, то будем считать вас сильнее Чича :) Треп :)
  32. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Так что любая система учитывает партии

    Не любая, а та каторая заточена на прогноз
  33. Magin Учаcтник

    • Участник
    Рег.:
    04.07.2007
    Сообщения:
    114
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Вот же, ввязался в тему... Абсолютно незапланированные затраты времени.
    Мне как-то с формулами легче понимать, кто о чем говорит и что предлагает. Поэтому снова о правильной формуле.
    С утра понял, что на самом деле все еще проще.

    1. Сила игроков относительна. Поэтому сравнивать силу игроков следует через отношение их рейтингов: R1/R2. (В логарифмической шкале - разность).
    2. Если отношение рейтингов двух игроков равно 2 (один сильнее другого в 2 раза), то это означает, что в матче сильнейший должен набрать 2/3 очков (а другой 1/3) - прогнозирование.
    3. Поскольку шкалы все относительные, то результат партии w не может быть отрицательным. w(А) + w(Б) = 1. При ничьей, соответственно, w(А) = w(Б) = 0.5.
    4. Вводим коэффициент k - это процент рейтинга, который проигравший отдает победителю. От величины этого коэффициента зависит скорость адаптации (перетекания) рейтингов.
    5. Теперь получаем формулу для расчета приращения рейтинга игрока А:

    dR(A) = k* (w(А)*R(Б) - w(Б)*R(А)); (1)

    Для игрока Б - симметрично. Сумма приращений равна 0.
    Смысл формулы (1). При победе игрока А ему переходит доля рейтинга Б, а при поражении А отдает Б долю своего рейтинга. Таким образом учитывается, что выигрывать выгоднее у сильных - больше очков получаем. В то же время проигрывать - все равно кому - отбирается одна и та же доля.
    При ничьей мы частично отдаем свой рейтинг - частично получаем рейтинг соперника, - в выигрыше тот, у кого был меньший рейтинг. Все логично.

    Демонстрационные примеры.
    1. Сила игроков равна. R(А) = R(Б) = 1000 (у.е.). k примем равным 5%. Тогда при выигрыше А (или Б) получит 50 пунктов. При ничьей рейтинг не изменится.

    2. Силы игроков отличаются в 2 раза. R(А) = 2000 у.е. R(Б) = 1000 у.е. При выигрыше А получит также 50 пунктов. При проигрыше отдаст 100 пунктов. При ничьей А отдаст 25 пунктов.

    3. Проверим формулу (1). Предположим, что сила игроков также отличается в 2 раза и между ними проведен матч. Как указано выше, если сильнейший набрал 2/3 очков, то рейтинг игроков должен остаться неизменным. Подставляем величины в (1):

    dR(A) = k* (2/3*1000 - 1/3*2000) = 0, независимо от k.

    Таким образом, формула (1) справедлива как для оценки результата, так и для предсказания. Думаю, что единственно справедлива.
    Пересчитывать ли рейтинги после каждой партии (что на мой взгляд более логично) или для всего матча (турнира) в целом - это, ИМХО, вторично.

    От абсолютных рейтингов, ес-но, можно перейти к логарифмам, - удобнее вычитать, чем делить.
  34. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Ну да это последовательный алгоритм. Правбда однобокий, поскольку вы смотрите только со стороны побед. Теперь все тоже проделайте с пораженияси и решите что делать с двумя равноправными ранжированиями...
    Когда мы берем просто аьсолютные очки то ранжирования по победам и поражениям тождественны (при одинаковом числе партий) Поэтому никто и не ставит вопроса какое правильнее. А у вс есть еще и альтернативное, равноправное ранжирование.
  35. evgeny Старожил

    • Ветеран
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    5.028
    Симпатии:
    9
    Репутация:
    0
    Оффлайн
    Вот и 1-й нонсенс. Почему игрок А получает одинаковый бонус (50) за выигрыш как у равного, так и в 2 раза более слабого соперника?

Поделиться этой страницей