Империя кривых зеркал

Тема в разделе "Кухня", создана пользователем e271, 4 май 2006.

  1. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  2. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  3. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  4. chich Учаcтник

    • Участник
    Рег.:
    11.02.2006
    Сообщения:
    3.535
    Симпатии:
    12
    Репутация:
    1
    Адрес:
    Воронеж
    Оффлайн
    где тонко - там и рвётся :D
  5. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    @
  6. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Лучший шахматист 2006

    Это как зараза, все время какие-то новые турниры добавляются. Но в общем-то ситуация с первой полусотней прояснилась.
  7. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Вейк 5-й тур

    Карякин третий не смотря на 50% результат. Все дело в том, что он единственный кто отхватил пол победы у Раджабова ... А победы над Шировым в этом турнире мало чего стоят...

    ————————————
    У Непомнящего в турнире С количество побед и ничьих такое же как и у Раджабова, но "качество" соперников (с турнирной точки зрения" выше и его достижения соответственно оцениваются выше...

    Любопытным интересно будет посмотреть почему 4,5 очка Непомнящего в полтора раза ценнее очков Раджабова...

    Такая разница как бы говорит нам, что шансов победить в турнире у Непомнящего больше чем у Раджабова
  8. vstorone Учаcтник

    • Участник
    Рег.:
    11.09.2006
    Сообщения:
    344
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    У Раджабова еще все впереди. И Крамник, и Топалов, и Ананд. Поэтому абсолютные очки будем после 13 туров считать. Топалов может любому накатить по самое не могу.
    Но играет Раджабов очень хорошо. Заглядение.
    Непомнящий тоже хорошо играет. Свежо, изобретательно, завлекательно.
    А главное достижение Е-рейтинга для меня заключается в том, что начинаешь учитывать выводы Е, вспоминая прошедшие турниры :) Этого уже не смыть. Очень интересно посмотреть что Е-рейтинг говорит по поводу состоявшихся баталий.
  9. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    После пяти туров Элостат:
    Код:
      1 Radjabov,T                     : 3053
      2 Anand,V                        : 2878  
      3 Aronian,L                      : 2830  
      4 Karjakin,Sergey                : 2808   
      5 Topalov,V                      : 2806  
      6 Navara,D                       : 2794  
      7 Ponomariov,R                   : 2759  
      8 Kramnik,V                      : 2755  
      9 Motylev,A                      : 2733   
     10 Svidler,P                      : 2698  
     11 Van Wely,L                     : 2693  
     12 Tiviakov,S                     : 2642  
     13 Carlsen,M                      : 2633  
     14 Shirov,A                       : 2419
  10. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Спасибо NS
    Было интересно посмотреть какие искажения вносит performance Elo. Для интересующихся поясню почему именно в алгоритме Эло искажения а не в е-рейтинге. По смыслу перформанс это оценка выступления в ДАННОМ турнире. Без относительно регалий участников по прошлым достижениям. Вот например Широв в этом турнире выступает плохо (надеюсь пока) Естественно что победы над ним должны оцениваться невысоко. А исходя из Эло performance мы считаем что Алексей выступает сильно ...
  11. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    ЭлоСтат не использует предыдущих результатов. Он считает максимизируя плотность вероятности исходя из равномерного начального распределения рейтингов всех участников (по всей оси)
    То есть он выдет наиболее вероятные рейтинги участников исходя из текущих реузльтатов, и исходя из равномерного распределения (все участники изначально в равных условиях)
  12. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Perfomance Elo конечно вносит серьезные искажения, но с ростом количества партий результаты выравниваются.
    И у Perfomance Elo есть еще одна проблема - в случае малого количества участников (например матч) - он выдает вообще непонятно что...

    Это естественно, поскольку Эло не физическая а статистическая модель.. Е
  13. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  14. СС Учаcтник

    • Участник
    Рег.:
    13.02.2006
    Сообщения:
    1.071
    Симпатии:
    0
    Репутация:
    0
    Адрес:
    Москва
    Оффлайн
    Очень смешные картинки.
    Особенно понравился Раджабов (на привале) и банковские гарантии. Но и остальные хороши.
    Растёт большой художник!
  15. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Элостат после шести туров - уже большое расхождение.
    По Элостат Карякин на восьмом месте.
    Код:
        Program                          Elo    +   -   Games   Score   Av.Op.  Draws
    
      1 Radjabov,T                     : 2975  320 212     6    83.3 %   2696   33.3 %
      2 Kramnik,V                      : 2842  268 112     6    66.7 %   2722   66.7 %
      3 Anand,V                        : 2826  230 215     6    58.3 %   2768   50.0 %
      4 Aronian,L                      : 2821  268  65     6    58.3 %   2763   83.3 %
      5 Ponomariov,R                   : 2814  174 174     6    50.0 %   2814   66.7 %
      6 Navara,D                       : 2810  174 174     6    50.0 %   2810   66.7 %
      7 Topalov,V                      : 2799  268 112     6    66.7 %   2678   66.7 %
      8 Karjakin,Sergey                : 2795  268  65     6    58.3 %   2736   83.3 %
      9 Svidler,P                      : 2726  174 174     6    50.0 %   2726   66.7 %
     10 Motylev,A                      : 2709   65 268     6    41.7 %   2767   83.3 %
     11 Van Wely,L                     : 2669  215 230     6    41.7 %   2728   50.0 %
     12 Tiviakov,S                     : 2664  112 268     6    33.3 %   2784   66.7 %
     13 Carlsen,M                      : 2659  112 268     6    33.3 %   2780   66.7 %
     14 Shirov,A                       : 2390  322 183     6     8.3 %   2807   16.7 %
  17. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    А ты не мог бы поподробнее описать алгоритм Элостата. Все равно он должен базироваться на каких-то исходных рейтингах иначе откуда эти значеоия тапа 2700 и тд ведь вполне могли бы быть и 1230 И так что бы всем был понятен механизм начисления очков...
  18. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Цифры от привязки среденего рейтинга к 2750.
    Вообще алгоритмы простые, вариантов несколько.
    Первый, наилучший :)
    Берем Функцию от Вектора рейтингов участников. (Функция нескольких переменных)

    В качестве значения Функции берем вероятность всех свершившихся исходов при заданных рейтингах
    (произведения вероятностей каждого исхода)
    Для подсчета такой вероятности нам нужна Вероятность ничьи!!!! зная вероятность ничьи - вероятности победы и поражения мы в каждой партии можем посчитать исходя из разницы рейтингов по формуле Эло.


    Теперь задаем начальные рейтинги (например 2750) и любым спуском начинаем максимизировать значение функции. Если например градиентным спуском, то каждый раз приводим вектор спуска к виду когда сумма значений изменений по измерения равна нулю (после каждой итерации рейтинг средний рейтинг не меняется)
    Спуски в этом случае сходятся очень хорошо, и мы достаточно быстро находим значения рейтингов максимизирующие вероятность.


    О чем говорят полученные рейтинги? Это наиболее вероятная сила участников матча, сила при которой вероятность всех случившихся исходов максимальна.

    Могу выслать исходники моей программы (не Элостата) для подсчета рейтингов - считает мат. ожидание, доверительные интервалы, наиболее вероятные рейтинги.

    Возможен более простой вариант - получение рейтингов минимизирующих сумму квадратов отклонений результатов каждого учатника от расчетных по формуле Эло исходя из рейтингов соперников.
    Так-же минимизировать значение этой функции можно любым спуском.

    Результаты получаются примерно такими-же, как и в случае максимизиции вероятности.
  19. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Пришли, а еще лучше зашей туда алгоритм е-рейтинга...
    —————-
    Принципиальное отличие как я понял от е-рейтинга в том, что сам "результат" рассматривается как абсолютная величина. то есть все здание строится на гипотезе что все победы одинаковы ...
    А е-рейтинг использует предположение что все победы над одним и тем-же соперником одинаковы ...
    И второе... В элостате ПОБЕДА = - ПОРАЖЕНИЕ. А е рейтинг не устанавливает такую связь.

    А кстати. Если поменять победы на поражения и просчитать рейтинг слабости что получится? Точно то же самое?
  20. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Да. Если поменять результаты на противоположные - произойдет изменение знака отклонения рейтинга на противоположный.
    Все методы статистического расчета рейтингов оперируют формулой
    P(Победы)+P(Ничьи)+P(Поражения)=1
    И P(Победы)+P(Ничьи)/2 (а это мат. ожидание результата) равно значению расчитанному по формуле Эло исходя из разницы (предполагаемой разницы) в рейтингах соперников.

    // Я сейчас посчитаю что получается если использовать более простой метод - минимизации суммы квадратов отклонений.
  21. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Нет, в Элостате и БайесЭло тоже все победы не одинаковы, так как используется вероятность, а в ней в качестве сомножителя используется вероятности исходов в конкретных партиях.
    Так что разные победы ценятся совсем по-разному.

    То есть победа над аутсайдером не дает ничего, а вот поражение от него значительно понизит силу.
    Так-же и с лидерами - Поражение от них значительно рейтинг не ухудшит, а вот победа - значительно увеличит.
  22. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    В турнире где результаты более менее "правильны" любая статистика работает одинаково... Но вот в "кривых турнирах" абсолютная база дает сбой, тогда как "относительная" продолжает работать более менее устойчиво. Хотя конечно только в первом приближении...
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Так Элостат и БайесЭло - как раз относительные методы :)
    Единственная их проблема - максимизировать вероятность Вручную невозможно!
    Нужны выч. методы и выч. мощности :)

    А вот метод минимизации суммы квадратов отклонений - это уже абсолютный метод ( то есть метод который привязывется только к текущему результату и к набору соперников, но неучитывающий результаты в каждой отдельной партии ), и при малом количестве партий и кривых реузльтатах - он может давать сбой.
  24. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Все пошел играть, вечером вернусь - продолжим... Если есть возможность зашить е-рейтинг в прогу - зашей ...:) и пришли, а то я все вожусь с допотопным ехелем :)
  25. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    ОК, пришлю.

    ЗЫ. Эксель тоже очень мощная штука - в ней всё это тоже реально посчитать (в Экселе встроенный VBA - Вижал Бейсик)
  26. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Слава Богу с Ехелем 20 лет кувыркаюсь :)
  27. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Вот значения посчитанные методом наименьшей суммы квадратов.
    Так-же ижет привязка к среднему рейтингу 2750.
    Первая цифра - посчитанный рейтинг участника, вторая - средний рейтинг соперников.

    3006 2686 "Radjabov,T"
    2864 2713 "Kramnik,V"
    2821 2759 "Anand,V"
    2818 2735 "Karjakin,Sergey"
    2812 2752 "Aronian,L"
    2811 2668 "Topalov,V"
    2811 2812 "Ponomariov,R"
    2809 2810 "Navara,D"
    2726 2712 "Svidler,P"
    2700 2761 "Motylev,A"
    2660 2726 "Van Wely,L"
    2648 2785 "Tiviakov,S"
    2643 2767 "Carlsen,M"
    2371 2814 "Shirov,A"

    Но это менее точный метод.
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Сейчас посчитаю наиболее вероятные сам, а то ЭлоСтат-у я не очень-то и доверяю... :)

    Программу вечером выложу в свободный доступ - на входе PGN, на выходе рейтинги и ранжирование тремя способами - метод наименьших квадратов, метод E, и метод максимизации вероятности.
    Последний - самый точный.

    Могу еще добавить Perfomance Elo - Только зачем он нужен?
  29. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Что получилось...
    Что если за вероятность победы берем P(Win)*P(Win)
    Вероятность ничьи 2*P(Win)*P(Lost)
    Вероятность поражения P(Lost)*P(Lost) - Где P - мат. ожидание по формуле Эло,
    То Формулу Эло мы не нарушаем (в отличии от BayesElo),
    и самое главное - получаем результаты абсолютно идентичные результатам полученных при помощи метода наименьших квадратов

    Что тогда выдает Элостат - я не знаю, явно они где-то перемудрили/напортачили.
  30. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    По моему убеждению любые численные методы не имеют большого смысла, поскольку невозможна их содержательная интерпретация. И кроме того, можно использовать просто прямой метод перебора без всякой числовой оценки..
    Важно чтобы при ранжировании испльзовались какие-то разумные гипотезы, которые сами участники могли бы принимать или отвергать...

    Например. Все победы над одним и тем же участником стоят одинаково в данном соревновании. То есть мы считаем что свойства участников на протяжении турнира не изменяются. Конечно это может быть и не так, но тогда несколько размывается само понятие соревнования ...
  31. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Как это невозможна содержательная интерпретация? :)
    Наиболее вероятный - вроде всем понятно.
    Метод наименьших квадратов - в итоге дает сумму квадратов отклонений равную нулю.
    То есть - он находит такие рейтинги учатников, при которых текущий результат равен рассчитанному по форуме Эло (с расчетом не из среднего рейтинга, а более точно через сумму мат. ожиданий в каждой партии)
    То есть те цифры который я привел выше - если иходя из этих рейтингов посчитать ожидаемый результат по формуле Эло - то получим как-раз текущий результат.
  32. thenewone Евгений Манев

    • Участник
    • Старожил
    Рег.:
    09.06.2006
    Сообщения:
    3.173
    Симпатии:
    18
    Репутация:
    1
    Адрес:
    Пловдив
    Оффлайн
    NS,
    уже вечер или еще не вечер? :)
    Где свободный доступ? :)
  33. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Еще не вечер, еще не вечер
    Еще на улицах не светят фонари... :)
    ——————————-
  34. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Еще не вечер :)
    Я увеличил максимально возможное количество участников турнира до 300.
    Соответственно выросло время расчета. Сейчас передал простой спуск на наискорейший.
    Сделал расчет начальных приближений (вместо того чтоб брать одинаковый начальный рейтинг - это тоже ускоряет сходимость методов)
    Сейчас доделаю вывод большего количества статистики - и как раз выложу.
    И еще не прикрутил в программу формулу E-рейтинга. Пока считает только два рейтинга - наиболее вероятный, и минимизирующий сумму квадратов отклонений.
  35. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Предусмотри пожалуйста
    1. Ввод ненцлевого фона - например всю матрицу забить 0,001. Это позволяет обсчитывать и нецепляющиеся таблички. Тогда вес каждого турнира будет пропорционален числу участников.
    2. Вввод веса победы и поражения. W и L Это соответствует принятию гипотезы о составе турнира.
    Если L = 0 то алгоритм "полагает" что в турнире принимают участия от чайников до гроссов.
    Если W = 3L это означает что в турнире участники в пределах одного спортивного разряда.
    Ну а если W = L + 0... мы приходим к ранжированию по абсолютным очкам

Поделиться этой страницей