Империя кривых зеркал

Тема в разделе "Кухня", создана пользователем e271, 4 май 2006.

  1. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Если нужно я могу прислать свой алгоритм из ехеля
  2. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    * Файл получил.

    из 729-го поста понятно что численные методы дают ранжирование очень близкое к полученному по формуле Е-рейтинга.
  3. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Отправил все целиком
  4. chich Учаcтник

    • Участник
    Рег.:
    11.02.2006
    Сообщения:
    3.535
    Симпатии:
    12
    Репутация:
    1
    Адрес:
    Воронеж
    Оффлайн
    столько не живут :D
  5. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    А это ты БРУТ!!!
  6. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
  7. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Насчет фона - а точно фон лучше, чем просто выделить в разные обсчеты несвязные графы?

    Для E-Рейтинга сделаю, для своего обсчета пока думаю, нужно ли это.
    Лишние значения очень сильно увеличивают ресурсоемкость расчетов, например в случае швейцарок.

    Насчет того что один результат дает и минимизация суммы квадратов отклонений, и Максимизация вероятности...
    Я сразу не подумал (До Этого использовал "искаженную формлу" БайесЭло) -
    Если прологарифмировать вероятность, а потом в обоих методах взять производную - то производные идентичны, только знак разный. Так что по сути - методы одинаковы.

    Вероятностный метод нужен только в случае необходимости расчета доверительных интервалов.

    Немного подкорректировал свой метод (на самом деле конечно не только мой, так-же рейтинги считает WildCat) - Выделил в отдельные группы участников со 100% результатом, и с нулевым результатом.


    Текущую версию программы - расчет одним способом без доверительных интервалов можно скачать тут:
    http://rapidshare.com/files/12628913/Rating001.rar.html

    Ситуация в турнире после 7-го тура:

    2961.8 2711.1 5.5/7 "Radjabov,T"
    2863.1 2686.6 5.0/7 "Topalov,V"
    2855.8 2737.1 4.5/7 "Kramnik,V"
    2842.3 2785.2 4.0/7 "Navara,D"
    2829.3 2774.4 4.0/7 "Anand,V"
    2814.0 2759.5 4.0/7 "Aronian,L"
    2788.9 2727.8 4.0/7 "Karjakin,Sergey"
    2770.9 2710.0 4.0/7 "Svidler,P"
    2761.6 2813.4 3.0/7 "Ponomariov,R"
    2668.8 2781.6 2.5/7 "Tiviakov,S"
    2657.9 2711.6 3.0/7 "Motylev,A"
    2631.7 2748.3 2.5/7 "Van Wely,L"
    2598.7 2763.5 2.0/7 "Carlsen,M"
    2455.2 2790.0 1.0/7 "Shirov,A"

    Второй столбец - средний рейтинг соперников.
  8. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Фон имеет "физ смысл" он означает, что все участники знают правила шахмат и играют именно в шахматы. И кроме того.. Фон снимает вопрос о выделении отдельных графов, то есть предварительное определение связанных областей.
    Эло связано с экспонентой. А она не имеет физ смысла поскольку дает бесконечно малую вероятность. А бесконечностей в природе нет. С этой точки зрения более физичным ИМХО является арктангенс. Хотя любая функция это уже навязывание природе какой-то формы ...
    ————-
    В добавок. В отличие от разных "счетных" рейтингов е-рейтинг обладает свойством контроля. Достаточно легко проверить правильность расчета. Для того чтобы получить рейтинг любого надо просто сложить рейтинги побежденных и разделить их на число поражений. Это и будет точный рейтинг участника. И любое отклонение означает ошибку в расчете...
  9. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    насчет функций - на практике рейтинг Сонаса (линейный) дает такое-же ранжирование, и при замене коэффициента на 800 - Дает примерно такие-же рейтинги как и Эло. Но раз все хотят Эло - пускай будет Эло :)
    И при Рейтингах Сонаса, если разница силы каждой пары не выходит за границы (не попадает на излом)
    тоже легко проверяется ручным счетом - Сумма мат. ожиданий по каждой партии (по каждому сопернику) - равна мат. ожиданию от среднего рейтинга соперников.
  10. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Одно дело "ЕСЛИ" и совсм другое - ТОЧНОЕ РАВЕНСТВО ПРИ ЛЮБЫХ УСЛОВИЯХ. Формула она и в Африке формула и никаким числовым методом ее не заменить...
  11. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Формула она проще, но менее точна. :)
    Так-же как и рейтинги Сонаса проще, но менее точны (на форуме есть ветка со сравнением систем на реальных данных)
    А для того, чтоб увидеть эффективен ли тот или иной метод в шахматной программе - нужно отранжировать максимально точно, и правильно посчитать доверительные интервалы.
    За счет этого мы можем минимизировать количество тестовых партий, и максимально исключаем вероятность ошибки - добавление в программу метода или сочетания методов уменьшающих силу.
    Кстати, нашел в чем проблема ЭлоСтата - не знаю конкретно какой выч. метод он использует, но старается посчитать максимально быстро - из-за этого все неприятности. Участники, находящиеся в абсолютно одинаковой ситуации получают разные рейтинги. То есть отличия рейтингов ЭлоСтата возникают из-за большой погрешности результата.
  12. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Что значит менее точна? Напримере Американского футбола могу сказать что наиболее точным является простой перебор вариантов расстановки при котором вообще нет понятия рейтинг. И тогда встает естественный вопрос о том как все же его определить, или вопрос о том как оценить ранги?

    Соблюдает ли численный метод основные принципы - приз за победу над одним и тем же соперником одинаков и наказание за поражение от одного и того же соперника одинаково? Очевидно нет ...
  13. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Менее точна?
    Метод проверки простой. Берем огромную базу партий, желательно движков (так-как сила одной версии движка не меняется со временем)
    Выводим сумму квадратов отклонений результата каждого движка в ноль.
    (Она спокойно уходит в ноль и в системе Сонаса и в системе Эло)

    А теперь смотрим сумму квадратов отклонений по всем внутренним матчам.

    Если система лучше - то на большом количестве партий в внутренних матчах сумма квадратов должна быть меньше. У системы Эло по базе WBEC она в два раза меньше чем у системы Сонаса.

    Могу посчитать вместе с доверительными интервалами. Но точно могу утвержать, что по Весьма большой базе система Эло достоверно лучше системы Сонаса.
  14. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    ЗдОрово :) но что бы не фантазировать распиши пожалуйста это на простеньком примере
    Отклонение, квадрат отклонения. Что значит загнать в ноль ... Ну в общем так, чтобы поняли те кто не совсем свободно оперируют мат. терминами... В конце концов это же для народа неизощренного ... Ну так, чтобы и Базару было понятно :)
  15. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Сейчас соберусь с мыслями и распишу.
    И заодно сделаю этот тест по базе CCRL 40/40 (44'514 games
    played by 215 programs)
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Пусть у нас в тестировании принимают участие N участников.
    Мы расставляем им рейтинги таким образом, чтоб при расчете исходя из выбранной системы рейтингов (с расчетом ожидаемого результата по каждому сопернику отдельно) Посчитанное ожидаемое количество очков было равно реально набранному Приравниваем нулю систему из N уравнений (N движков) с N неизвестными (их рейтинги). В общем случае система может не иметь решения, либо иметь несколько.
    Но Система Сонаса Линейна (правда с изломами на краях) Так что исключая вырожденные случаи решение будет, и причем одно. Система Эло этого не гарантирует (так-же как и не гарантирует наличия ровно одного решения) Но на практике решение всегда находится, и всегда сходится к одной точке.

    Теперь получив рейтинги N участников, мы кроме самих результатов имеем еще N*(N-1)/2 внутренних матчей. Причем по ним уже расчетные результаты не будут соответствовать реальным.

    Вводим критерий погрешности - Сумма Квадратов отклонений. То есть по каждому внутреннему матчу считаем ожидаемый результат, вычитаем реальный и возводим в квадрат. Сумма этих квадратов по всем матчам является критерием правильного выбора кривой мат. ожидания системы рейтингов. У какой системы сумма квадратов меньше, та система лучше.

    Понятно что ни в системе Эло, ни в системе Сонаса результат абсолютно независит от выбора масштаба шкалы.
  17. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Результаты:

    Система Сонаса

    E:=0.5+D/850;
    if E>1 then E:=1;
    if E<0 then E:=0;

    Сумма квадратов отклонений по участникам (показывает насколько четко мы решили уравнение):
    1,08577543002307
    Сумма квадратов отклонений по внутренним матчам (чем меньше, тем лучше метод):
    5983,10810300427

    Сами рейтинги:
    Код:
    3186.0  2959.3  138.0/180  "Rybka 2.2 64-bit 4CPU"
    3140.2  2932.8  155.5/209  "Rybka 2.1 64-bit 4CPU"
    3137.6  2904.1  141.0/182  "Rybka 2.1 32-bit 4CPU"
    3121.7  2872.0  190.5/240  "Rybka 2.1 64-bit 2CPU"
    3067.9  2839.6  345.5/453  "Rybka 2.2 64-bit 2CPU"
    3063.3  2892.6  270.5/386  "Rybka 2.2 32-bit 2CPU"
    3058.5  2882.8  126.5/179  "Rybka 2.2 64-bit"
    3042.7  2866.2  359.5/508  "Rybka 2.1 32-bit 2CPU"
    3031.3  2842.4  578.5/801  "Rybka 2.2 32-bit"
    3021.6  2814.0  620.0/833  "Rybka 1.2 64-bit"
    3014.9  2793.1  506.0/665  "Rybka 1.1 64-bit"
    3006.5  2934.8  52.0/89  "Hiarcs 11 4CPU"
    3002.2  2825.7  752.0/1063  "Rybka 1.2 32-bit"
    2999.3  2839.4  417.0/606  "Rybka 2.1 32-bit"
    2988.7  2799.0  296.5/410  "Rybka 2.1 32-bit (C+1 OSO)"
    2984.9  2817.3  804.5/1154  "Rybka 1.1 32-bit"
    2982.0  2850.7  322.0/492  "Zap!Chess Paderborn 64-bit 4CPU"
    2958.8  2859.6  37.0/60  "Deep Fritz 10 2CPU"
    2949.6  2930.8  237.0/454  "LoopMP 12.32 2CPU"
    2946.2  2935.5  225.0/439  "Deep Junior 10 4CPU"
    2945.2  2871.5  57.5/98  "Hiarcs 11 2CPU"
    2944.9  2903.8  17.0/31  "Deep Shredder 10 32-bit 4CPU"
    2944.7  2914.8  220.5/412  "Deep Shredder 10 64-bit 4CPU"
    2942.7  2881.9  517.5/906  "Deep Shredder 10 32-bit 2CPU"
    2940.1  2771.9  867.5/1243  "Rybka 1.0 64-bit"
    2932.4  2976.9  55.5/124  "Zap!Chess Paderborn 32-bit 4CPU"
    2925.7  2880.2  238.0/430  "Zap!Chess Paderborn 64-bit 2CPU"
    2918.5  2890.3  96.5/181  "LoopMP 11A.32 2CPU"
    2917.3  2948.1  57.5/124  "Deep Junior 10.1 4CPU"
    2911.8  2855.9  355.5/630  "Deep Junior 10 2CPU"
    2903.8  2988.8  72.0/180  "Deep Fritz 10 4CPU"
    2896.0  2803.6  736.5/1210  "Rybka 1.0 32-bit"
    2883.3  2718.0  12.5/18  "Junior 10.1"
    2882.4  2861.0  62.5/119  "List 10.64f 64-bit"
    2881.9  2790.4  830.0/1366  "Shredder 10"
    2881.1  2872.1  422.5/828  "Loop 10.32f"
    2874.0  2872.9  196.5/392  "Hiarcs X50 Hypermodern"
    2873.2  2793.0  126.0/212  "Fritz 10"
    2871.4  2729.0  20.5/33  "Deep Shredder 10 64-bit 2CPU"
    2871.3  2861.9  870.0/1702  "Toga II 1.2.1a"
    2870.1  2858.2  129.5/252  "Hiarcs 11"
    2860.0  2803.4  110.5/195  "Loop 12.32"
    2859.9  2900.6  129.0/286  "Hiarcs X54 64-bit"
    2859.6  2799.8  616.5/1081  "Deep Shredder 9 2CPU"
    2849.3  2832.3  909.0/1748  "Spike 1.2 Turin"
    2848.4  2883.8  510.5/1114  "Hiarcs X50"
    2843.0  2842.6  1037.0/2072  "Fritz 9"
    2842.3  2818.5  1036.5/1963  "Fruit 2.2.1"
    2841.4  2840.0  745.5/1486  "Hiarcs 10"
    2841.3  2799.7  151.5/276  "Toga II 1.2 32-bit"
    2840.7  2866.2  86.0/183  "Hiarcs X54 Hypermodern 32-bit"
    2839.0  2836.0  506.5/1006  "Junior 10"
    2838.9  2873.2  102.5/223  "Hiarcs X54 32-bit"
    2838.5  2774.7  23.0/40  "Smarthink 1.00 64-bit"
    2830.9  2823.8  461.5/908  "Deep Fritz 8 2CPU"
    2825.1  2780.8  561.5/1017  "Toga II 1.1a"
    2820.4  2772.1  647.0/1162  "Shredder 9"
    2816.6  2802.3  459.5/889  "Hiarcs 10 Hypermodern"
    2816.1  2795.2  564.0/1075  "Deep Junior 9 2CPU"
    2810.8  2973.7  18.5/60  "Zap!Chess Reykjavik 64-bit 2CPU"
    2803.5  2867.2  127.5/309  "Glaurung 1.2.1 64-bit 2CPU"
    2801.9  2868.0  38.0/90  "Zap!Chess Paderborn 64-bit"
    2799.4  2786.8  468.5/910  "Naum 2.0 32-bit"
    2797.5  2908.1  32.5/90  "ListMP 11.64 64-bit 2CPU"
    2793.0  2836.2  198.5/442  "Fritz 8 Bilbao"
    2792.6  2656.2  17.0/27  "Zap!Chess Paderborn 32-bit 2CPU"
    2792.4  2857.3  474.0/1119  "Ktulu 8.0"
    2790.8  2789.8  290.5/580  "Naum 2.0 64-bit"
    2777.3  2632.3  6.0/9  "Scorpio 1.81 2CPU"
    2773.4  2781.8  720.0/1469  "Spike 1.1"
    2769.7  2837.4  211.0/502  "Chess Tiger 2007"
    2769.1  2613.4  53.5/82  "Scorpio 1.84"
    2768.2  2809.4  330.5/732  "Zap!Chess Paderborn 32-bit"
    2765.3  2793.9  577.0/1237  "Junior 9"
    2757.2  2790.5  111.5/242  "Zap!Chess Paderborn SE 32-bit"
    2753.4  2785.1  273.0/590  "Glaurung 1.2.1 64-bit"
    2745.4  2743.7  127.5/254  "CM9000 Enforcer"
    2744.0  2815.6  197.5/475  "CM10th Paralyse"
    2743.8  2803.9  610.0/1421  "Ktulu 7.5"
    2742.1  2794.8  416.0/950  "Glaurung 1.2.1 32-bit"
    2742.0  2845.3  96.5/255  "Zap!Chess Reykjavik 32-bit"
    2741.9  2913.6  45.5/164  "Pharaon 3.5.1 2CPU"
    2741.4  2684.7  8.5/15  "Scorpio 1.9"
    2740.1  2807.9  590.0/1404  "CM10th Xperience"
    2734.5  2789.6  567.5/1304  "Smarthink 1.00 32-bit"
    2730.6  2782.8  382.0/871  "Spike 1.0a"
    2726.0  2743.9  420.0/877  "Scorpio 1.8"
    2725.5  2787.7  13.0/31  "Deep Frenzee 3.0 64-bit 2CPU"
    2724.6  2690.2  79.0/148  "LoopList 6.00"
    2724.5  2748.5  33.5/71  "Glaurung 1.2.1 Crusader 32-bit"
    2722.8  2746.5  110.0/233  "CM10th Ogre"
    2720.9  2723.5  81.0/163  "CM10th Lazarus"
    2720.5  2800.0  421.5/1037  "CM10th Magic II"
    2720.3  2728.8  588.5/1201  "Slow Chess Blitz WV2.1"
    2718.4  2749.5  101.5/219  "CM10th Warrior"
    2716.3  2756.7  157.0/347  "Chess Tiger 15 Gambit"
    2715.0  2792.5  388.0/949  "Ktulu 7.1"
    2714.9  2682.7  35.5/66  "Fruit 2.1"
    2713.2  2749.9  100.5/220  "Glaurung 1.1 32-bit"
    2710.5  2749.1  230.5/507  "Zappa 1.1 64-bit"
    2708.3  2782.5  466.0/1129  "Chess Tiger 15"
    2707.8  2794.0  414.5/1040  "CM10th Default"
    2702.5  2757.8  220.5/507  "Ruffian 2.1.0"
    2700.8  2766.2  453.5/1072  "Glaurung 1.0.2 32-bit"
    2700.6  2746.2  325.0/728  "WildCat 7"
    2699.8  2697.9  117.5/234  "CM10th Pestilence"
    2696.2  2780.9  565.0/1411  "Gandalf 6"
    2694.4  2685.0  318.5/625  "Pro Deo 1.2"
    2693.3  2720.6  386.5/826  "List 5.12"
    2689.5  2643.8  123.5/223  "Scorpio 1.7"
    2687.0  2790.5  296.5/784  "Hiarcs 9"
    2684.6  2732.3  418.5/943  "Pharaon 3.5.1"
    2682.2  2766.3  381.0/950  "Slow Chess Blitz WV2"
    2682.1  2764.1  263.5/653  "Chess Tiger 2004"
    2680.6  2714.9  336.5/732  "Ruffian 1.0.5"
    2679.2  2764.0  389.0/972  "Naum 1.91 64-bit"
    2676.1  2729.1  7.0/16  "Movei 0.08.402"
    2669.9  2760.8  409.5/1042  "Naum 1.91 32-bit"
    2669.5  2687.7  378.5/791  "Delfi 5.0"
    2668.7  2727.5  589.0/1367  "Aristarch 4.50"
    2668.4  2656.5  92.0/179  "Zappa 1.1 32-bit"
    2663.8  2688.2  320.5/680  "WildCat 6"
    2660.1  2692.1  147.5/319  "Pro Deo 1.1"
    2659.9  2659.9  167.0/334  "Delfi 4.6"
    2651.0  2662.6  321.0/660  "Pseudo 0.7c"
    2646.2  2522.1  37.5/59  "Twisted Logic 0.065e35"
    2646.2  2676.3  262.5/565  "Jonny 2.83 32-bit"
    2644.0  2600.0  98.0/179  "Frenzee 2.0"
    2639.8  2687.5  170.0/383  "Jonny 2.83 64-bit"
    2638.5  2659.5  38.5/81  "Pro Deo 1.1 Silver"
    2636.1  2640.9  158.0/326  "Petir 3.99d"
    2635.4  2649.0  15.0/31  "Movei 0.08.403"
    2630.5  2654.7  107.5/228  "Pharaon 3.3"
    2628.0  2631.8  262.5/556  "Colossus 2006f"
    2615.6  2828.0  12.5/50  "Crafty 20.14 64-bit"
    2612.7  2664.5  186.0/424  "SOS 5.1"
    2610.1  2581.5  132.0/248  "Frenzee 3.0"
    2608.4  2637.5  122.5/263  "Anaconda 2.0.1"
    2607.0  2600.0  143.5/283  "Ufim 8.02"
    2603.5  2582.3  126.5/241  "Thinker 4.7a"
    2603.4  2569.1  100.5/186  "Petir 3.95"
    2601.6  2616.6  137.0/284  "The Baron 1.7.0"
    2598.3  2538.7  4.5/8  "Crafty 21.5 32-bit"
    2596.7  2651.8  84.0/193  "Smarthink 0.17a"
    2586.8  2577.4  138.5/271  "E.T. Chess 18.11.05"
    2584.2  2629.0  80.5/180  "Movei 0.08.295"
    2581.3  2505.9  10.0/17  "Crafty 20.14 32-bit 2CPU"
    2578.8  2675.2  95.5/247  "Crafty 20.14 32-bit"
    2577.8  2728.9  29.0/90  "Nimzo 8"
    2577.4  2574.8  82.0/163  "Twisted Logic 0.065e37"
    2575.6  2562.1  114.0/221  "Colossus 2006d"
    2571.3  2540.9  107.5/201  "Booot 4.12.1"
    2568.5  2626.7  2.0/5  "Snitch 1.6.2 64-bit"
    2562.2  2587.0  73.0/155  "Crafty 20.13 32-bit"
    2559.6  2708.1  169.5/521  "AnMon 5.60"
    2557.5  2575.2  115.0/240  "Little Goliath Evolution 3.12"
    2554.6  2637.3  14.0/35  "Gaia 3.5 64-bit"
    2545.5  2463.7  13.0/26  "Deep Frenzee 2.0 2CPU"
    2545.2  2549.6  47.0/95  "Trace 1.36"
    2544.8  2633.0  38.5/97  "Crafty 20.11 32-bit"
    2543.2  2580.8  118.5/260  "Movei 0.08.358"
    2540.7  2553.2  49.5/102  "Frenzee 1.1"
    2538.2  2563.8  78.0/166  "Ufim 8.00"
    2520.5  2633.1  58.5/159  "Ufim 7.01"
    2514.6  2508.3  71.0/140  "Matacz 1.1"
    2514.3  2558.9  64.0/143  "Booot 4.10.1"
    2509.9  2589.6  84.5/208  "Quark 2.35"
    2508.6  2489.6  71.0/136  "Trace 1.37a"
    2500.9  2451.0  57.5/103  "Delphil 1.6c"
    2500.9  2545.3  124.0/277  "Amyan 1.597"
    2496.7  2529.7  59.0/128  "Arasan 9.5"
    2493.3  2782.6  0.5/2  "Crafty 21.5 64-bit"
    2488.4  2550.3  64.5/151  "Trace 1.35"
    2488.2  2455.4  56.0/104  "Kiwi 0.6d"
    2484.3  2526.2  100.5/223  "Snitch 1.6.2"
    2482.8  2486.6  55.0/111  "Muse 0.899b"
    2477.6  2537.6  39.5/92  "Booot 4.11.1"
    2471.8  2456.9  44.5/86  "Gaia 3.5 32-bit"
    2469.0  2475.0  69.0/140  "Dragon 4.6"
    2467.3  2569.0  62.0/163  "Arasan 9.2"
    2457.8  2505.4  51.5/116  "Djinn 0.925x"
    2452.9  2461.7  71.0/145  "Hermann 1.9"
    2451.4  2511.9  15.0/35  "DanaSah 2.85"
    2443.7  2447.4  57.0/115  "Gosu 0.16"
    2426.1  2498.6  56.0/135  "Amateur 2.82"
    2425.4  2397.7  41.0/77  "Typhoon 1.00-285"
    2423.4  2412.0  38.5/75  "Patzer 3.80"
    2422.3  2375.9  25.5/46  "Xpdnt 061030"
    2403.7  2398.0  38.5/76  "Aice 0.99.2"
    2401.9  2439.3  46.5/102  "DanaSah 2.73"
    2395.0  2401.9  30.0/61  "Diablo 0.5.1"
    2387.7  2466.0  54.0/132  "Alfil 6.10"
    2377.8  2263.1  56.5/89  "Zeus 1.27"
    2370.6  2402.7  12.0/26  "Zeus 1.28"
    2369.8  2644.7  3.0/17  "Homer Leiden 64-bit"
    2369.0  2349.0  33.5/64  "Thor's Hammer 2.28"
    2363.9  2430.9  40.0/95  "Anechka 0.08"
    2357.2  2293.0  61.0/106  "Horizon 4.3"
    2355.6  2462.5  39.5/109  "Tornado 1.0"
    2354.5  2435.1  32.0/79  "Queen 3.09"
    2338.0  2474.2  10.0/29  "Hamsters 0.0.6"
    2307.0  2419.3  32.0/87  "Popochin 2.7"
    2295.2  2431.9  20.0/59  "AliChess 4.06"
    2282.7  2474.8  11.5/42  "Popochin 2.8"
    2267.2  2380.3  11.0/30  "Deuterium 06.08.25.04"
    2260.9  2856.3  1.0/31  "LittleThought 0.98 64-bit 2CPU"
    2254.9  2458.8  19.5/75  "Ant 2006-F"
    2253.9  2381.1  10.5/30  "Arion 1.7"
    2191.2  2414.1  15.5/66  "Gibbon 2.01b"
    2183.6  2351.7  14.5/48  "EXchess 5.01b"
    2175.0  2350.8  5.0/21  "LittleThought 0.96 64-bit"
    2173.9  2439.1  2.0/10  "Gibbon 2.31b"
    2165.9  2305.7  32.5/98  "Monarch 1.7"
    2059.6  2358.3  23.5/135  "Feuerstein 0.4.4.2"
    0.0  2486.7  0.0/14  "Eden 0.0.11"
    Система Эло

    E:=1/(1+Exp(-D*Ln(10)/400));

    Сумма квадратов отклонений по участникам (показывает насколько четко мы решили уравнение):
    1,99836531849047
    Сумма квадратов отклонений по внутренним матчам (чем меньше, тем лучше метод):
    5902,52266350429

    Сами рейтинги:

    Код:
    3165.0  2949.1  138.0/180  "Rybka 2.2 64-bit 4CPU"
    3122.7  2925.3  155.5/209  "Rybka 2.1 64-bit 4CPU"
    3114.7  2868.1  190.5/240  "Rybka 2.1 64-bit 2CPU"
    3113.7  2897.4  141.0/182  "Rybka 2.1 32-bit 4CPU"
    3056.7  2838.6  345.5/453  "Rybka 2.2 64-bit 2CPU"
    3040.9  2888.1  270.5/386  "Rybka 2.2 32-bit 2CPU"
    3036.8  2879.0  126.5/179  "Rybka 2.2 64-bit"
    3024.8  2863.8  359.5/508  "Rybka 2.1 32-bit 2CPU"
    3013.2  2842.1  578.5/801  "Rybka 2.2 32-bit"
    3011.4  2817.1  620.0/833  "Rybka 1.2 64-bit"
    3008.6  2798.1  506.0/665  "Rybka 1.1 64-bit"
    2991.8  2827.6  752.0/1063  "Rybka 1.2 32-bit"
    2985.2  2926.1  52.0/89  "Hiarcs 11 4CPU"
    2984.0  2839.9  417.0/606  "Rybka 2.1 32-bit"
    2973.8  2820.1  804.5/1154  "Rybka 1.1 32-bit"
    2973.7  2803.3  296.5/410  "Rybka 2.1 32-bit (C+1 OSO)"
    2969.6  2850.3  322.0/492  "Zap!Chess Paderborn 64-bit 4CPU"
    2943.9  2857.4  37.0/60  "Deep Fritz 10 2CPU"
    2937.1  2923.7  237.0/454  "LoopMP 12.32 2CPU"
    2935.3  2928.1  225.0/439  "Deep Junior 10 4CPU"
    2935.1  2910.2  220.5/412  "Deep Shredder 10 64-bit 4CPU"
    2932.4  2878.7  517.5/906  "Deep Shredder 10 32-bit 2CPU"
    2929.3  2779.1  867.5/1243  "Rybka 1.0 64-bit"
    2929.2  2866.4  57.5/98  "Hiarcs 11 2CPU"
    2928.7  2897.1  17.0/31  "Deep Shredder 10 32-bit 4CPU"
    2923.5  2964.4  55.5/124  "Zap!Chess Paderborn 32-bit 4CPU"
    2915.8  2877.6  238.0/430  "Zap!Chess Paderborn 64-bit 2CPU"
    2910.0  2935.8  57.5/124  "Deep Junior 10.1 4CPU"
    2907.2  2884.1  96.5/181  "LoopMP 11A.32 2CPU"
    2903.7  2854.4  355.5/630  "Deep Junior 10 2CPU"
    2897.1  2974.3  72.0/180  "Deep Fritz 10 4CPU"
    2888.2  2807.8  736.5/1210  "Rybka 1.0 32-bit"
    2877.8  2731.4  12.5/18  "Junior 10.1"
    2876.5  2869.6  422.5/828  "Loop 10.32f"
    2874.4  2795.8  830.0/1366  "Shredder 10"
    2872.9  2854.0  62.5/119  "List 10.64f 64-bit"
    2871.2  2870.2  196.5/392  "Hiarcs X50 Hypermodern"
    2871.0  2722.0  20.5/33  "Deep Shredder 10 64-bit 2CPU"
    2867.2  2861.0  870.0/1702  "Toga II 1.2.1a"
    2866.3  2797.6  126.0/212  "Fritz 10"
    2863.9  2855.0  129.5/252  "Hiarcs 11"
    2858.5  2892.9  129.0/286  "Hiarcs X54 64-bit"
    2856.3  2805.2  616.5/1081  "Deep Shredder 9 2CPU"
    2854.3  2806.8  110.5/195  "Loop 12.32"
    2847.6  2881.0  510.5/1114  "Hiarcs X50"
    2847.6  2833.7  909.0/1748  "Spike 1.2 Turin"
    2843.0  2843.7  1037.0/2072  "Fritz 9"
    2842.1  2821.6  1036.5/1963  "Fruit 2.2.1"
    2841.5  2841.1  745.5/1486  "Hiarcs 10"
    2839.5  2871.5  102.5/223  "Hiarcs X54 32-bit"
    2839.3  2803.7  151.5/276  "Toga II 1.2 32-bit"
    2838.5  2863.2  86.0/183  "Hiarcs X54 Hypermodern 32-bit"
    2838.1  2836.7  506.5/1006  "Junior 10"
    2837.2  2782.6  23.0/40  "Smarthink 1.00 64-bit"
    2831.1  2826.6  461.5/908  "Deep Fritz 8 2CPU"
    2824.8  2787.7  561.5/1017  "Toga II 1.1a"
    2820.3  2963.6  18.5/60  "Zap!Chess Reykjavik 64-bit 2CPU"
    2820.1  2779.6  647.0/1162  "Shredder 9"
    2818.0  2800.6  564.0/1075  "Deep Junior 9 2CPU"
    2818.0  2807.2  459.5/889  "Hiarcs 10 Hypermodern"
    2807.5  2864.1  127.5/309  "Glaurung 1.2.1 64-bit 2CPU"
    2807.1  2868.2  38.0/90  "Zap!Chess Paderborn 64-bit"
    2804.4  2899.2  32.5/90  "ListMP 11.64 64-bit 2CPU"
    2804.3  2653.5  6.0/9  "Scorpio 1.81 2CPU"
    2802.5  2792.5  468.5/910  "Naum 2.0 32-bit"
    2800.9  2666.9  17.0/27  "Zap!Chess Paderborn 32-bit 2CPU"
    2798.3  2855.8  474.0/1119  "Ktulu 8.0"
    2797.8  2837.3  198.5/442  "Fritz 8 Bilbao"
    2793.8  2795.3  290.5/580  "Naum 2.0 64-bit"
    2784.4  2630.8  53.5/82  "Scorpio 1.84"
    2779.9  2788.7  720.0/1469  "Spike 1.1"
    2777.7  2837.3  211.0/502  "Chess Tiger 2007"
    2775.8  2813.6  330.5/732  "Zap!Chess Paderborn 32-bit"
    2773.6  2799.0  577.0/1237  "Junior 9"
    2766.6  2795.1  111.5/242  "Zap!Chess Paderborn SE 32-bit"
    2760.9  2791.2  273.0/590  "Glaurung 1.2.1 64-bit"
    2755.8  2753.8  127.5/254  "CM9000 Enforcer"
    2754.5  2808.5  610.0/1421  "Ktulu 7.5"
    2753.7  2818.2  197.5/475  "CM10th Paralyse"
    2753.5  2844.0  96.5/255  "Zap!Chess Reykjavik 32-bit"
    2751.6  2799.9  416.0/950  "Glaurung 1.2.1 32-bit"
    2751.0  2812.1  590.0/1404  "CM10th Xperience"
    2746.6  2701.9  8.5/15  "Scorpio 1.9"
    2746.0  2795.7  567.5/1304  "Smarthink 1.00 32-bit"
    2743.6  2789.0  382.0/871  "Spike 1.0a"
    2741.1  2703.1  79.0/148  "LoopList 6.00"
    2739.5  2780.1  13.0/31  "Deep Frenzee 3.0 64-bit 2CPU"
    2737.6  2753.9  420.0/877  "Scorpio 1.8"
    2736.5  2908.2  45.5/164  "Pharaon 3.5.1 2CPU"
    2736.2  2755.4  33.5/71  "Glaurung 1.2.1 Crusader 32-bit"
    2735.2  2756.5  110.0/233  "CM10th Ogre"
    2734.4  2804.4  421.5/1037  "CM10th Magic II"
    2733.7  2736.0  81.0/163  "CM10th Lazarus"
    2731.9  2740.8  588.5/1201  "Slow Chess Blitz WV2.1"
    2731.4  2759.2  101.5/219  "CM10th Warrior"
    2730.1  2797.6  388.0/949  "Ktulu 7.1"
    2730.1  2696.4  35.5/66  "Fruit 2.1"
    2727.9  2766.8  157.0/347  "Chess Tiger 15 Gambit"
    2724.7  2760.4  100.5/220  "Glaurung 1.1 32-bit"
    2724.6  2758.3  230.5/507  "Zappa 1.1 64-bit"
    2722.2  2799.6  414.5/1040  "CM10th Default"
    2722.0  2789.5  466.0/1129  "Chess Tiger 15"
    2716.3  2756.0  325.0/728  "WildCat 7"
    2715.9  2774.8  453.5/1072  "Glaurung 1.0.2 32-bit"
    2715.4  2767.1  220.5/507  "Ruffian 2.1.0"
    2714.3  2713.6  117.5/234  "CM10th Pestilence"
    2711.7  2787.9  565.0/1411  "Gandalf 6"
    2710.5  2701.3  318.5/625  "Pro Deo 1.2"
    2709.2  2733.4  386.5/826  "List 5.12"
    2706.0  2795.7  296.5/784  "Hiarcs 9"
    2704.4  2665.6  123.5/223  "Scorpio 1.7"
    2701.2  2744.0  418.5/943  "Pharaon 3.5.1"
    2700.9  2774.5  381.0/950  "Slow Chess Blitz WV2"
    2700.1  2772.4  263.5/653  "Chess Tiger 2004"
    2698.1  2728.5  336.5/732  "Ruffian 1.0.5"
    2695.7  2772.9  389.0/972  "Naum 1.91 64-bit"
    2694.3  2741.8  7.0/16  "Movei 0.08.402"
    2690.1  2769.5  409.5/1042  "Naum 1.91 32-bit"
    2688.4  2704.5  378.5/791  "Delfi 5.0"
    2686.7  2677.1  92.0/179  "Zappa 1.1 32-bit"
    2686.5  2740.6  589.0/1367  "Aristarch 4.50"
    2683.5  2704.9  320.5/680  "WildCat 6"
    2679.6  2679.9  167.0/334  "Delfi 4.6"
    2679.5  2708.4  147.5/319  "Pro Deo 1.1"
    2672.1  2682.6  321.0/660  "Pseudo 0.7c"
    2671.2  2548.4  37.5/59  "Twisted Logic 0.065e35"
    2668.5  2694.2  262.5/565  "Jonny 2.83 32-bit"
    2668.1  2623.6  98.0/179  "Frenzee 2.0"
    2664.3  2703.7  170.0/383  "Jonny 2.83 64-bit"
    2662.3  2679.8  38.5/81  "Pro Deo 1.1 Silver"
    2660.2  2660.5  158.0/326  "Petir 3.99d"
    2657.3  2666.6  15.0/31  "Movei 0.08.403"
    2654.4  2675.3  107.5/228  "Pharaon 3.3"
    2653.0  2571.6  4.5/8  "Crafty 21.5 32-bit"
    2652.7  2651.8  262.5/556  "Colossus 2006f"
    2639.2  2683.7  186.0/424  "SOS 5.1"
    2637.3  2608.1  132.0/248  "Frenzee 3.0"
    2635.4  2660.1  122.5/263  "Anaconda 2.0.1"
    2635.1  2624.9  143.5/283  "Ufim 8.02"
    2630.1  2828.5  12.5/50  "Crafty 20.14 64-bit"
    2627.9  2610.9  126.5/241  "Thinker 4.7a"
    2627.8  2641.4  137.0/284  "The Baron 1.7.0"
    2627.5  2599.4  100.5/186  "Petir 3.95"
    2627.4  2672.9  84.0/193  "Smarthink 0.17a"
    2624.3  2522.3  10.0/17  "Crafty 20.14 32-bit 2CPU"
    2614.3  2606.1  138.5/271  "E.T. Chess 18.11.05"
    2613.2  2652.4  80.5/180  "Movei 0.08.295"
    2613.0  2641.8  2.0/5  "Snitch 1.6.2 64-bit"
    2607.6  2603.6  82.0/163  "Twisted Logic 0.065e37"
    2605.5  2693.2  95.5/247  "Crafty 20.14 32-bit"
    2605.1  2740.9  29.0/90  "Nimzo 8"
    2603.8  2592.7  114.0/221  "Colossus 2006d"
    2601.0  2570.9  107.5/201  "Booot 4.12.1"
    2591.5  2615.5  73.0/155  "Crafty 20.13 32-bit"
    2590.3  2722.2  169.5/521  "AnMon 5.60"
    2588.9  2604.4  115.0/240  "Little Goliath Evolution 3.12"
    2584.5  2652.0  14.0/35  "Gaia 3.5 64-bit"
    2576.8  2609.3  118.5/260  "Movei 0.08.358"
    2576.1  2577.4  47.0/95  "Trace 1.36"
    2575.6  2656.3  38.5/97  "Crafty 20.11 32-bit"
    2574.8  2585.4  49.5/102  "Frenzee 1.1"
    2574.8  2485.4  13.0/26  "Deep Frenzee 2.0 2CPU"
    2572.9  2594.9  78.0/166  "Ufim 8.00"
    2557.1  2656.0  58.5/159  "Ufim 7.01"
    2552.7  2590.4  64.0/143  "Booot 4.10.1"
    2549.7  2542.4  71.0/140  "Matacz 1.1"
    2547.9  2617.2  84.5/208  "Quark 2.35"
    2543.0  2525.9  71.0/136  "Trace 1.37a"
    2540.2  2577.5  124.0/277  "Amyan 1.597"
    2533.0  2560.0  59.0/128  "Arasan 9.5"
    2533.0  2485.7  57.5/103  "Delphil 1.6c"
    2530.4  2582.8  64.5/151  "Trace 1.35"
    2524.5  2559.9  100.5/223  "Snitch 1.6.2"
    2520.0  2523.1  55.0/111  "Muse 0.899b"
    2520.0  2490.4  56.0/104  "Kiwi 0.6d"
    2516.2  2569.2  39.5/92  "Booot 4.11.1"
    2512.1  2599.3  62.0/163  "Arasan 9.2"
    2510.0  2496.3  44.5/86  "Gaia 3.5 32-bit"
    2506.2  2512.1  69.0/140  "Dragon 4.6"
    2501.7  2787.3  0.5/2  "Crafty 21.5 64-bit"
    2494.0  2539.4  51.5/116  "Djinn 0.925x"
    2490.4  2497.7  71.0/145  "Hermann 1.9"
    2484.3  2487.1  57.0/115  "Gosu 0.16"
    2481.4  2541.1  15.0/35  "DanaSah 2.85"
    2466.6  2530.8  56.0/135  "Amateur 2.82"
    2463.5  2453.4  38.5/75  "Patzer 3.80"
    2463.3  2438.8  41.0/77  "Typhoon 1.00-285"
    2459.7  2418.2  25.5/46  "Xpdnt 061030"
    2447.5  2479.5  46.5/102  "DanaSah 2.73"
    2444.8  2439.0  38.5/76  "Aice 0.99.2"
    2438.6  2443.2  30.0/61  "Diablo 0.5.1"
    2432.3  2503.5  54.0/132  "Alfil 6.10"
    2419.5  2441.9  12.0/26  "Zeus 1.28"
    2412.0  2470.3  40.0/95  "Anechka 0.08"
    2411.6  2291.4  56.5/89  "Zeus 1.27"
    2408.7  2388.1  33.5/64  "Thor's Hammer 2.28"
    2404.0  2474.7  32.0/79  "Queen 3.09"
    2397.0  2325.7  61.0/106  "Horizon 4.3"
    2388.9  2491.8  39.5/109  "Tornado 1.0"
    2382.7  2664.2  3.0/17  "Homer Leiden 64-bit"
    2375.1  2504.6  10.0/29  "Hamsters 0.0.6"
    2356.4  2456.4  32.0/87  "Popochin 2.7"
    2353.0  2471.9  20.0/59  "AliChess 4.06"
    2334.1  2512.9  11.5/42  "Popochin 2.8"
    2329.3  2421.8  11.0/30  "Deuterium 06.08.25.04"
    2317.4  2422.6  10.5/30  "Arion 1.7"
    2308.4  2498.1  19.5/75  "Ant 2006-F"
    2294.9  2471.4  2.0/10  "Gibbon 2.31b"
    2238.2  2389.2  14.5/48  "EXchess 5.01b"
    2216.5  2858.5  1.0/31  "LittleThought 0.98 64-bit 2CPU"
    2211.4  2378.0  5.0/21  "LittleThought 0.96 64-bit"
    2205.7  2441.2  15.5/66  "Gibbon 2.01b"
    2169.0  2330.2  32.5/98  "Monarch 1.7"
    2072.1  2384.2  23.5/135  "Feuerstein 0.4.4.2"
    0.0  2506.4  0.0/14  "Eden 0.0.11"
  18. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    850 - это мировая константа? типа постоянной тонкой структуры?
  19. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    850 - было придумано Сонасом, чтоб было похоже на Эло.
    Это просто масштаб шкалы, от него ничего не зависит.
    Около часа осталось до конца расчета по шкале Сонаса.
  20. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Итак, Иванов выиграл у Петрова

    Их рейтинг 2600 и 2700 Что мы имеем?
  21. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    не совсем понял вопрос. В каком смысле что имеем?
    Как пересчитываются рейтинги после партии?
    И по системе Сонаса и по системе Эло одинаково.
    Рейтинг_Старый+(Результат-МатОжидание)*Дельта.
    Изменив в шкале коэффициент с 850 до 425 - по просто уменьшим все разницы рейтингов между каждыми двумя участниками в два раза. А между всеми участниками мат. ожидание останется тем-же.
  22. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    После 8-го тура

    Нет это уже новый результат. Я хочу оценить не ПРЕДСКАЗАНИЯ, А СПРАВЕДЛИВОСТЬ РАНЖИРОВАНИЯ.

    Матрица результатов заполнена. Я имею рейтинги участников ВОПРОС НАСКОЛЬКО СПРАВЕДЛИВО такое ранжирование.

    1. Получается что итоговое ранжирование зависит от порядка туров...??
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Как это? Нет конечно не зависит от порядка туров.
    Есть рейтинги участников (R1...RN) - нам их необходимо найти, чтоб по ним отранжировать.
    По каждому участнику K приравниваем
    Сумма по i(Матожидание(Rk-Ri)*КоличествоПартий_ki-Рtзультат_ki)=0
    Либо (что тоже самое)
    Сумма по i(Матожидание(Rk-Ri)*КоличествоПартий_ki)=Результат участника_k.
    Где Мат_Ожидание(Разница в рейтингах) и определяет систему рейтингов.
    получаем N уравнений с N неизвестными рейтингами. Одно уравнение зависимо, и один коэффициент является точкой отсчета. Решая эту ситему находим рейтинги, и согласно этим рейтингам ранжируем.
    1. При этом не учитываются предшествующие результаты.
    2. Ранжирование не зависит от порядка туров.

    Сама система определяется только формулой мат.ожидания результата.
    А предложенный Эло метод пересчета после каждой партии/турнира (который есно применим при любой системе) это только метод простого приблизительного расчета в условиях возможных колебаний силы во времени.
  24. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Иванов выиграл у Петрова - означает что более вероятно что Иванов играет сильнее Петрова.
    Про рейтинги при 100% результате мы сказать ничего не можем. Точнее можем только если имеем предположение насчет изначального распределения рейтингов Иванова и Петрова.
    А мы решили как раз не привязываться к предыдущим рейтингам и результатам.
  25. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    А что такое результат участника? - СУММА ОЧКОВ?????
  26. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Да. Результат участника это сумма очков.
    я выше написал, что если мы считаем вероятность всех случившихся исходов (перемножаем вероятности каждого исхода) И считаем рейтинги (силу соперников) исходя из принципа максимизации вероятности - то получаем тот-же результат, что и при привязке к Сумме очков.
    Но это конечно не говорит о том, что ранжирование будет соответствовать набранным очкам :)
  27. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Так или иначе, а при этом делается грубейшее допущение - равенство событий и теперь я спокоен :) Е-Рейтинг не использует этого ... Спасибо, а то у меня были какие-то сомнения... Фундамент, на котором стоит это ранжирование, так же как и Эло - кривой:D
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Дело в том, что фундамент - максимизиция вероятности случившегося исхода - как раз очень правильный.
    И если при этом получается что Ранжирование не зависит от конкретных исходов, а зависит только от набранного количества очков и состава соперников - значит так оно и надо...
    Для меня самого это оказалось полной неожиданностью...
    За вероятность исхода X:Y в матче двух соперников при заданном матожидании результата (MO) я беру:
    MO^X*(1-MO)^Y*Константа, где Константа зависит только от количества партий в матче.
    а MO=1/(1+Exp(-D*Ln(10)/400)), где D разница в рейтингах - это как раз формула Эло для матожидания...
    Вместо максимизации произведений можно прологарифмировав максимизировать сумму Логарифмов
    X*Ln(MO)+Y*Ln(1-MO) по всем внутренним матчам в соревновании, и кто бы мог подумать что максимум этой функции приходится на решение приведенного выше уравнения, и не зависит от того КАК мы набирали очки.

    Кстати в отличии от Такого подхода к вероятности - подход БайесЭло (с разработанной ими формулой вероятности ничьи) Зависим не только от количества набранных очков и Состава соперников (ну и соответсвенно результатов соперников), но и от того как и с кем эти очки были набраны...
    Но БайесЭло дает примерно такое-же ранжирование как и Элостат, и как и моя программа. И эта зависимость появилась только в итоге применения "хитрой" формулы для вычисления вероятности ничьи.
    То есть не была введена специально.

    И по логике - матожидание результата в нескольких партиях РАВНО сумме мат. ожиданий результатов...
    Так почему-же тогда ранжирование должно зависеть от состава набранных очков?

    Повторюсь - то что ранжирование не зависит от состава набранных очков - это всего-лишь совпадение :)
  29. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Правильный в том смысле что вы считаете вероятности для количества купюр, а не их достоинство! В этом и есть принципиальная разница между е-рейтингом и традиционными подходами... Вы напроч отбрасываете природу результата партии - его относительность. Можно привести такую аналогию - вы оцениваете грибников по количеству грибов, когда надо бы по качеству. Ведь домой несут ИАССУ (вес) а не ШТУКИ. И весь ваш рейтинг ПО ШТУКАМ а не по МАССЕ... Однако за столом вы будете грести грибы со сковродки не штуками - вилкой, а ложкой ... Знаю я вас ...:D :D
    —-
    Ну а если серьезно, то функция правдоподобия уже включает в себя принцип равенства событий, хотя это строго говоря неверно.
  30. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Нашел причины такой погрешности ЭлоСтата.
    1. Подмена задачи. Они не суммируют мат. ожидание, а считаю матожидание от "среднего соперника", среднего рейтинга соперников. и
    2. Считают покоординатным спуском, и при этом ограничение на время счета - десять секунд.
    Поокординатный спуск за такое время, например на 300 участников - сойтись не может (у меня градиентный сходится три часа)

    Я попробую всё-таки сделать сочетание методов - градинтным спуском спуститься в область сходимости Ньютона, и потом уже довести Ньютоном.

    добавлено

    во меня переклинило :) Максимизация вероятности и минимизация суммы квадратов отклонений сходится к одному значению, но с разной скоростью :)
    Не нужен Ньютон, максимизация вероятности сходится очень быстро.
  31. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Ну просто ты оторвался от земли а чистая математика никогда и никого до хорошего не доводила... Вот тот-же Базар-Вокзал спроси у него и он ответит Да ... :D
    ——————-
    Можно до бесконечности комбинировать математические подходы... А надо сначала определиться с показателем, который мы хотим определить, что вы хотим получит в итоге
  32. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Как это оторвался? Я отлично знаю что мне нужно :)
    Показатель - рейтинг, для чего он нужен тоже понятно.
    Чтоб можно было вычислить разницу в силе (рейтинге) между соперниками, и саму силу каждого соперника.

    Существующие средства - ЭлоСтат и БайесЭло не устраивают.
    В БайесЭло считаются рейтинги не по системе Эло. В ЭлоСтат слишком упростили модель и в итоге считают вообще непонятно что.

    И соответственно по результатам партий считаются:
    1. Наиболее вероятный рейтинг.
    2. Доверителоьные интервалы рейтинга (с данной достоверностью) при условии фиксированных посчитанных наиболее вероятных рейтингов соперников.
  33. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Вся статистика изначально строится на ЭКВИВАЛЕНТНЫХ с точки зрения данной задачи СОБЫТИЯХ. А в данном случае мы имеем принципиально НЕ ЭКВИВАЛЕНТНЫЕ СОБЫТИЯ.
  34. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Ничего не понимаю. Я не считаю события эквивелентными или нет, я считаю вероятности.
    Я знаю при заданной разнице рейтингов вероятность каждого исхода.
    Соответственно я могу посчитать рейтинги максимизирующие вероятность случившихся исходов (произведение вероятностей по каждому исходу).
    А причем тут Эквивалентность событий?
  35. TopicStarter Overlay

    e271 Старожил

    • Ветеран
    • Старожил
    Рег.:
    11.02.2006
    Сообщения:
    6.512
    Симпатии:
    4
    Репутация:
    1
    Оффлайн
    Да ты их автоматически считаешь эквивалентыми с точки зрения определения "силы" шахматиста. А это НЕ ВЕРНО. Как только ты стал оперировать этими событияме не вводя дополнительной характеристики ты стал их считать эквивалентными...

Поделиться этой страницей