Программы для статистической обработки данных (в частности, рейтинга)

Тема в разделе "Машинное отделение", создана пользователем Цубаки Сандзюро, 29 апр 2014.

  1. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн
    Мне попалась интересная программа по матстатистике; как оказалось, в ней быстро и удобно можно обрабатывать большие массивы данных, двух- и трехмерные. Я ее приспособил в том числе и для своего рейтинга.
    Знакомьтесь: программа SciDAVis, скачать ее можно вот тут: http://sourceforge.net/projects/scidavis/ . Программа абсолютно бесплатна, русифицирована, регулярно обновляется (я скачал февральский релиз 2014 года). Без проблем инсталируется и работает в "семерке" и, по-моему, то же будет и в других операционках. Разобраться несложно, меню достаточно удобное.

    И так, дано: годовой график изменения моего рейтинга на Шахпланете в стандарт. Хотелось бы как-то оценить рост, если он есть, и дальнейшую тенденцию.
    Сам график выглядит вот так:
    [​IMG]
    Как можно увидеть, играю я нестабильно, и поставить точный диагноз по такому графику сложно. Меня интересуют данные за последние 8 месяцев. В программе SciDAVis я легко создал таблицу. По ней генерируются графики в самой различной форме. Вот как могут выглятеть самые удобные для меня.
    [​IMG]
    На последнем рисунке - некоторые возможные варианты обработки - апроксимация первого и второго порядков (красная и салатовая линии). Вполне достаточно, чтобы объективно судить о моей игре.
    [​IMG]
  2. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Какая, прости господи, тенденция?! На Планете рейтинг за вечер в зависимости от {настроения/сна/голода} на две с лишним сотни может прыгать только так :)
    Dr.No нравится это.
  3. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн
    Я пользуюсь только годовым графиком. На нем отображаются значения среднего рейтинга за половину месяца. А это уже достаточно стабильный показатель. В целом картина получается достаточно объективная, каждый спад и каждый рост имеют свои обоснования (в частности, неудачные дебютные эксперименты или удачная работа над ошибками).
    Графики за вечер или за месяц я не просматриваю вообще.
  4. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Имхо, на планете инфляция рейтингов, во всяком случае мой, при всех колебаниях, вырос за полгода почти на 200 пунктов, хотя никаких причин для этого нет.
    planet1.png И
  5. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн
    Может, и есть инфляция. Мой сын вот набил уже на 500 пунктов в блице больше меня, но все равно проигрывает мне при контроле 5 минут против двух моих.
    А вот в стандарт у меня есть пяток постоянных партнеров, их рейтинг за последние полгода не изменился. Делаю вывод, что в стандарте инфляция меньше.
    В любом случае, другого цифрового показателя, помимо рейтинга на Шахпланете, у меня нет.
    А предложенная мной программа интересна сама по себе; буду рад, если уважаемые господа найдут ей какое-нибудь другое применение, помимо шахматного.
  6. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    Сколько партий в обсчете было за год? И сортировали ли по разным контролям?
    Красная линейная показывает, что есть тенденция :) к росту постепенному. но не быстрому, но если партий мало. то это ни о чем не говорит.
    Цубаки Сандзюро нравится это.
  7. Dr.No Старожил

    • Участник
    • Старожил
    Рег.:
    17.05.2007
    Сообщения:
    1.419
    Симпатии:
    323
    Репутация:
    42
    Оффлайн
    Инфляция идёт за счёт прибавки в оф.турнирах ШП (за 1 место +98-:- +102). Я таким образом, занимая периодически первые места, получаю неоправданный рейт по перфомансу. Потом его начинаю сливать: а) игрокам, у которые рейт выше, но надо играть (командник); б) надо играть, но игра не идёт (командник или феернуть). Отличный показатель рейта в шахматах Фишера, там у меня стабильно держится в районе 1900 (там не дают доп.рейт за место).
    Goranflo нравится это.
  8. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн
    На протяжении последних восьми месяцев 10-15 партий в сутки, контроль по 20 минут.
    Пан ХAJIK, я свой рейтинг выложил, только чтобы проиллюстрировать возможности программы. Скажем так, более подходящего примера под рукой не оказалось.
    Программа позволяет получать аппроксимацию разными методами, очень разными! Лично мне, с основами статистики водящему только шапочное знакомство, достаточно приведенных двух: красная линия показывает, что в целом, если отбросить случайные факторы (не выспался; везло; детки отвлекали и пр) мой рейтинг растет (это апроксимация первого порядка, т.е. прямой линией); салатовая - аппроксимация кривой второго порядка, показывает, что сначала мой рейтинг рос, но затем стал падать. Это более детальная информация. Если брать период очень большой, за год, например, то я бы уже попробовал и кривую третьего порядка. Если анализировать данные за несколько лет, то я бы уже следал трехмерный массив данных (т.е. для каждого года своя линия). Наверное, тоже интересно.


    Скажите, а турниры на ШП есть в стандарте? И каких турниров больше, в стандарт, в блиц или в пулю?
  9. Dr.No Старожил

    • Участник
    • Старожил
    Рег.:
    17.05.2007
    Сообщения:
    1.419
    Симпатии:
    323
    Репутация:
    42
    Оффлайн
    На ШП стандарт считается больше контроля 3 мин., есть несколько оф.турниров по 5 мин., иногда по 15 и 30, редко по часу и больше. Надо просто зайти в субботу или среду (бесплатные дни - т.е. есть доступ к турнирам) и отсмотреть все турниры за день (оф.турниры генерируются за 1-2 часа до начала) и конечно надо заполненность турнира, если участников записалось 4 или меньше, то он отменяется.
    Больше всего турниров блиц (3 мин.), затем пуля (1, 2 мин.).
  10. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Это не совсем физичный подход, так как полиномиальные кривые неограниченно растут. Я бы выбрал в качестве базисных функций логарифмы, синусы и что-нибудь, дающее эффект насыщения (вы же не планируете лет через пять-десять играть на 12000 Эло?)
  11. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    Насколько помню на ШП, пуля 1-2 мин, блиц-от 2 до 10, стандарт-то, что больше 10 минут на партию. И в турнирах с фишеровскими расстановками рейтинг бонусный тоже дается для призеров.
    Наиболее играемые-естественно , трехминутки. Но и по другим контролям есть турниры почти каждый час.
  12. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн
    Даже 11900 не смогу набрать, наверное :cool:
    Когда период коротенький, допустим, три месяца, достаточно ответить на вопрос, график растет или падает; соответственно аппроксимировать буду прямой линией.
    В течении полугода играть ровно невозможно, значит, должны быть и рост, и спад. Поэтому вполне логично выбрать для аппроксимации кривую второго порядка, и если в графике будут рост и спад (или наоборот), то у кривой появится точка перегиба, которая разделит график на два промежутка.
    Ну а если рассматривать год, то вполне достаточно будет двух или трех точек перегиба. Поэтому я бы выбрал кривую третьего или четвертого порядка, впрочем, в последнем случае можно и синусную взять.
    Но если заниматься прогнозом дальнейшего поведения графика, тогда да, необходимы другие кривые, здесь я с Вами полностью согласен. Я себе прогноз построил шутки ради, результат запендюрился где-то в районе минус несколько тысяч. Но прогнозировать любителю занятие пустое: через неделю привезешь тонну штукатурки, и пока не размажешь ее по стенам, к шахматам не притронешься. Какие уж тут пронозы...
    Насколько я понимаю, для разных графиков нужно подбирать наиболее подходящий способ аппроксимации, т.е. требуется творческий подход. Строить прямую, параболу, логарифическую функцию, и др., и смотреть, какая лучше подходит. Наверное, дисперсию лучше сравнивать. Сейчас не имею возможности посмотреть программу, а на вскидку не помню, считает ли она дисперсию.
  13. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Вот мой график в Го за последний год:

    [​IMG]

    Не сказал бы, что его можно аппроксимировать какой-то простой функцией :)
  14. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    И что произошло под новый год? Все были пьяные а вы трезвый или наоборот?
  15. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Я какое-то время не играл (может, около месяца). А рейтинг-система на КГС устроена так, что после этого повышается чувствительность к результатам сыгранных партий. Поэтому стоило выиграть несколько игр подряд, и рейтинг скакнул вверх. Потом статистика взяла своё, и всё устаканилось обратно.
  16. TopicStarter Overlay

    Цубаки Сандзюро Учаcтник

    • Участник
    Рег.:
    14.11.2013
    Сообщения:
    570
    Симпатии:
    196
    Репутация:
    48
    Оффлайн

    Почему нет? Что-то близкое к прямой, а разовый "выбрык" с точки зрения статистики не имеет значения.
    Ситуация примерно такая: если мы играем в "орел-решка", подбрасывая монетку, то теоретически может раз 10 подряд выпасть "решка". Но это не опровергнет теорию вероятностей. Потому что потом все равно законы возьмут свое, все устаканится. Вы же сами написали, что этот пик объясняется особенностями рейтинг-системы, поэтому его не нужно учитывать.

Поделиться этой страницей