Ипполитоообразные движки

Тема в разделе "Машинное отделение", создана пользователем Renegat23, 11 янв 2010.

  1. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    142
    Насчёт матча Гудини с Рыбкой - партий ИМХО достаточно. Гудини взял 59% очков, погрешность оценивают в районе 4% (лень проверять), т.е. матч показывает, что Гудини должен брать против Рыбки от 55 до 63%. Разница в силах между движками оказалась достаточно большой, чтобы после 40 партий всё стало более-менее ясно. А были бы силы поравнее (результат, допустим 21-19) - требовалось бы больше игр.
     
  2. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    14% - это не доля партий, и не процент набранных очков.
    Это вероятность того, что итоги матча нас обманывают, и Рыбка всё-таки сильнее.

    Вероятность небольшая, да. Скорее всего, Гудини круче.

    В качестве примера опять-таки приведу первый матч Карпова с Каспаровым. При счёте 5:0 соответствующая цифирь показывала бы, что Карпов сильнее с вероятностью, скажем, 70%. В реальности матч продолжился, и 30% Каспарова своё сыграли.

    Upd. Ну, собственно, и Мобуту о том же уже сказал.
     
    thenewone нравится это.
  3. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    142
    Шахматная начинка ИМХО в целом такая, что движки по-разному относятся к пешкам. Гудини не ценит пешки, швыряет их пригоршнями за что угодно: за качество, за инициативу, за фигуру, иногда вообще за так - ему плевать. А Рыбка наоборот, ценит пешки, готова отдавать за них всё, что попросит Гудини. Это ИМХО их главное отличие.

    В некоторых ситуациях правильнее подход Рыбки, в некоторых - подход Гудини. Кто бывает прав чаще? Нужна статистика.
     
  4. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    Странное сравнение, Володя.
    Разве Рыбка является юным, быстро обучающимся организмом, который от партии к партии становится сильнее?
    Разве Гудини страдает от истощения на фоне утомления? Разве его мучает бессонница? Причем, именно во второй половине матча! :cheerful:

    Это как раз тот случай, когда глубокие математизмы просто нелепы на фоне здравого смысла и всем известной реальности.
    .
     
  5. vitamix
    Оффлайн

    vitamix Команда форума

    Репутация:
    0
    По-моему, матчи движков и матчи людей - это настолько разные вещи, что их вообще нельзя сравнивать или переносить логику одних по отношению к другим.
    В конце концов, даже матч двух движков и матч двух людей по 50 партий не имеет смысла по совершенно разным причинам.
     
  6. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Вот как раз результаты этих чемпионатов мира еще меньше говорят о силе движков. Там больше имеет значение железо и дебютная книга.
     
  7. 17
    Оффлайн

    17 Учаcтник

    Репутация:
    0
    40 партий немало - кроме того чисто математическую модель немного хромаеть, так как вероятность победа 1-го движка не равна вероятности победы 2-го, так как они разные. Даже если движки были одинаковые, но их настройки разные - опять то-же заключение было бы.

    (имхо) без книги и без таблицы (предполагаю!) Гоудини выиграл бы еще более убедительно.
     
  8. grifsergei
    Оффлайн

    grifsergei Учаcтник

    Репутация:
    0
    Математизмы может и верны, но сам изначальный критерий ранжирования я считаю не правильно поставлен. 95% - значит достоверно. Тут говорится о лучше хуже, но совсем не содержится информации о том насколько.
    Считаю, что критерием должна быть разница между 1-м номером теста (наш выбор) и реально сильнейшим. И там все получается складно и с математикой и со здравым смыслом (я писал раньше программу).
     
  9. vitamix
    Оффлайн

    vitamix Команда форума

    Репутация:
    0
    Этим ЧМ-ы и интересны :) То, что один чистый движок сильнее другого - я и так знаю из тестов.
     
  10. phisey
    Оффлайн

    phisey Модератор

    Репутация:
    0
    Мне вот интересно как бы закончился матч если бы Гудини и Рыбка играли свои дебюты...
     
  11. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    Как видите, не все спецы доверяют этим тестам. :)
    Но это, как я понимаю, из чистой вредности. Мол, еще не доказано! Нужны формальные 99,9% ;)
    Ну, да ладно. Не суть.
     
  12. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Нужен хотя бы сухой счёт. Пусть без учёта ничьих :)
     
  13. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    Кому? И зачем?
    Мы ж сравниваем не Каспарова с любителем, а игроков соразмерных.
    А Каспаров у Карпова под ноль никогда не выигрывал - даже когда был ощутимо сильнее, и это всем было понятно.

    И почему сухой счет лучше мокрого? :D
    Скажем, Петросян мог выиграть у Глигорича со счетом 3-0 при большом количестве ничьих.
    А Таль у того же Глигорича: 7-2 при куда меньшем количестве ничьих. Просто по стилю так получалось.
    И что? Разве у кого-то были сомнения в том, что Таль сильнее Глигорича?

    И аналогия, кстати, недалека от истины. Гудини играет смело, инициативно. И несколько поражений в матче с достойным соперником - объективное следствие его боевого стиля.
     
  14. grifsergei
    Оффлайн

    grifsergei Учаcтник

    Репутация:
    0
    Гудини частенько не прочь скинуть крайнюю пешку, я ставил изначальную позицию без белой пешки а, не поверите оценка всего -0.07 ! у рыбки к примеру -0.3. Это накладывает отпечаток на игру. Я проводил тесты между гудини и рыбкой в чесс960, там у программ больше шансов продемонстрировать свой стиль. Считаю, что рыбка это гармония фигур+материал, гудини - инициатива.
     
  15. Greedy
    Оффлайн

    Greedy Учаcтник

    Репутация:
    0
    Оценка Гудини, видимо, ближе к истине. И фигурка, всё-таки, фигурка, а не три пешки. А некоторый пешки, иногда, совсем нулёвые, если не отравленные.
     
  16. Мобуту
    Оффлайн

    Мобуту спаситель нации баннер

    Репутация:
    142
    На всякий случай, опишу ход матча двух "К" с позиций "математизма".

    Сходятся примерно равные противники, смотри рейтинги. Для упрощения, всякую психологию выкидываем. Как и во всех матчах, победы и поражения имеют случайный характер. Наиболее вероятный результат - ничья, но в каждой партии есть какая-то небольшая вероятность выиграть или проиграть. Сначала Каспарову несколько раз не везёт. Там дебют не угадал, тут случайно люлей не раздал, там в цейтноте накосячил и т.д. Короче, за первые 10 бросаний кости выпало 4 шестёрки, статистическая флуктуация. Под конец не повезло в 47-й и 48-й партиях Карпову, т.е. пару раз выпала единичка. До этого он играл довольно уверенно, штамповали ничьи.

    А дальше, глядя на этот спортивный результат, красноречивые комментаторы задним числом создают "всем известную реальность". На основании результатов случайных бросаний монетки сочиняется красивая легенда о том, как проходил матч. Чисто спортивная лирика. Как водится, отправная точка - игнорирование случайного характера результатов спортивного противоборства: все результаты рассматриваются как закономерные и неизбежные. Под них подгоняется объяснение: мол, иначе и быть не могло. Каспаров слил первые несколько партий? Ну ясное дело, значит зелёный юнец. Потом перестал сливать? Значит, возмужал за месячишко. Карпов под конец продул две партии? Объясним истощением, утомлением, бессонницей, отвлекающими разговорами о досрочном прекращении матча и т.д. Ещё раз повторим, что иначе и быть не могло. И красивая легенда готова. То есть не легенда, а "всем известная реальность".

    В общем, эту "реальность" не стоит переоценивать. До матча никто не знал, как он пройдёт. Наверное, всем резко отказал здравый смысл. Дружно забыли, что Каспаров - зелёный юнец, которому во время матча предстоит крепко возмужать, а Карпов - быстроутомляющийся. Зато задним числом - все дружно прозрели. :)
     
    thenewone нравится это.
  17. AlekseyVishnyakov
    Оффлайн

    AlekseyVishnyakov Учаcтник

    Репутация:
    0
    А у Вас платный аккаунт на чессдом? Если нет, то обновление вариантов и оценок Стокфиша на экране скоро прекращается. Платные пользователи видят другую картину - варианты "Вяленого" обновляется все время обдумывания ходя противником. И то не всегда.
     
  18. Alexander
    Оффлайн

    Alexander баннер

    Репутация:
    43
    Насчет утомляемости. Ботвинник с прямотой патриарха заявлял, что если у Каспарова (против Карпова) к середине матча счет будет равный или даже -1, то его шансы предпочтительнее. Поэтому Гарик всегда и выигрывал решающие партии :)
     
  19. просроченый_кмс
    Оффлайн

    просроченый_кмс Старожил

    Репутация:
    6
    Во мне было бы интересно посмотреть матч гудини - совет из Крамника Ананда Каралсена, ну и Накамуру можно добавить.
    Контроль 2 часа на 40 ходов + 1 на 20, далее + 2 минуты на ход, что бы было время посовещаться.
     
  20. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Тысячу раз сказано, что не надо смотреть на оценку, которую показывает Гудини. В позициях с преимуществом до 1.5 пешек его выдаваемая оценка примерно в 3 раза меньше, чем та, которую он на самом деле считает и использует.
     
  21. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    Простите, но лично я это слышу в первый раз.
    Откуда взялось столь смелое утверждение?
    Кем и как доказано?
    И на кой авторам Гудини такая скрытность оценки?
    Неужто снова отголоски той песни про плагиат?
     
  22. просроченый_кмс
    Оффлайн

    просроченый_кмс Старожил

    Репутация:
    6
    Еслиб рыбка не лезла в осложнения могла бы свести матч в ничью.
    Вот я сел и сделал ничью с гудини. контроль час. При оценке -0,4 туда сюда ещё ходов 20 походили и всё, хотя не исключаю что ближе к 50 ходам при не движении пешек прога могла пойти на осложнения или двинуть пешку но позиция у меня крепкая поэтому я сказал хватит.
    [Event "Blitz:60'"]
    [Site "дом"]
    [Date "2011.02.07"]
    [Round "4"]
    [White "Андрей."]
    [Black "Houdini 1.5 w32"]
    [Result "*"]
    [PlyCount "62"]
    [EventDate "2011.??.??"]

    1. e4 c5 2. c3 Nf6 3. e5 Nd5 4. d4 cxd4 5. cxd4 d6 6. Nf3 Nc6 7. Bc4 e6 8. O-O
    Be7 9. exd6 Qxd6 10. Nc3 O-O 11. Re1 Rd8 12. Nxd5 exd5 13. Bb5 Bg4 14. Bxc6
    bxc6 15. Bd2 Bf6 16. Bc3 Re8 17. Qd3 Qd7 18. Ne5 Bxe5 19. Rxe5 Rxe5 20. dxe5 c5
    21. b4 Bf5 22. Qf3 c4 23. Qe3 Rd8 24. Qd4 h6 25. h3 a6 26. a3 Kh7 27. Kh2 Rc8
    28. Rd1 Bd3 29. Re1 Rc7 30. Kg1 Rc6 31. Kh2 Re6 *



    Потом двинул пешку на ф3 но позиция стала только крепче, при ферзь а4 возвращал своего на д2-б2.
    Чем хороши проги, они в отличие от гроссов не лезут в осложнения и их можно поймать на ничью.
     
  23. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Утверждение это взялось из первоисточника, т.е. из самого кода Гудини. Подробности приводить не буду - это для программистов. Но на самом деле все очень просто - достаточно найти функцию, которая печатает оценку и посмотреть, что ей подается на вход и что она выводит.

    Зачем это нужно? Ну наверно затем же, зачем Васику нужно было делить реальное число узлов на 7 и из реальной глубины вычитать 3.
     
  24. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    А ему оно зачем было нужно?

    Объяснение похоже на определение сепулек:
    Сепульки - это то, что производят в сепулькарии.
    А сепулькарий - место производства сепулек.
    :D
     
  25. bankuss
    Оффлайн

    bankuss Александр баннер

    Репутация:
    6
    заметание "фруктовых" следов в рыбке :)
    заметание "айвенговских" следов в гудини :)
     
  26. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    По результатам этого матча с 95% достоверности Гудини должен набирать в пределах 48.9% - 68.6% против Рыбки. Т.е. даже с такой низкой достоверностью нельзя говорить о превосходстве Гудини. Мы можно сказать, что вероятно Гудини сильнее. Но говорить, что Гудини достоверно сильнее нельзя.
     
  27. bankuss
    Оффлайн

    bankuss Александр баннер

    Репутация:
    6
    а какой смысл рассматривать этот матч отделно от других? есть тысячи партий, где Гуди уже показал свой перевес.
    нужно просто эти 40 партий прибавить в той тысяче-двум.
    и никаких споров о, "достоверно" или "не достоверно", можно не разводить.
     
  28. При_вет
    Оффлайн

    При_вет Учаcтник

    Репутация:
    0
    Помогите плиз скачал с торрента rybka 4 w32 идет на чессбасе вместе с фрицем и еще скачал дип рыбка аквариум 2010 там и дип rybka 4 и другие. :p

    1 вопр.) Там есть прога rybka 960 w32 что это такое (если кто знает пишите и ещекачественные ли там версси кто хочет попробовать скачайте программу u-torrent и закачайте торрент на сайте torrent-games.ru и как только он закачается нажимайте-опции,открыть и дальше все как обычно тем кто ответит даю + в рейтинге.
     
  29. grifsergei
    Оффлайн

    grifsergei Учаcтник

    Репутация:
    0
    Да в любом случае даже для оценки гудини -0,07 без "а" это мало, к примеру пешку б он оценивает правильно в 0.3.
     
  30. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    40 партий особо ничего не прибавят к уже имеющимся тысячам.

    Версия играющая в шахматы Фишера.
     
  31. bankuss
    Оффлайн

    bankuss Александр баннер

    Репутация:
    6
    что говорит о том, что Гудини достоверно сильней.
     
  32. При_вет
    Оффлайн

    При_вет Учаcтник

    Репутация:
    0
    Ув. Wildcat а что лучше дип rybka 4 или rybka 4 без дип. В игре разница есть или только в анализе?
     
  33. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Тысячи партий могут достоверно свидетельствовать о существенном перевесе Гудини. Но 40 партий не могут выявить этого перевеса, т.к. на такой малой дистанции статистический шум больше, чем разница в силе.

    Речь идет не о том, сильнее ли Гудини, а о том, что выводы из очень коротких матчей делать нужно очень осторожно.

    Дип - это версия для мультиядерных процессоров, чем больше ядер, тем сильнее играет.
    Без дип - использует только одно ядро.
     
  34. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    630
    Судя по интервалу 48.9% - 68.6% говорить о вполне достоверном превосходстве Гудини можно и нужно.
    Гауссов колокол, столь сильно (почти на 10% - это очень много) смещенный от отметки в 50% сомнений не оставляет. Сколько ни размазывай края этого колокола, весь его массив на стороне Гудини.
    По мне, так превосходство Гудини - установленный факт.
    При этом и сила Рыбки - тоже факт. Достойный соперник. Видимо, она в тройке лучших...
     
  35. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    На короткой дистанции более слабый движок может сделать больше сильных ходов.
    Если сила движков близка, то нужна очень длинная дистанция, чтобы можно было достоверно понять кто делает сильные ходы чаще.