Fritz 11 - клон Рыбки 2.3.2а

Discussion in 'Машинное отделение' started by immortal223, 1 Dec 2007.

  1. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    WildCat - это WB-движок, а не UCI.
     
  2. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    А я вопрос задал. Может, ответите, прежде чем советы давать?
     
  3. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Зачем с диллетантом зазря спорить?
     
  4. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    Я не спорю, а просто информирую.
     
  5. Kos
    Оффлайн

    Kos Учаcтник

    Репутация:
    0
    Виноват, недоглядел, хотя он у меня в оболочке обозначился как WildCat 7 UCI. А отчего же не UCI движок? Кто сейчас "винбоардом" пользуется? И ещё... кажите мне, господин недилетант, не у Вас ли Нефёдов набрался крамольных мыслей о том, что дебютная книга и таблицы Налимова не дают прибавки в силе? Если Вы так считаете, тогда лол.
     
  6. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Kos! Если бы Вы:

    а) заказали написание шахматного движка;
    б) написали техническое задание со своими требованиями к нему;
    в) оплатили его разработку;

    то тогда могли бы проявлять свое недовольство тем, что в нем чего-то не хватает. А бесплатному коню, как известно...
     
  7. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    4-х фигурные добавляют около 20 пунктов. Большие добавляют немного больше. Максимумом возможной прибавки для 5-фигурных баз считается 50 пунктов.

    Теоретически дебютные книги добавляют от -400 до +400 пунктов. Тут все зависит от конкретной книги. Теоретически имея большую книгу + большие ЭБ, движок вообще не нужен.
     
  8. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Если я не ошибаюсь (Игорь меня поправит), то под UCI кошка только анализирует, но не играет, а играет только как WB-движок
     
  9. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    Да, анализ пришлось прикрутить из-за глючности поддержки WB в UCI-оболочках.
     
  10. Kos
    Оффлайн

    Kos Учаcтник

    Репутация:
    0
    Золотые слова! По моим наблюдениям, двукратный перевес в таблицах даёт "лишних" 0.5 очка в 20 партиях (но конечно в разумных пределах, разница между 1Мб и 1Гб не может быть 500 очков в 20 партиях), сколько это в рейтинге не знаю, но "копейка рубль бережёт". :) В принципе, при длинной книге и больших таблицах движок нужен, чтобы рассчитать переход с книги в таблицы, результат зависит "от раздачи козырей" (у кого какая книга), но в идеале должна получиться ничья. Просто я долго спорил с NS, он отрицал роль книги и таблиц, и ссылался на Ваше авторитетное мнение. P.S. Осипов Юрий, согласен, виноват, больше не повторится. :)
     
  11. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    Ну я имел в виду, что теоретически возможна такая книга, что выходя из нее сразу попадаем в эндшпильные базы.
     
  12. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    Я ведь сказал что все мои оценки это моё IMHO, то есть моё личное мнение. Мнение остальных участников CCRL, к сожалению, не всегда совпадает с моим.

    Лично у меня движка Луп никогда не было, и, скорее всего, не будет. Он мне безразличен, поэтому мне побоку клон он или нет. Покупать его специально чтобы доказать что он клон я не собираюсь.
     
  13. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    «Побоку» - это конечно хорошо. Такая позиция имеет право на существование. :D Но мне не нравится травля Стрелки и Белки буржуями, которые ловко заметили соринку в глазе Стрелки/Белки, но в упор не замечают бревна у себя -> Loop
     
  14. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    Если вам нет толку от поднер хита - не смотрите его. Пондер хит - это измерение, произведённое определённым методом (описанным на нашем сайте). Это голая объективная реальность. Чтобы её объяснить можно строить разные теории. Если мы предоставляем вам данные пондер хит - это не обязательно означает что у нас есть объяснение любым аномалиям.

    На некоторые вопросы ответы уже есть, и ответы однозначные. Например, зависимость Тоги от Фрукта это факт, поэтому Тога и Фрукт у нас в одном семействе. Зависимость Стрелки от Рыбки - тоже факт, с которым бесполезно спорить. Даже если зависимость непрямая, а, например, через общие корни в виде фрукта. Что, в свою очередь, бесспорным фактом для меня не является. Остальные случаи высокого пондер хита пока что не имеют убедительного объяснения. Если вам достаточно высокого пондер хита чтобы что-то уверенно утверждать о Лупе или Фрице - пожалуйста, утверждайте. Я не против.
     
  15. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Ну, конечно, Kirr, покупать — не стоит, а вот если движок бесплатный, то зачем не доказать. Тогда видно не побоку.
     
  16. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    А я тоже посчитал корреляцию по ponderhit между Стрелкой 1.8 и Рыбкой 1.0 beta 32bit. Взял все те же 64 партии между ними, которые лежат на CCRL, и посчитал процент совпадений предсказанных ходов. В отличие от методики CCRL, я учитывал все ходы, кроме дебютных. Получилось 64,4% вместо 68,7%.

    Так что, здесь, как на парламентских выборах - главное "правильно" посчитать, чтобы получить нужный результат.
     
  17. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Из всего выше сказанного можно сделать вывод: «фтопку» пондер хит.

    Стрелка и Рыбка - не относятся к одному семейству, а значит их нужно опять развести
    ————-
    Луп и Тога совершенно разные движки, просто звёзды так расположились :)
     
  18. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    Да, бесплатные движки мне не побоку. Я интересуюсь ими и тестирую их. Появление нового сильного бесплатного движка - это всегда праздник. Тем более российского движка. Тем сильнее было моё разочарование.
     
  19. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    В смысле. Мы считаем пондер хит уже два года, где-то полтора года до появления Стрелки. Методика с момента создания (мной) ни разу не менялась. Все детали нашего метода подсчёта пондер хитов взяты не с потолка, а являются результатом анализа и попыток сделать пондер хит более информативной величиной. Например, полное исключение из обсчёта ничейных партий. Этим и объясняется то что ваш подсчёт дал меньшее число - ваш метод менее чувствителен за счёт того что вы используете больше шума.

    И потом, какой вывод вы хотите сделать из своего числа 64.4%? Само по себе оно ничего не может сказать. Как узнать много это или мало? Нужно сравнивать с другими парами. Я ведь не просто посмотрел на число 68.7% и заявил что это клон. Это число имеет смысл лишь в контексте остальных измерений. Как и рейтинг ЭЛО имеет смысл только в сравнении с другими рейтингами, а не сам по себе.

    Плюс, необходимо учесть возможную погрешность измерений. Поэтому нужно смотреть не на одну пару а на несколько, если есть возможность. В сравнении Стрелки и Рыбки такая возможность есть - уже есть данные по нескольким парам, все с высоким пондер хитом.
     
  20. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Kirr, я хорошо знаю, что в вашей методике исключаются ничейные партии, а также форсированные ходы и проигранные позиции. Не понимаю только, почему в ничейных партиях "больше шума".

    А насчет погрешности измерений - золотые слова. Хотелось бы, чтобы в данных о корреляции по ponderhit, Вы указывали не только сам процент совпадений, но и погрешность, с которой измерен этот процент, причем с обязательным упоминанием о доверительной вероятности.
     
  21. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Это шутка? :)

    Если из 100 ходов совпали 25, то процент равен 25 плюс-минус ноль, разве нет? Это же результат единичного измерения?
     
  22. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Нет, это не результат единичного измерения, это результат ста попыток из которых 25 удачные.
     
  23. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    Можно подбросить монетку 100 раз, и существует вероятность (маленькая, но ненулевая!), что все 100 раз монетка выпадет орлом.
    Или - можно провести турнир из 100 партий между Рыбкой 2.3.2а и движком из третьей сотни, и тоже существует вероятность (ненулевая!), что все 100 партий Рыбка проиграет.
    Из таких "исследований" тоже можно делать далеко идущие выводы, если не обращать внимания на законы мат. статистики.
     
  24. WinPooh
    Оффлайн

    WinPooh В.М. Staff Member

    Репутация:
    95
    Возражаю. Это не 100 разных попыток. Это 100 экспериментов с разными начальными условиями - позициями, в которых делается ход.

    Всё равно что при ста бросаниях кубика у него в разных попытках было бы то 5, то 6, то 10 граней. И по какому ансамблю прикажете усреднять?
     
  25. Kirr
    Оффлайн

    Kirr Staff Member Команда форума

    Репутация:
    8
    Сейчас опишу. Вот как протекает типичная ничейная партия между движками: Сначала на доску ставится дебют из книжки, потом движки его некоторое время играют. Затем после ряда разменов возникает тупик - позиция где обе стороны не могут найти усиления. Либо крепость где одна из сторон успешно держит оборону. Движки естественно совершенно не понимают этого свойства позиции, и продолжают её возить. Процесс возни может запросто длиться 100 ходов. В этом процессе пондер хит измерять бесполезно, так как делаются случайные ходы. В результате ничейные партии в среднем примерно на половину состоят из шума с точки зрения пондер хита. (Оценка на глаз).

    Согласен. Нужно напрячь головной мозг и понять как правильно посчитать доверительные интервалы.
     
  26. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я выкладывал программку для расчета (именно для такого случая)
    Если интересует теория, вот цитата:
     
  27. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    NS, как я понял, 1 - alpha = 0.99 и есть доверительная вероятность (иногда говорят уровень значимости). Т.е. с вероятностью 99% искомое значение находится в полученном интервале, а с вероятностью 1% может выходить за его пределы?
     
  28. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Да.
    Сейчас переделаю свою программульку, и выложу.
    Как обычно - принцип минимизации размеров доверительного интервала,
    Предположение о равномерном распределении вероятности угадывания в интервале 0%-100%.
     
  29. Kos
    Оффлайн

    Kos Учаcтник

    Репутация:
    0
    Ребята, отвлекитесь вы от цифр и формул! Посмотрите на жизнь. Kirr, ты считаешь, что стрелка- клон рыбки? Не пытаюсь тебя переубедить (ты всё равно не прийдёшь, несмотря на свои мощные компьютеры, играть со мной или против меня на плейчессе, а я буду с подозрением относиться к твоим цифрам и формулам), но вспомни, что ты сказал в аське, когда увидел стрелку1.8 (кажется 1.8 версия). Ты сказал, что 1.0 (первая версия) может быть и клон, а 1.8 наверняка не клон. Первое впечатление- самое правильное, там мозг свободен от цифр. :) А спроси иностранцев на плейчессе в EngineRoom? Большинство скажет, что не клон, там народ опытный, они не на цифры смотрят, а на свой опыт опираются, а опыта у них- вагон и маленькая тележка. Стрелкой на плейчессе в "безрыбных" турнирах можно играть, значит стрелка- не рыба. Сравни размер ехе. файла рыбы с стрелки- они значительно отличаются (про скорость умолчу). Схожесть в предлагаемых ходах можно объяснить одинаковыми законами шамат ("Ставьте ладью позади проходной пешки, кроме тех случаев, когда это плохо"- Петросян).
     
  30. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Клон/Не клон... Я считаю что то что писалась на основе Фрукта, и часть Таблиц заимствованно из Рыбки - это уже плохо. Нормальная программа - это та, которая писалась "с нуля", и все до единой таблицы (ОФ) в которой получены самостоятельно.
     
  31. Kos
    Оффлайн

    Kos Учаcтник

    Репутация:
    0
    Сергей, рассмотрим ситуацию. Страна "Забугорье" изобрела колесо. :) У страны "Наша-раша", чтобы не отставать, два выхода: 1. изобретать колесо 2. "скомуниздить" колесо у "Забугорья", разобрать, внести свои коррективы в их изобретение, и получить "рашен-колесо". :) Тебе какой вариант больше нравится? Мне- второй. Было много случаев, когда две Системы заимствовали друг у друга изобретения (вспомним, например, когда иуда-лётчик улетел на "МиГ"е в Японию, и нашим пришлось менять всю дорогостоящую систему распознавания "свой-чужой" на боевых самолётах). Вернёмся к нашим "фруктам"... Автор Фруита сделал код "фрукта" открытым, ему никто пальцы дверями не прищемлял, автор рыбки говорит, что похитить код рыбки- невозможно, какие могут быть проблемы? Переработка чужих идей на свой лад способствуют прогрессу в данной отрасли (если дойти до чужих идей займёт много времени). Что в этом зазорного?
     
  32. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1
    Ой, не думал что с Kos-ом соглашусь...
    +1 за #64 и 66
     
  33. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Kos, можно повторить такое-же колесо, а можно "позаимствовать" чужое.
    Взять алгоритмы, и повторить их - это нормально.
    Взять чужие алгоритмы и посчитать по ним свои таблицы - это нормально.
    А взять уже посчитанные чужие таблицы, писать на основе чужого кода - это ненормально.

    Если все так будут делать, то любые чемпионаты потеряют смысл. Все программы будут играть не слабее Фрукта. А когда доступны исходники Стрелки - не слабее Рыбки 1.0

    К моему посту #63 - программу нашел (причем какой-то странно-глючный вариант), а исходники нет :(
    Завтра напишу новую.
     
  34. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Code:
    program Project5;
    
    {$APPTYPE CONSOLE}
    
    uses
      SysUtils, math;
    var LogVer:array[1..999] of Extended;
    Var ver:array[0..1000] of Extended;
    var i,win,lost:integer;
    MaxLogV, DovVer, sumver:extended;
    Vgr,Ngr:integer;
    begin
      win:=20;
      lost:=30;
      DovVer:=0.99;
    
      MaxLogV:=win*ln(1/1000)+lost*ln((1-1/1000));
      for i:=1 to 999 do
       Begin
         LogVer[i]:=win*ln(i/1000)+lost*ln((1-i/1000));
         MaxLogV:=max(LogVer[i],MaxLogV);
       end;
    
      for i:=1 to 999 do
         LogVer[i]:=LogVer[i]-MaxLogV+100;
    
      sumver:=0;
      for i:=1 to 999 do
        Begin
         if LogVer[i]>-100 Then Ver[i]:=Exp(LogVer[i])
          else Ver[i]:=0;
         sumver:=sumver+ver[i];
        end;
      for i:=1 to 999 do ver[i]:=ver[i]/sumver;
    
      ver[0]:=0;
      ver[1000]:=0;
    
      sumver:=0;
      Ngr:=Trunc(1000*win/(win+lost));
      Vgr:=Ngr+1;
    
      while sumver<DovVer do
        Begin
          if Ver[Ngr]>Ver[Vgr] then
             Begin
               sumver:=Sumver+ver[Ngr];
               Ngr:=Ngr-1;
             end
           else
             Begin
               sumver:=Sumver+ver[Vgr];
               Vgr:=Vgr+1;
             end
        end;
        Writeln('[',Ngr/10:5:1,';',Vgr/10:5:1,']');
       sleep(10000);
    end.
     
  35. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Для задачи описанной выше (Деверительная вероятность 0.99, 50 испытаний, 20 удачных) правильный доверительный интервал:
    [ 23.7% ; 57.9% ]