Исследование Фрукта

Discussion in 'Машинное отделение' started by WildCat, 15 Dec 2006.

  1. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Насчет защищенности короля - для меня это откровение.
    Получается что моя защищенность (на несколько строк) лучше навороченной в Фрукте?

    Я посмотрел рейтинги CCRL с контролем 40/40 :)
    Судя по ним - да, именно в его силу и играет.
    Причем если сравнивать с 2.0 - то получается тоже самое (правда на CCRL 2.0 нет, но есть на WBEC, и можно сравнить посмотрев на близкие по силе движки)
    Вот посчитанные рейтинги WBEC рядом с Fruit 2.0 (а 2.1 сильнее на 60 пунктов)

    Code:
      38 List 512                   534   30   30   368   51%   526   37% 
      39 Pharaon 3.2-64             533   59   59    92   54%   508   34% 
      40 SlowChess blitz WV2        525   41   41   184   45%   560   39% 
      41 Jonny 2.83-x64             525  103  100    32   56%   485   25% 
      42 Glaurung 051226            524  101   98    32   56%   485   31% 
      43 SOS 5.1 ssb                523  103  102    32   52%   511   22% 
      44 Ruffian 0.76               523   88   82    52   69%   383   19% 
      45 Crafty-19.13-64            519   57   57    92   56%   478   47% 
      46 DeepSjeng 1.5              518   39   38   236   69%   381   32% 
      47 SlowChess blitz WV         518   51   50   124   54%   491   38% 
      48 Aristarch 4.41             517   73   71    64   59%   456   30% 
      49 Fruit 2.0                  516   60   60    92   51%   509   28% 
      50 Pseudo 0.7c                513   35   34   304   61%   436   31% 
      51 Crafty 19.20 x64BH         510   42   42   184   43%   561   33% 
      52 Ruffian 1.0.5              510   63   61    84   66%   406   39% 
      53 Naum 1.82                  510   59   59    92   45%   541   34% 
      54 Maestro 1.08uci            508   61   61    92   54%   479   25% 
      55 Crafty 19.20BH-x64         507   98   98    32   50%   512   38% 
      56 Ruffian 2.0.0              506   69   67    68   61%   437   40% 
      57 Jonny 2.86-amd64           505   60   61    92   39%   581   30% 
      58 Crafty 19.12               501   69   68    64   57%   457   42% 
      59 SmarThink 0.18a-r165       500   30   30   352   50%   500   38%
     
  2. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Хотя по результатам тестового матча разница между 2.0 и 2.1 получилась значительно больше - но партий не так уж и много, и возможно такой результат как раз из-за того что играли разные версии одной программы.
     
  3. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    Во Фрукте защищенность короля тянет на 100 пунктов, но это может быть завешенная оценка.
    У меня кстати, тоже примерно столько же по тестам между собственными модификациями.
     
  4. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    У меня только пешечный щит около короля, права рокировок, координата короля и оценка зажатой королем в углу ладьи.
    50 пунктов дает точно.
     
  5. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Еще конечно есть оценка пешек по координате - она тоже на защищенность влияет (не дает портить пешечные структуры на флангах до рокировки и т.д.)
    50 пунктов дает добавление Щита и Зажатой ладьи.
     
  6. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    У Фрукта только щит (там еще учитывается позиция короля) дает около 100. Но для точного значения было бы неплохо потестировать против других движков. Но цель нашего исследования просто определить в чем же силу Фрукта.
    Пока нашли, что щит очень важен, а атака на короля наоборот чуть-чуть вредит.

    После окончания этого турнира хочу проверить насколько важна скорость. А то немного удивительные результаты.
     
  7. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я влияние быстродействия тестировал (до появления информации на сайте Васика)
    У меня тоже получилось что удвоение дает больше 50 пунктов (Васик говорит о семидесяти)
     
  8. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    А как тестировал?
     
  9. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    1. Делал версии Анечки с разными вариантами контроля времени, и с разным, фиксированными, независимыми от того что шлет оболочка временем на ход.
    2. Я смотрел цифры на SSDF, зная разницу в быстродействии компьютеров.
    3. У меня же написан переходник :)
    Я могу давать разные контроли движкам.
    Сейчас запустил такой матч - Тога(1 сек на ход) против Тоги (2 сек на ход)
    Могу собрать турнир из таких движков с разным временем на обдумывание.
     
  10. Сергей С. Питер
    Оффлайн

    Сергей С. Питер Старожил

    Репутация:
    11
    А у меня такой вот вопрос . Насчет рейтингов программ. Преамбула.В середине 90-х продвинутые проги уже достигли рейтинга порядка 2500 , а на мощных компах типа Пентиум 233 ММХ уже под 2600 было. В реале в играх с людьми все вроде подтверждалось — даже за несколько лет до этого Genius3 ( за пятнадцать лет своего развития лучше он играть на стал , но это уже история ) обыграл Каспарова , причем по делу .Николича вообще уничтожил . В конце 90-х появились суперкомпы типа AMD K-2 - 450 и суперпроги уровня Fritz6 и Chesstiger 14 . Рейтинг был за 2700 , рапиды с элитой вроде подтверждали это. Давал жару Фриц6 Анандам, Адамсам, Лекам. Матчи Пентиума MMX со старыми прогами с AMD и новыми прогами подтверждали реальность усиления. Типа удвоение частоты даже на одной проге давало усиление около 80 пунктов эло. В начале века появились уже Пентиумы 3 с 1000 Мгц , но произошло волшебство — скорректировали рейтинги ( я имею ввиду не рейтинги разработчиков , а шведские. IKEA вроде , но точно не помню :) ) Понимаю причину - так бы Fritz6 на Pentiume D 3000 Мгц уже за 3200 Эло был бы. А современные проги на многоядерных процессорах уже и 3800 имели бы. Поняли всю абсурдность рейтингов , вычисляемым на основе матчев между роботами.И у Крамника борьбы не было бы вообще типа как пол-очка из шести. Но ведь никто не считал , что Гидра конкретно на такой порядок сильнее. Был нефарт у Адамса , комплекс черного ящика ( супермонстра ) как у Каспарова с Глубоко синим :) Жизнь показала , что есть и проги посильнее даже на простом компе. И с Рыбкой вопрос еще не ясен - сильнейший шахматист с антикомповским стилем игры может побороться еще , хоть и шансы его ниже. Амбула — что стоят эти рейтинги без игр с людьми? Для примера кмс Русанов М. с рейтингом 2420 в конце 90-х вполне на равных боролся с тем же гениусом 3 на компе , аналогичном Пентиуму ( AMD 486 100 = P 90 ) , да только не по 25 , а по 5 минут . В очень длинной борьбе проиграл , начав 3.5 из 4 . Он все удивлялся как там Каспаров и Николич умудрились " выступить " . Ну там Николич может мало с компом играл , А Каспаров то сотни партий именно с Гениусом у себя дома.
     
  11. thenewone
    Оффлайн

    thenewone Евгений Манев

    Репутация:
    1