Рейтинг программ - очередные обновления

Тема в разделе "Машинное отделение", создана пользователем NS, 30 июл 2006.

  1. Reader
    Оффлайн

    Reader Учаcтник

    Репутация:
    0
    Статистическая погрешность зависит от количества партий, а относительная сила игры компьютерных программ может быть различной в зависимости от времени. Потому что поведение алгоритма различно при различной доступной глубине. И уверенно экстраполировать результаты блиц партий на классику нельзя.
     
  2. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    При существующем ограничении на вычислительные мощности такая экстрапояция дает наиболее точные результаты.
     
  3. Reader
    Оффлайн

    Reader Учаcтник

    Репутация:
    0
    "some people insist to mistrust ratings lists."
    "that 'some people' were engine authors"
     
  4. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530

    Первые версии Витрувиуса заточены на позиционные жертвы качества, за счет чего его партии всегда интересно смотреть. Но сила его по сравнению с топовыми движками относительно невелика. Начиная с версии 1.12 Витрувиус уже не так охотно идет на жертвы качества. Что за версия 1.19 не знаю, сам в первый раз узнал. Интересно было бы потестировать.
     
  5. Valdemarro
    Оффлайн

    Valdemarro Учаcтник

    Репутация:
    0
    Что скажете про Рыбку 4,добавлена в Арену,как и Гудини 1,5.
    Анализирует она менее затратна для компа.
     
  6. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    627
  7. Crest
    Оффлайн

    Crest Админ, МГ Команда форума Команда форума

    Репутация:
    627
    Попробовал на тестовых позициях Стокфиш-4 и Комодо-5.1
    Вяленая рыба разочаровала. А вот Комод показал себя бодрячком! Пожалуй, попробую его в анализе.
     
  8. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Четвертый Стокфиш действительно не айс. Но вот здесь http://abrok.eu/stockfish/ публикуются свежие версии коллективной доводки Стакфиша 2.3.1 (насколько я понял), и они играют, практически. наравне с третьим Гудини.

    Ну, вот, к примеру, результат одного из моих тестов, контроль времени 5+5:

    008 Стокфиш сентябрьский-2 2013

    1 2 3 4 5 6 7 8 9 0 1
    1 Stockfish 110913 64 **** 11Ѕ0 1Ѕ1Ѕ 101Ѕ ЅЅ11 Ѕ0ЅЅ 1Ѕ10 ЅЅ01 0Ѕ01 1Ѕ11 11Ѕ1 25.5/40 484.00
    2 Houdini 3a Pro x64 00Ѕ1 **** Ѕ101 1101 ЅЅ0Ѕ 011Ѕ 1110 0ЅЅ1 Ѕ10Ѕ 1Ѕ11 1111 25.5/40 469.25
    3 Houdini 3 Pro x64(Tr) 0Ѕ0Ѕ Ѕ010 **** 1111 101Ѕ Ѕ010 0Ѕ10 1111 1101 01ЅЅ 1Ѕ11 24.5/40
    4 Houdini 2.0c x64 010Ѕ 0010 0000 **** ЅЅ10 0111 ЅЅ11 111Ѕ ЅЅ01 Ѕ1Ѕ1 ЅЅ11 22.0/40
    5 Houdini 3 Pro x64 ЅЅ00 ЅЅ1Ѕ 010Ѕ ЅЅ01 **** 0111 Ѕ01Ѕ Ѕ00Ѕ 1Ѕ01 1100 1111 21.5/40
    6 Komodo 5.1r1 64-bit Ѕ1ЅЅ 100Ѕ Ѕ101 1000 1000 **** Ѕ100 11Ѕ1 1Ѕ0Ѕ 011Ѕ 1110 21.0/40
    7 Houdini 1.5a x64 0Ѕ01 0001 1Ѕ01 ЅЅ00 Ѕ10Ѕ Ѕ011 **** Ѕ100 1Ѕ01 1Ѕ01 1Ѕ11 20.5/40
    8 Critter 1.6a 64-bit ЅЅ10 1ЅЅ0 0000 000Ѕ Ѕ11Ѕ 00Ѕ0 Ѕ011 **** ЅЅЅЅ ЅЅЅ1 111Ѕ 18.5/40
    9 Strelka 5.5 x64 1Ѕ10 Ѕ01Ѕ 0010 ЅЅ10 0Ѕ10 0Ѕ1Ѕ 0Ѕ10 ЅЅЅЅ **** Ѕ0Ѕ1 10Ѕ0 18.0/40
    10 Bouquet 1.8 x64 win 0Ѕ00 0Ѕ00 10ЅЅ Ѕ0Ѕ0 0011 100Ѕ 0Ѕ10 ЅЅЅ0 Ѕ1Ѕ0 **** 011Ѕ 15.0/40
    11 Sting SF 4 beta 00Ѕ0 0000 0Ѕ00 ЅЅ00 0000 0001 0Ѕ00 000Ѕ 01Ѕ1 100Ѕ **** 8.0/40

    Неплох также и Амитис. который основан на том же Стокфише.
     
  9. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    У меня Стокфиши (что 2-й, что 4-й) отстают от Гудини 1.5 на 200 пунктов.
    Правда, условия моих тестов очень спартанские - железо далеко от топового, система 32-битная.
    Видимо, нынешние движки под такое уже не оптимизируют.
     
  10. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Вряд ли железо имеет решающее значение - движки же все находятся в одинаковых условиях. И посмотрите по ссылке, что я дал - 32-х битные движки тоже имеются в наличии. Скачивайте, тестируйте.
     
  11. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Я знаю, что 32-битные движки имеются в наличии :)
    Собственно, их и тестировал. Результат - превосходство Гудини 1.5 на 200 пунктов над новым Стокфишем.
     
  12. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Вы именно отсюда скачивали: http://abrok.eu/stockfish/ ?
     
  13. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Нет, с официального сайта.
    http://stockfishchess.org/download/
     
  14. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    я давал критические позиции из моих партий с полузакрытой пешечной структурой играть между собой Стокфишу и Гудини, Гудини чаще выигрывает. он еще сильнее как не крути. Киньте плиз в личку кто-нить ссылку, где можно Комодо скачать без лишних заморочек.
     
  15. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Так, а что вам мешает скачать одну из свежих версий по моей ссылке?
    Я вот сегодня запустил турнир 1+1 версии от 5 октября против Гудка, и вот что наблюдаю:

    019 Стокфиш октябрьский против Гудка 2013

    1 Stockfish 051013 64 +66 +25/=26/-13 59.38% 38.0/64
    2 Houdini 3 Pro x64 -66 +13/=26/-25 40.63% 26.0/64
     
  16. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Ничего, кроме необходимости заниматься и другими делами :)
    Будет время - потестирую и эти. А они сильно друг от друга отличаются?
     
  17. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Они все сильно отличаются от официальных релизов силой игры. Там люди постоянно вносят в код программы какие-то изменения, которые понемногу усиливают (считается, что усиливают) движок Стокфиш. По крайней мере, на моем компе, как видите, он уже Гудка бьет. Правда, с Комодо он играет примерно на равных. Тем не менее, если использовать вяленого, то не четвертую версию явно.
     
  18. Мастер Икс
    Оффлайн

    Мастер Икс Василий Щепетнев Команда форума

    Репутация:
    19
    А зачем же в личку? Адрес известен, http://komodochess.com, сорок долларов всё удовольствие.
     
  19. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    в этом и печалька, если бы я зарабатывал шахматами на жизнь, то купил бы не вопрос, но мне просто побаловаться, 40 долларов для меня грабеж.
     
  20. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    В том-то и дело: удовольствие получишь сомнительное, а деньги заплатишь реальные.
     
  21. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Скачал для проверки новую версию Стокфиша, сыграл турнирчик. Всё как всегда, чуда не произошло.

    Код:
       Engine             Score    Ho   St   Ry   St   Iv   Ro    S-B
    1: Houdini 1.5a       13.0/20 ···· =111 =1== 01== =011 =1==  124.25
    2: Stockfish 4        11.5/20 =000 ···· 1110 1=== =110 ==11  104.00
    3: Rybka 4            10.0/20 =0== 0001 ···· =011 10== 1=1=   94.25
    4: Stockfish 4.131018 9.5/20  10== 0=== =100 ···· 01=1 ==10   94.50
    5: IvanHoe 999946f    8.5/20  =100 =001 01== 10=0 ···· ====   86.00
    6: RobboLito 0.086h   7.5/20  =0== ==00 0=0= ==01 ==== ····   77.00
    
    60 games played / Tournament is finished
    Name of the tournament: Test
    Site/ Country: BEAR-HOME, Россия
    Level: Blitz 1/1
    Hardware: AMD Phenom(tm) II X4 955 Processor 3200 MHz with 2.0 GB Memory
    Operating system: Microsoft Windows XP Professional Service Pack 3 (Build 2600) 32 bit
    PGN-File: E:\CHESS\Arena\Tournaments\Test.pgn
    Website: 
    E-Mail Address: 
     
  22. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    А вы на скольких ядрах Стокфиша тестили? Там если больше двух ядер, то надо вручную выставлять, иначе это фора для конкурентов.
     
  23. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    У меня все на одном ядре играют.
    Запустил сейчас ещё один турнир с точно такими же участниками. Вечером отпишусь о результатах.
     
  24. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    WinPooh, вы в Арене тестируете. Я заметил, что Арена часто дает разный хэш движкам, а это тоже влияет на результаты. По-крайней мере, у меня так. Самая некосячная оболочка, это Фриц. Советую все же скачать ее и в ней тестить.
     
  25. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Не представляю, как такое может быть - движок выделяет хэш себе сам, оболочка только говорит ему: setoption name hash value 128.
    Но по просьбам трудящихся проверю и во Фрице.
     
  26. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Да, если можно. Во Фрице у меня только Гудок 3 косячит иногда, проигрывая по времени. Но тут, возможно, это происходит от общей загруженности компа. Другие движки нормально играют. По крайней мере совет: перед новым тестом перезагрузитесь и до конца теста не останавливайте соревнование. Желательно и комп посторонними резидентами не нагружать.
     
  27. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Владрусс так может в адванс начнете играть? Че попусту то комп гонять. Я вот в турнирчег записался один, интересно.
     
  28. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Не интересно. Смысла не вижу. Если играть, то самому.
     
  29. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    дык самому и надо играть, комп тока как калькулятор.
     
  30. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Нашёл у себя ошибку в конфигурации Рыбки и Гудини - использовали по 4 ядра...
    Перезапустил турнир в 10-м Фрице. Правда, там Айвенго почему-то добавить не получается.
     
  31. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    Айвенго по нынешним временам отстой. Не стОит расстраиваться.
     
  32. Vladruss
    Оффлайн

    Vladruss НедоКМС, победитель второразрядников. баннер

    Репутация:
    530
    WinPooh, как дела в тестировании с новыми настройками?
     
  33. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Пока турнир пришлось прервать. После 5 или 6 туров лидировал всё тот же Гудини, версия 1.5 трёхлетней давности...
    Но Стокфиши подбираются всё ближе. Посмотрим, что будет на длинной дистанции.
    На этой неделе будет возможность прогнать турниры с большим кол-вом кругов.
     
  34. JIexa
    Оффлайн

    JIexa Алексей

    Репутация:
    3
    А смысл гонять бесконечные турниры движков? Ладно бы с вменяемым контролем, а то по минуте на партию или даже по 5 это ж вообще нечто нездоровое. С людьми играть интереснее, даже если все вооружены и опасны.