Турнир движков СНГ

Discussion in 'Машинное отделение' started by WildCat, 8 May 2006.

  1. krey
    Оффлайн

    krey Михаил Кройтор Staff Member Команда форума

    Репутация:
    1
    поздравляю и желаю удачи :)
    а вот маленькая подборка из 20 позиций из этюдов. редко какой движок берет хотя бы 50%... Этюды сами включены - дабы вы могли свериться с решением.
    Результаты Shredder 10 на 10 сек (PIII, 500):
    Кстати, у меня проблема подключения WildCat при помощи WB2UCI - движок при работе через адаптер отвечает сразу, не думает. в чем дело?
     
  2. Vadim
    Оффлайн

    Vadim баннер

    Репутация:
    0
    А в переходном турнире за право выступить в 3-м дивизионе все запуталось.
    Оба лидера пролетели по 1:3 и все стало совсм непонятно
    Получилось Arion +2, AICE + 1, Scidlet +3 , Djinn +2 , Horizon -1, Zeus +2 , Gaia +1 , Delphil -4 , CyberPagno -9
    В 3-й дивизион проходят только четверо, а 7 движков имеют почти равновероятные шансы на место с 1го по 7-е

    http://wbec-ridderkerk.nl/html/promotion.htm
     
  3. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    О том, как Кошки лакомятся Рыбками:

    [Event "WC"]
    [Site "Sempron 3000+; Hash 128 Mb; EGTB 3, 4"]
    [Date "2006.6.8"]
    [Round "1"]
    [White "Rybka 1.0 Beta 32-bit"]
    [Black "WildCat 6"]
    [Result "0-1"]
    [TimeControl "120+1"]

    1.e4 e5 2.Nc3 Nc6 3.Nf3 Nf6 4.Bc4 Bc5 5.O-O d6 6.Na4 O-O 7.Nxc5 dxc5 8.d3 Be6 9.Bxe6 fxe6 10.Qe2 Qd6 11.Bd2 Rf7 12.a4 Raf8 13.Bc3 Nd7 14.Nd2 Nd4 15.Bxd4 exd4 16.Nc4 Qf4 17.g3 Qg5 18.Ra3 b6 19.Kg2 a5 20.Rb3 Rf6 21.h4 Qg6 22.Rb5 Rf4 23.Kh2 Rxh4+ 24.Kg2 Qg5 25.f3 Rh6 26.f4 Qg6 27.Rb3 Rh5 28.Qf3 e5 29.f5 Qg5 30.Qf2 Qh6 31.Qf3 Rh2+ 32.Kg1 Rxc2 33.Rf2 Rc1+ 34.Rf1 g6 35.g4 gxf5 36.exf5 Nf6 37.Ra3 Rxf1+ 38.Kxf1 e4 39.Qg2 Qc1+ 40.Kf2 exd3 41.g5 Nh5 42.Qd5+ Rf7 43.Qa8+ Kg7 44.Qf3 Qxc4 45.Rxd3 Qc2+ 46.Kg1 Qc1+ 47.Kh2
    {White resigns}
    0-1
     
  4. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    16 + 16:

    Anechka 0.05a - Bestia 0.90 - 22.5 : 27.5
    Anechka 0.05a - GreKo 3.2 - 20 : 30
    Anechka 0.05a - Zeus 1.25 - 17 : 33
    Anechka 0.05a - Eeyore 1.48 - 15.5 : 34.5


    Т.о. говорить о каком-то усилении при удлинении контроля очень трудно.

    Реультаты против:
    - Иа-Иа(1+1 - 4+4 - 16+16): 17 - 17 - 15.5
    - Зевс : 20 - 16.5 - 17
    - ГреКо : 22.5 - 21 - 20
    - Бестия : 13.5 - 25.5 - 22.5

    Видим, что выделяется только аномально плохой результат против Бестии при 1+1.
    Все остальные результаты говорят о очень незначительном ослаблении Анечки при удлинении контроля.

    Вообще, высказывания авторов о том, что их движки играю лучше при длинных контролях в 99% случаев просто заблуждение.

    За то есть движок точно хуже играющий при длинных контролях. Это Amyan. У ранних версий Кошки это тоже было заметно. Сейчас уже гораздо меньше. Если вообще есть.
     
  5. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Есть сайты, на которых сначала считается блицевый рейтинг (квалификация), потом на длинных контролях... И почему-то там данные соответствуют моим - при удлинении контроля сила растет.
    Насчет версии 0.05a - насчет того, что относительно Бестии сила растет быстрее - всё-таки правда? Я об этом и говорил с самого начала...
    Ослабление может и есть. У версии 0.05a, у версии 0.06a ослабления с увеличением контроля нет. И опять-же - зависит с кем сравнивать.
    Любой селективный метод дает более быстрый рост с увеличением контроля - Лучшая сортировка ходов. Хистори, Null Move...
    ЗЫ. Падение на контрле 16+16 в пределах погрешности...
    Достоверным судя по всему явлется только факт, что Версия 0.05a не умеет играть с Бестией на коротких контролях... Слишком уж большая разница.
    В версии 0.05a, вообще не было сортировки ходов - только сортировка Взятий в ФВ (не в ФВ - взятия даже в начало не вытягивались. Работал только Хеш)
     
  6. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Запустил Небольшой Гаунлет с контролем 1+1 с тем же составом, только Анчка 0.06a. Тут будет намного более удачный результат :)
     
  7. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Да уж... Остановил турнир - нашел жуткий глюк...
    1B2nrk1/2pp1ppp/4p3/1Pb1P3/8/6P1/PP2PP1P/2R2K2 b - - 4 18
    В этой позиции Анечка ходит Bc5-a7, так как хода Bb8xa7 в ответ нет! :)
    После генерации ходов этот ход почему-то заменяется на пустой.
    Буду искать в чем дело :)
     
  8. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    >Есть сайты, на которых сначала считается блицевый рейтинг (квалификация), потом на длинных контролях... И почему-то там данные соответствуют моим - при удлинении контроля сила растет.

    Возможно там было очень мало игр. У меня тоже маловато. Но достаточно, чтобы увидеть что явного усиления нет.
     
  9. krey
    Оффлайн

    krey Михаил Кройтор Staff Member Команда форума

    Репутация:
    1
    Игорь, ты получил от меня письмо? твой почтовый сервер несколько раз возвращал его
     
  10. Schurick
    Оффлайн

    Schurick Старожил

    Репутация:
    6
    Сорри за оффтоп... Где можно скачать код Fruit?
     
  11. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Кому как не мне?:).....ftp://cito.kicks-ass.net/pub/Other-Engines/Fruit-21.zip....вместе с прогой и исходники
     
  12. WildCat
    Оффлайн

    WildCat Коршунов Игорь Staff Member

    Репутация:
    0
    Krey!

    Не получал. Напиши на: igorkorshunov [at] yandex [dot] ru
     
  13. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Нашел ошибку. В случае если есть взятие белопольного слона вниз/вправо, то из списка ходов исключались один/два хода :)
    Вообще не понимаю как программа могла играть с такой ошибкой...
    Внесена ошибка начиная с версии 0.05d
    Сейчас выложу версию 0.06b с уже исправленной ошибкой.
     
  14. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Назвал всё-таки версию 0.07, хотя в ней и очень мало изменений.
    На UEL преодолел рубеж в 2300 ELO (Тут здорово занижены рейтинги)
    http://perso.orange.fr/lefouduroi/tournois/uci/uel.htm
    Наконец хоть где-то (хоть и случайно) обогнал по рейтингу Booot-а!!!!!
    Теперь могу наверно не беспокоиться насчет 5-го места в третьей лиге :)
     
  15. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
  16. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    Наконец хоть где-то (хоть и случайно) обогнал по рейтингу Booot-а!!!!!

    Почему случайно? :). На то это и аматерское программирование, что одна хорошо отлаженная версия, пусть пока и без примочек, играет сильнее, чем напичканая знаниями но глючная :).
     
  17. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    на UEL Booot чудеса творит :). При контроле 5 минут на партию кого успеет за 20-30 ходов грохнуть,там и 1 в таблице имеет, а иначе к 35 ходу имеет 10 секунд оставшихся и героически роняет флаг :). Хотя уже при контроле 5 +3 несмотря на тот же глюк к 35 ходу уже хотя бы по 3 секунды на ход имеет и занимает при том же составе участников совсем другое место. Выпустил я обновление, где этот глюк нещадно пофиксен. Так что жду на UEL рейтинг соответсвующий .
     
  18. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я про случайность не к тому, что у Анечки рейтинг завышен - он примерно такой и есть,
    а к тому, что у Booot-а занижен из-за просрочек... :)
     
  19. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    Так и я об этом же: Анечка с исправленным глюком вполне заслуженно играет сильнее, чем booot с глюком привнесенным :). Так что ничего случайного нет! А Анечке будет непросто в 5 войти на WBEC, хотя и по силам.
     
  20. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Еслиб было время, то часов за 40 программинга можно было бы усилить версию достаточно серьезно, и быть уверенным на счет первой пятерки.
    Но нет этих сорока часов :(
     
  21. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
  22. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Я для себя прописал действия для увеличения силы игры на коротких контролях -
    1. Не использовать History (LMR) на первых полуходах.
    2. Отсекать заведомо некорректные взятия в ФВ
    3. Lazy Eval
    4. Продумать переборные алгоритмы на трех последних полуходах.
    5. Поднять NPS
    6. Возможно опять добавлю шах на входе в ФВ...
    И с оценкой. Мне сказали, что моя оценка материала - 1,3,3,5,9 - безнадежно устарела... :)
    И надо срочно делать нормальную защищенность короля и эндшпельную оценку.
     
  23. morkoffkin
    Оффлайн

    morkoffkin Учаcтник

    Репутация:
    0
    А как нынче материал оценивают?
     
  24. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Слон,конь - четыре пешки, ладья - шесть, ферзь - 12...
    1,4,4,6,12...
     
  25. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    у меня 1 3 3 5 9. Только в эндшпиле еще поправочные коэффициенты присутствуют, чтобы если уж и жертвовать фигуры, то уж хоть в эндшпиль с их недостачей не идти. Работает так себе...
     
  26. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Значит я не один такой, с устаревшими весами :)
     
  27. Crest
    Оффлайн

    Crest Админ, МГ Staff Member Команда форума

    Репутация:
    633
    В миттельшпиле слон ближе к 4-м пешкам, чем к 3-м. Коня в миттельшпиле я бы оценил в 3,5.
     
  28. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Человек оценивает не как программа.
    А программе нужно чтоб качество было равно примерно двум пешкам, а две легкие фигуры ладье и двум пешкам,
    иначе начинаются нелепые размены...
    B+2=R
    B*2=R+2;
    =>
    B+2=B*2-2
    B+4=B*2
    B=4...
    Сейчас и слона и коня оценвают больше, чем в четыре пешки. Слона чуть больше, чем коня.
    Попробую протестировать свою программу на более больших весах.
     
  29. Crest
    Оффлайн

    Crest Админ, МГ Staff Member Команда форума

    Репутация:
    633
    А качество, по-моему, поменьше, чем 2 пешки. Полторы? Это реальнее.
    А с учетом разницы в силе слона и коня, качества бывают разные...
     
  30. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Разницу в силе коня и слона нельзя в программе делать большую.
    Распознать слабого слона против сильного коня достаточно проблематично, в итоге программа начинает отдавать сильных коней за слабых слонов, и жертвовать пешки за преимущество двух слонов.
    Качество за полторы пешки - то же начинаются нелепые жертвы - например качества за пешку+ сдваивание пешек у соперника и т.д. Верный путь к нулю в таблице у программы...
    Человек просто не замечает, что вдобавок прибавляет позиционные признаки - например качество отдают за пешку + разрушение пешечного прикрытия короля соперника (что само по себе может стоить больше пешки) и т.д.

    Насчет приравнять качество к легкой фигуре + полторы пешки: давно проверенно многими шахматными программистами - нельзя так делать. :)
    Так же как и полпешки разницы между слоном и конем. Это очень много.
     
  31. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    Все правильно! Но эти вопросы достаточно сложны: к примеру разрушающую жертву фигуры программа не будет делать почти ни при каких условиях (дорого). А начнешь подтягивать безопасность короля - начнет направо-налево жертвовать.
     
  32. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Хотя у меня качество ближе к полутора пешкам (чем к двум) - уменьшал стоимость ладьи, чтоб не отдавала две легкие фигуры за ладью и пешку. Хотя наверно правильней было увеличивать стоимость легкой фигуры... Меня просто переклинило на трех пешках за легкую фигуру (так меня учили :) )
    А сейчас не так просто увеличить стоимость - достаточно много времени потратил на балансировку соотношений стоимости фигур/ "тяжелых" позиционных признаков, придется всё делать заново.
     
  33. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Провел матч Анечки с Booot-ом 4.10.5
    Конечно это не 4.8... Похоже больше 150-200 пунтов поднял...
     
  34. krey
    Оффлайн

    krey Михаил Кройтор Staff Member Команда форума

    Репутация:
    1
    2WildCat
    Игорь, ты получил письмо? :)
     
  35. Booot
    Оффлайн

    Booot Учаcтник

    Репутация:
    0
    Сергей, а под какой оболочкой матч проводил? 150-200 пунктов пожалуй многовато... 100 - вроде более реальная цифра для оценки усиления booot. Кстати: с почином в третьем дивизионе WBEC!