Тестирование различных техник программирования шахматной игры

Тема в разделе "Машинное отделение", создана пользователем WildCat, 17 июл 2006.

  1. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    У меня есть только 4-фигурные. Вряд ли, большего размера базы будут полезны из-за своего размера (доступ получается очень медленный).
     
  2. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    То есть Прибавка - только если как в Шреддере? Все базы в удобном формате в памяти?
     
  3. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Не знаю насколько шреддеровские базы вообще полезны. Неужели никто до сих пор их не протестил? CCRL, что же Вы этим не занялись?
     
  4. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    У меня нет десятого Шреддера, иначе занялся бы наверное. Если хотите можете потестировать в нашем контроле, мы будем рады. Я думаю разница между Шреддером с таблицами Налимова и Шреддером с собственными таблицами будет почти незаметна, так как даже тесты движка с таблицами против движка совсем без таблиц показывают минимальную прибавку.

    Когда у меня будет полный набор шестифигурных таблиц Налимова, я выберу какой-нибудь движок и попробую протестировать его чтобы понять насколько шестифигурный набор выигрывает у пятифигурного. Вот это будет интересно. Ожидаю как минимум 40-50 пунктов.
     
  5. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Сомнительно. По той информации что я нашел - больше 20 пунктов сильным движкам Таблицы Налимова не дают....
    (чтоб прибавить 50 пунктов нужно чтоб Таблицы давали "лишние" пол-очка в каждой седьмой партии)
     
  6. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Fruit
    Промежуточные результаты есть какие? Как у тебя Кошка с базами работает?
     
  7. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Промежуточные результаты есть, интернета нет.:)

    Оболочка Shredder Classic 1.3, дебют - позиции типо нановских(Noomen), 5-ти фигурные подключены, кто может, тот пользуется. :)

    WildCat_6_03_02 - SmarThink 0.18a[lpha] 5.5 - 6.5 45.83%
    WildCat_6_03_02 - SmarThink 1.00(SNG3) 2.5 - 9.5 20.83%
    WildCat_6_03_02 - Toga II 1.2 2.0 - 10.0 16.67%
    WildCat_6_03_02 - Spike 1.2 Turin 2.5 - 9.5 20.83%
    WildCat_6_03_02 - Rybka 1.2 32-bit 0.5 - 11.5 4.17%
    WildCat_6_03_02 - Ktulu 8.0 5.5 - 6.5 45.83%
    WildCat_6_03_02 - Hiarcs X50 UCI 3.0 - 9.0 25.00%
    WildCat_6_03_02 - Glaurung 1.2 6.5 - 5.5 54.17%
    WildCat_6_03_02 - Anechka 0.07 10.5 - 0.5 95.45%
    WildCat_6_03_02 - Shredder 10 UCI 1.0 - 10.0 9.09%
    39.5 - 78.5 33.47%

    118 из 300 партий сыграно
    Уровень: 4 мин./партия + 2 сек./ход

    Конечно, с противниками я переборщил, ибо средняков надо было бы больше.
    Ещё, 4+2 оказался очень медленным контролем :)
     
  8. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Соперники нужны с рейтом около 2600. Не заметил глюков при использовании эндшпильных баз?
     
  9. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Ну, соперников с таким рейтом добавлю.....Глюков при использовании баз не заметил, потому что матчи запускаю, преимущественно, ночью. Кстати, Wildcat разве использует TB?
     
  10. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    А ты ему путь к базам в ini не устанавливал?
     
  11. Kirr
    Оффлайн

    Kirr Команда форума Команда форума

    Репутация:
    8
    Так это пяти-фигурные таблицы. Шести-фигурные, я надеюсь, обеспечат большее усиление. Я надеюсь на 30 пунктов по сравнению с пяти-фигурным набором, и на 60 сильнее чем совсем без таблиц. Буду праздновать если разница окажется больше. :)
     
  12. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Не многовато ли? :)
    Тестовый матч Рыбка 2.1с, одна версия - включены TBs, и в движке и в оболочке, у второй отключено и там, и там... Основные шестифигурные. Дебютная - 150 дебютных позиций из Хиаркса 10 (матч из 300 партий) Текущий результат:


    Код:
    1   Rybka 2.1c 32-bit No TBs  +47/-38/=110 52.31  102.0/195
    2   Rybka 2.1c 32-bit         +38/-47/=110 47.69   93.0/195
     
  13. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Пятифигурные не дают 30 пунктов. По найденной мной информации <20 пунктов они дают сильнейшим движкам...
     
  14. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Компьютерный чекерс погиб из-за того, что базы прибавляли слишком много силы программам. Тут не до праздников :(
     
  15. morkoffkin
    Оффлайн

    morkoffkin Учаcтник

    Репутация:
    0
    Кажется чекерс уже доказан :)
     
  16. atoku
    Оффлайн

    atoku Модератор

    Репутация:
    0
    И каков результа? Всегда победа Красных ;)?
     
  17. morkoffkin
    Оффлайн

    morkoffkin Учаcтник

    Репутация:
    0
  18. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Кто может гарантировать, что в "доказавшей" программе нет ошибок?
     
  19. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    (Wikipedia - "English Draughts")
     
  20. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Насколько я знаю, доказательство очень условное, у некоторых вариантов количество полуходов до базы может превышать 100, т.е. доказательство не полное.
    А отсечь такой вариант можно только по ОФ (т.е. эвристически).
     
  21. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Нет. Не додумался. :(.....Теперь и вторую версию придётся без них тестировать.
     
  22. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Ладно. Они особого значения не имеют.
     
  23. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Не окажется он в начале списка если нет сортировки по истории :)
    Деже если сортировать по истории (а это практически обязательно, так как в таком случае намного проще и четче собирается правильная статистика), то схема Фрукта - не очень хороша, так как правильную историю можно явно собирать четче (и соответственно быстрее) Ходы которые изначально имеют плохую историю, и оказались в конце списка будут её повышать - не зависимо от того насколько плох ход, а которые оказались в начале списка - понижать, независимо от того, насколько ход хорош...
    Я могу построить мат. модель (не привязанную конкретно к шахматам) - и на ней оттестировать схему Фрукта, и какую-нибудь более продвинутую.

    У меня Тип фигуры, откуда, куда - полная статистика. Медленней собирается история, но намного четче.
     
  24. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Ну совсем плохой ход не сможет повышать свою статистику. Даже если так случится, то будет ему +1. Он станет первым киллером. В следущий раз -1 и становится вторым киллером. Затем еще -1 и вылетает из киллеров.

    Итого получаем +1 и -2. Т.е. плохие ходы будут иметь плохую статичтику.
     
  25. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    По-моему киллерам ухудшать статистику вполне логично.
     
  26. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    На моих тестах - даже с сортировкой, лучше всё-таки не писать киллерам плохую оценку.
    Медленней собирается правильная история (Так как получается что тем, что ход оказался в начале списка - мы принудительно портим ему историю)
     
  27. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Конечно попробую - но проще сначала на мат. модели (мне во всяком случае)
    Дается распределение по вероятности того что ход опровергающий. И распределение вероятности что ход есть в позиции. (простая схема без киллеров и ходов из хеша)
    Ну а дальше упорядочиваем по статистике, только собираем её разными способами.
    Пишется весьма быстро, и достаточно четко можно оценить какой из методов лучше.
    (просто смотрим среднеквадратичного отклонение номера хода в отсортированном списке (берем уже все ходы) от реального порядка ходов по вероятности того что ход опровергающий)
     
  28. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Тестирование временно преостановил, ввиду переустановки системы, в результате чего, Shredder превратился в полуShredder.....Эх, а так всё хорошо начиналось. На инетовском счету чудесным образом появилось 350 баксов (откуда??), всё работало. Потом всё перестало работать - no signal, видете ли. :(
     
  29. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Закончилось тестирование версии, которая начисляет бонусы (по 0.05) ладье на 7-ой линии за каждую свободную рядом клетку (по этой линии). Ослабление на 19 пунктов :(
     
  30. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Хм...странно! Я смотрел некоторые партии. Вроде Wildcat лучше стал понимать значение 7-й... :(
    В связи с этим:
    1. Каким было тестирование? Сколько партий и каковы конкретные результаты?
    2. Есть предложение немного уменьшить бонус. :)
     
  31. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Конкретные результаты:
    - тестовая версия: +652, -579, =369
    - нормальная версия: +696, -553, =351
    Если найду достаточно тестеров, то попробую уменьшить бонус. Мое последнее тестирование заняло чуть больше месяца. Такими темпами оптимальное значение бонусов не найти.
     
  32. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Енто и я могу проверить (раз уж идея моя :) ).....Только заранее нужно подобрать тестовую группу, оболочку...
     
  33. WildCat
    Оффлайн

    WildCat Коршунов Игорь Команда форума

    Репутация:
    0
    Моя тестовая группа вот: www.igorkorshunov.narod.ru/6_06_04.html
    Можешь подобрать себе другую, но так, чтобы были движки той же силы. Очень сильные и очень слабые ни к чему.
    Оболочка для тестов вот здесь: www.kasparovchess.crestbook.com/viewtopic.php?id=623

    Какой бонус тебе кажется более разумным?
     
  34. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Shredder classic себя уже дискредитировал, когда не позволил закончить мой тест.... Wildcat GUI качал, но чем-то он мне не понравился, не помню уже чем. :) Дам ему 2-й шанс.

    На счёт бонусов. Можно посмотреть 0.03(разумный) и 0.07(прикольный). Второй, чтобы посмотреть каким образом это ухудшает игру.
     
  35. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Какая книга использовалась для тестирования?