Тестирование различных техник программирования шахматной игры

WildCat · 21 авг 2006

У меня есть только 4-фигурные. Вряд ли, большего размера базы будут полезны из-за своего размера (доступ получается очень медленный).

NS · 21 авг 2006

То есть Прибавка - только если как в Шреддере? Все базы в удобном формате в памяти?

WildCat · 21 авг 2006

Не знаю насколько шреддеровские базы вообще полезны. Неужели никто до сих пор их не протестил? CCRL, что же Вы этим не занялись?

Kirr · 21 авг 2006

У меня нет десятого Шреддера, иначе занялся бы наверное. Если хотите можете потестировать в нашем контроле, мы будем рады. Я думаю разница между Шреддером с таблицами Налимова и Шреддером с собственными таблицами будет почти незаметна, так как даже тесты движка с таблицами против движка совсем без таблиц показывают минимальную прибавку.

Когда у меня будет полный набор шестифигурных таблиц Налимова, я выберу какой-нибудь движок и попробую протестировать его чтобы понять насколько шестифигурный набор выигрывает у пятифигурного. Вот это будет интересно. Ожидаю как минимум 40-50 пунктов.

NS · 21 авг 2006

Сомнительно. По той информации что я нашел - больше 20 пунктов сильным движкам Таблицы Налимова не дают....
(чтоб прибавить 50 пунктов нужно чтоб Таблицы давали "лишние" пол-очка в каждой седьмой партии)

WildCat · 21 авг 2006

Fruit
Промежуточные результаты есть какие? Как у тебя Кошка с базами работает?

Fruit · 21 авг 2006

Промежуточные результаты есть, интернета нет.

Оболочка Shredder Classic 1.3, дебют - позиции типо нановских(Noomen), 5-ти фигурные подключены, кто может, тот пользуется.

WildCat_6_03_02 - SmarThink 0.18a[lpha] 5.5 - 6.5 45.83%
WildCat_6_03_02 - SmarThink 1.00(SNG3) 2.5 - 9.5 20.83%
WildCat_6_03_02 - Toga II 1.2 2.0 - 10.0 16.67%
WildCat_6_03_02 - Spike 1.2 Turin 2.5 - 9.5 20.83%
WildCat_6_03_02 - Rybka 1.2 32-bit 0.5 - 11.5 4.17%
WildCat_6_03_02 - Ktulu 8.0 5.5 - 6.5 45.83%
WildCat_6_03_02 - Hiarcs X50 UCI 3.0 - 9.0 25.00%
WildCat_6_03_02 - Glaurung 1.2 6.5 - 5.5 54.17%
WildCat_6_03_02 - Anechka 0.07 10.5 - 0.5 95.45%
WildCat_6_03_02 - Shredder 10 UCI 1.0 - 10.0 9.09%
39.5 - 78.5 33.47%

118 из 300 партий сыграно
Уровень: 4 мин./партия + 2 сек./ход

Конечно, с противниками я переборщил, ибо средняков надо было бы больше.
Ещё, 4+2 оказался очень медленным контролем

WildCat · 21 авг 2006

Соперники нужны с рейтом около 2600. Не заметил глюков при использовании эндшпильных баз?

Fruit · 21 авг 2006

Ну, соперников с таким рейтом добавлю.....Глюков при использовании баз не заметил, потому что матчи запускаю, преимущественно, ночью. Кстати, Wildcat разве использует TB?

WildCat · 21 авг 2006

А ты ему путь к базам в ini не устанавливал?

Kirr · 22 авг 2006

NS пишет:

Сомнительно. По той информации что я нашел - больше 20 пунктов сильным движкам Таблицы Налимова не дают....
(чтоб прибавить 50 пунктов нужно чтоб Таблицы давали "лишние" пол-очка в каждой седьмой партии)
Нажмите, чтобы раскрыть...

Так это пяти-фигурные таблицы. Шести-фигурные, я надеюсь, обеспечат большее усиление. Я надеюсь на 30 пунктов по сравнению с пяти-фигурным набором, и на 60 сильнее чем совсем без таблиц. Буду праздновать если разница окажется больше.

NS · 22 авг 2006

Не многовато ли?
Тестовый матч Рыбка 2.1с, одна версия - включены TBs, и в движке и в оболочке, у второй отключено и там, и там... Основные шестифигурные. Дебютная - 150 дебютных позиций из Хиаркса 10 (матч из 300 партий) Текущий результат:
Код:
1   Rybka 2.1c 32-bit No TBs  +47/-38/=110 52.31  102.0/195
2   Rybka 2.1c 32-bit         +38/-47/=110 47.69   93.0/195

NS · 22 авг 2006

Пятифигурные не дают 30 пунктов. По найденной мной информации <20 пунктов они дают сильнейшим движкам...

WildCat · 22 авг 2006

Kirr пишет:

Буду праздновать если разница окажется больше.
Нажмите, чтобы раскрыть...

Компьютерный чекерс погиб из-за того, что базы прибавляли слишком много силы программам. Тут не до праздников

morkoffkin · 22 авг 2006

Кажется чекерс уже доказан

atoku · 22 авг 2006

morkoffkin пишет:

Кажется чекерс уже доказан
Нажмите, чтобы раскрыть...

И каков результа? Всегда победа Красных ?

morkoffkin · 22 авг 2006

Почти доказан. Шесть основных начал ведут к ничьей.
http://www.cs.ualberta.ca/~chinook/

WildCat · 22 авг 2006

Кто может гарантировать, что в "доказавшей" программе нет ошибок?

WinPooh · 22 авг 2006

"It is a common misconception that English draughts has been solved. The best computers can now beat all humans, but English draughts is not yet completely solved. It is generally expected that English draughts will be solved by the 2010s.

The number of legal positions in English draughts is estimated to be 1018, and it has a game-tree complexity of approximately 1031.

When draughts is generalized so that it can be played on an n-by-n board, the problem of determining if the first player has a win in a given position is EXPTIME-complete.

In August 2004, the Chinook team announced that the tournament opening in English draughts called the White Doctor (10-14 22-18 12-16) has proven to be a draw."
Нажмите, чтобы раскрыть...

(Wikipedia - "English Draughts")

WildCat · 22 авг 2006

Насколько я знаю, доказательство очень условное, у некоторых вариантов количество полуходов до базы может превышать 100, т.е. доказательство не полное.
А отсечь такой вариант можно только по ОФ (т.е. эвристически).

Fruit · 22 авг 2006

WildCat пишет:

А ты ему путь к базам в ini не устанавливал?
Нажмите, чтобы раскрыть...

Нет. Не додумался. .....Теперь и вторую версию придётся без них тестировать.

WildCat · 22 авг 2006

Ладно. Они особого значения не имеют.

NS · 23 авг 2006

WildCat пишет:

NS пишет:

Если считать четко как в фрукте - то ход, который генератором выдается последним - будет иметь 100% статистику - независимо от того насколько он хороший.
Нажмите, чтобы раскрыть...

Если он окажется опровергающим, то он запишется в киллеры + увеличится его история, т.е. в след. раз этот ход уже не будет в конце списка. И если он не очень удачный, то и получит соотв. статистику.
Нажмите, чтобы раскрыть...

Не окажется он в начале списка если нет сортировки по истории
Деже если сортировать по истории (а это практически обязательно, так как в таком случае намного проще и четче собирается правильная статистика), то схема Фрукта - не очень хороша, так как правильную историю можно явно собирать четче (и соответственно быстрее) Ходы которые изначально имеют плохую историю, и оказались в конце списка будут её повышать - не зависимо от того насколько плох ход, а которые оказались в начале списка - понижать, независимо от того, насколько ход хорош...
Я могу построить мат. модель (не привязанную конкретно к шахматам) - и на ней оттестировать схему Фрукта, и какую-нибудь более продвинутую.

У меня Тип фигуры, откуда, куда - полная статистика. Медленней собирается история, но намного четче.

WildCat · 23 авг 2006

не зависимо от того насколько плох ход
Нажмите, чтобы раскрыть...

Ну совсем плохой ход не сможет повышать свою статистику. Даже если так случится, то будет ему +1. Он станет первым киллером. В следущий раз -1 и становится вторым киллером. Затем еще -1 и вылетает из киллеров.

Итого получаем +1 и -2. Т.е. плохие ходы будут иметь плохую статичтику.

WildCat · 23 авг 2006

По-моему киллерам ухудшать статистику вполне логично.

NS · 23 авг 2006

На моих тестах - даже с сортировкой, лучше всё-таки не писать киллерам плохую оценку.
Медленней собирается правильная история (Так как получается что тем, что ход оказался в начале списка - мы принудительно портим ему историю)

NS · 23 авг 2006

Конечно попробую - но проще сначала на мат. модели (мне во всяком случае)
Дается распределение по вероятности того что ход опровергающий. И распределение вероятности что ход есть в позиции. (простая схема без киллеров и ходов из хеша)
Ну а дальше упорядочиваем по статистике, только собираем её разными способами.
Пишется весьма быстро, и достаточно четко можно оценить какой из методов лучше.
(просто смотрим среднеквадратичного отклонение номера хода в отсортированном списке (берем уже все ходы) от реального порядка ходов по вероятности того что ход опровергающий)

Fruit · 26 авг 2006

Тестирование временно преостановил, ввиду переустановки системы, в результате чего, Shredder превратился в полуShredder.....Эх, а так всё хорошо начиналось. На инетовском счету чудесным образом появилось 350 баксов (откуда??), всё работало. Потом всё перестало работать - no signal, видете ли.

WildCat · 27 окт 2006

Закончилось тестирование версии, которая начисляет бонусы (по 0.05) ладье на 7-ой линии за каждую свободную рядом клетку (по этой линии). Ослабление на 19 пунктов

Fruit · 27 окт 2006

Хм...странно! Я смотрел некоторые партии. Вроде Wildcat лучше стал понимать значение 7-й...
В связи с этим:
1. Каким было тестирование? Сколько партий и каковы конкретные результаты?
2. Есть предложение немного уменьшить бонус.

WildCat · 27 окт 2006

Конкретные результаты:
- тестовая версия: +652, -579, =369
- нормальная версия: +696, -553, =351
Если найду достаточно тестеров, то попробую уменьшить бонус. Мое последнее тестирование заняло чуть больше месяца. Такими темпами оптимальное значение бонусов не найти.

Fruit · 27 окт 2006

Енто и я могу проверить (раз уж идея моя ).....Только заранее нужно подобрать тестовую группу, оболочку...

WildCat · 27 окт 2006

Моя тестовая группа вот: www.igorkorshunov.narod.ru/6_06_04.html
Можешь подобрать себе другую, но так, чтобы были движки той же силы. Очень сильные и очень слабые ни к чему.
Оболочка для тестов вот здесь: www.kasparovchess.crestbook.com/viewtopic.php?id=623

Какой бонус тебе кажется более разумным?

Fruit · 27 окт 2006

Shredder classic себя уже дискредитировал, когда не позволил закончить мой тест.... Wildcat GUI качал, но чем-то он мне не понравился, не помню уже чем. Дам ему 2-й шанс.

На счёт бонусов. Можно посмотреть 0.03(разумный) и 0.07(прикольный). Второй, чтобы посмотреть каким образом это ухудшает игру.

Fruit · 29 окт 2006

WildCat пишет:

Моя тестовая группа вот: www.igorkorshunov.narod.ru/6_06_04.html
Можешь подобрать себе другую, но так, чтобы были движки той же силы. Очень сильные и очень слабые ни к чему.
Оболочка для тестов вот здесь: www.kasparovchess.crestbook.com/viewtopic.php?id=623

Какой бонус тебе кажется более разумным?
Нажмите, чтобы раскрыть...

Какая книга использовалась для тестирования?

Войти или зарегистрироваться

Тестирование различных техник программирования шахматной игры

WildCat Коршунов Игорь

NS Нефёдов Сергей

WildCat Коршунов Игорь

Kirr Администратор

NS Нефёдов Сергей

WildCat Коршунов Игорь

Fruit Александр

WildCat Коршунов Игорь

Fruit Александр

WildCat Коршунов Игорь

Kirr Администратор

NS Нефёдов Сергей

NS Нефёдов Сергей

WildCat Коршунов Игорь

morkoffkin Учаcтник

atoku Модератор

morkoffkin Учаcтник

WildCat Коршунов Игорь

WinPooh В.М.

WildCat Коршунов Игорь

Fruit Александр

WildCat Коршунов Игорь

NS Нефёдов Сергей

WildCat Коршунов Игорь

WildCat Коршунов Игорь

NS Нефёдов Сергей

NS Нефёдов Сергей

Fruit Александр

WildCat Коршунов Игорь

Fruit Александр

WildCat Коршунов Игорь

Fruit Александр

WildCat Коршунов Игорь

Fruit Александр

Fruit Александр

Поделиться этой страницей