Автоматический подбор параметров движка

WildCat · 14 мар 2007

Ну ладно уж...
Он притормаживает машину равномерно. Так что вреда быть не должно.

Orlov · 15 мар 2007

WildCat пишет:

Ну ладно уж...
Он притормаживает машину равномерно. Так что вреда быть не должно.
Нажмите, чтобы раскрыть...

Завтра после работы запущу на ночь.

Orlov · 15 мар 2007

WildCat пишет:

Orlov пишет:

"а ты читал о вреде формального подхода к центру"
Нажмите, чтобы раскрыть...

ишто?

Orlov пишет:

Так вот. Разумно предположить что в конце игры фигуры должны стоять центрее. Особенно дальнобойные.
Нажмите, чтобы раскрыть...

А вот и нет. Как раз дальнобойным центр по барабану. Они скорее его обстреливать должны, чем там стоять.

Orlov пишет:

Что касается пешек, см. последний пост NS. Абсолютно с ним согласен. Бонусы за кандидатов в проходные в конце игры должны возрастать в разы.
Нажмите, чтобы раскрыть...

У меня нет таких бонусов. Так что если они возрастут в разы ничего не изменится
А продвинутость проходных ценна всю дорогу, а не только в конце.
Нажмите, чтобы раскрыть...

мне кажется что в большинстве случаев в эндшпиле ферзю гораздо важнее находиться на полях e4,e5,d4,d5 чем на полях a1,a8,h1,h8. Тоже касается и слона.

NS · 15 мар 2007

Ферзь в центре в эндшпиле - точно работает. В моей программе работает. Даже простейший пример - помогает выигрывать без ЭБ в эндшпиле ферзь с центральной пешкой против ферзя.

Orlov · 15 мар 2007

WildCat пишет:

Ну ладно уж...
Он притормаживает машину равномерно. Так что вреда быть не должно.
Нажмите, чтобы раскрыть...

А если машина не очень быстрая? Да еще при супер коротком контроле? Возможно это будут не шахматы, а поддавки?
Что думаешь?

NS · 15 мар 2007

Я настраивал ОФ в уголках с глубиной 3 полухода Глубина в шахматах будет больше даже при 10 мс. на ход на медленной машине. 5000 Nodes это в среднем около 6 полуходов. Дл настройки ОФ вполне нормально.

Vertu · 15 мар 2007

а практическоая польза будет, или это все еще проверка, годен ли алгоритм?

NS · 15 мар 2007

В ветке есть - я получил 100 пунктов Эло прибавки в своей шашечной программе именно на такой настройке. Программа в силе скакнула от Мастера до Гросса.
Хотя я не знаю у кого текущие алгоритмы подстройки ОФ лучше.

Вообще эффект должен быть - 10 кругов дают стабильность, то есть сила не будет падать. Прибавка может быть будет и небольшая, но она будет. Только 3 дня счета, неделя счета - это наверно всё-таки очень мало.

Fruit · 15 мар 2007

Vertu пишет:

а практическоая польза будет, или это все еще проверка, годен ли алгоритм?
Нажмите, чтобы раскрыть...

Пока проверка. Пробуем почкование теперь....

Fruit · 15 мар 2007

Orlov пишет:

WildCat пишет:

Ну ладно уж...
Он притормаживает машину равномерно. Так что вреда быть не должно.
Нажмите, чтобы раскрыть...

А если машина не очень быстрая? Да еще при супер коротком контроле? Возможно это будут не шахматы, а поддавки?
Что думаешь?
Нажмите, чтобы раскрыть...

Да, я не собираюсь целыми днями музыку слушать...Просто любопытно было, что можно делать за компом, а что нельзя....Winamp загружает комп на 7-10%, думаю, это не так существенно - 2530mhz или 2200mhz мы получим.

WildCat · 15 мар 2007

Vertu пишет:

а практическоая польза будет, или это все еще проверка, годен ли алгоритм?
Нажмите, чтобы раскрыть...

Когда делаешь что-то новое, то заранее не знаешь будет ли польза.

Vertu · 15 мар 2007

А краткое описание, что, собственно, эта программа делает, можно?

WildCat · 15 мар 2007

Программа создает 30 версий настроек ОФ. Дадьше играется 10-круговой турнир. Все худшие удаляются. Из лучших формируются новые путем случайного изменения параметров. Причем большинство параметров изменяется на малую величину, и только несколько меняются значительно.
И так до упора.

Vertu · 15 мар 2007

а если прервать работу программы, она продолжит с того места, на котором закончила, или начнет всё сначала?

Fruit · 15 мар 2007

конечно, продолжит...автоматика

WildCat · 15 мар 2007

Есть еще идея попробовать как делал Марков. Не играть реальные партии (это очень долго и нужна целая сеть компов), а пытаться максимизировать число угадываний хороших ходов.
Взять много игр хорошего качества и вперед! Так мы итерации сможем проводить намного быстрее. А в случайном поиске количество итераций это очень важно!
Кто возьмется собрать базу партий с хорошими ходами?

NS · 15 мар 2007

Не быстрее
Разница в сто пунктов дает разницу в 2% угадываний.
Сколько нужно просмотреть позиций чтоб получить ту-же достоверность в 100 пунктов? Чем это быстрее чем набор тестовых матчей? И не получится ли подстройка под стиль?

NS · 15 мар 2007

Посчитал. Тест на 10000 позиций дает достоверность в 2%.
Ничем не быстрее тестовых матчей, но есть подозрение что это настраивает совсем не то.

WildCat · 15 мар 2007

NS пишет:

Посчитал. Тест на 10000 позиций дает достоверность в 2%.
Нажмите, чтобы раскрыть...

У меня сейчас за сутки вычислений погрешность больше. А 10000 позиций можно за 15 минут протестировать.

WildCat · 15 мар 2007

NS пишет:

И не получится ли подстройка под стиль?
Нажмите, чтобы раскрыть...

Тем интереснее этот вариант.

Fruit · 15 мар 2007

Последняя версия генератора очень медленная, за счёт увеличения кол-ва игр между персоналиями. Чтобы один турнир закончился нужно 3 ночи! Так, может не только недели, но и месяца не хватить.

NS · 15 мар 2007

У меня сейчас за сутки вычислений погрешность больше. А 10000 позиций можно за 15 минут протестировать.
Нажмите, чтобы раскрыть...

За сутки тестируется не одна версия, а 30.
И больше погрешность не получается. 30 версий в 4 круга. Та-же погрешность на каждой особи (100 пунктов) 1800 партий. на каждую по 100мс*100 = 10 секунд.

18000 секунд на 30 особей.

На тестовых партиях/позициях проверка совпадения ходов на таком-же контроле.
30 версий*100мс*10000 позиций = 30000 секунд.

Разница не 15минут/сутки, а в почти в раза, только немного в другую сторону

Это если действительно есть 2% разницы в угадывании от прибавки 100 пунктов. Насчет точной зависимости Процента от разницы в силе можно спросить у Fruit-а, у него эти цифры есть.

Я перед тем как начать считать на тестовых турнирах прикинул этот вариант - он ничем не лучше.

Vertu · 16 мар 2007

Возьмите позиции из партий Рыбки (их много в сети) и подстраивайтесь под ее стиль. Вот и база ходов хороших. По-крайней мере, неплохих.

Fruit · 16 мар 2007

В сети есть 2млн партий рыбки? Именно столько нужно для подстройки позиционных признаков.

NS · 16 мар 2007

Лучше уж тогда не партии Рыбки, а взять срез из MegaBase с фильтром по рейтингу.
Но всё-равно - мне такой способ не нравится, и мне (в шашках) он точно не подходит.
WildCat, если нужно то я вышлю в формате PGN. Только сколько партий, и на сколько ходов тебе нужно?

NS · 16 мар 2007

В сети есть 2млн партий рыбки? Именно столько нужно для подстройки позиционных признаков.
Нажмите, чтобы раскрыть...

Это мнение Маркова На самом деле нужно меньше. Хотя всё-равно их нужно очень много... Хотя-бы на миллион ходов. 10000 конечно не хватит.

Vertu · 16 мар 2007

Миллион ходов - это около 20-25 тыс. партий. Уж столько-то рыбкиных в сети найдется.

Vertu · 16 мар 2007

А может, имеет смысл сделать алгоритм, чтобы персоналии играли не друг с другом, а рыбкой там или с тогой? Может, Райлих так своего малька на Шреддер науськивал?

NS · 16 мар 2007

Набор тестовых матчей имеет такую-же точность. Но имеет огромный плюс. Программа наигрывает партии не на одной итерации. Если на итерации она набрала больше 50% очков, то она продолжает играть дальше, в итоге точность определения силы возрастает. Причем наигрывает новые, уникальные пратии с другими соперниками, с других начальных позиций.

А в случае набора готовых тестовых позиций - нет смысла в повторном проходе, и точнее силу уже не определить.

Vertu · 16 мар 2007

Или например генерировать позиции случайным образом, и смотреть, совпадает ли на трех полуходах с предложением Рыбки. У какой персоналии выше корреляция, та выживает.

NS · 16 мар 2007

А может, имеет смысл сделать алгоритм, чтобы персоналии играли не друг с другом, а рыбкой там или с тогой? Может, Райлих так своего малька на Шреддер науськивал?
Нажмите, чтобы раскрыть...

Нужен не один соперник, а тестовая группа соперников. Можно играть не с версиями своей программы, а с тестовой группой - но какая разница? От этого ничего не изменится.
И далеко не все движки умеют играть с суперкороткими контролями. Точнее практически ни один не умеет.

Vertu · 16 мар 2007

Vertu пишет:

Или например генерировать позиции случайным образом, и смотреть, совпадает ли на трех полуходах с предложением Рыбки. У какой персоналии выше корреляция, та выживает.
Нажмите, чтобы раскрыть...

И если у разных тестеров выживут схожие персоналии, значит эта оптимизация дает приближение к базовым параметрам рыбки (или другой сильной проги)...

Fruit · 16 мар 2007

NS пишет:

В сети есть 2млн партий рыбки? Именно столько нужно для подстройки позиционных признаков.
Нажмите, чтобы раскрыть...

Это мнение Маркова На самом деле нужно меньше. Хотя всё-равно их нужно очень много... Хотя-бы на миллион ходов. 10000 конечно не хватит.
Нажмите, чтобы раскрыть...

Да, это мнение С. Маркова. Причём, он его высказал, когда я предложил ему использовать партии рыбки. На 10тыс он бы уж точно не согласился....

NS · 16 мар 2007

Три полухода... А чем набор тестовых партий с глубиной в три полухода хуже?

Случайным образом генерировать позиции - очень плохо. Можно брать набор случайных позиций из большой базы, но опять-таки не видно никаких преимуществ по сравнению с тестовыми матчами.

Vertu · 16 мар 2007

Сейчас устроил матч на 3 полуходах между последними Рыбкой и Хиарксом. Счет +20-0=1. Дальше продолжать не стал...

Войти или зарегистрироваться

Автоматический подбор параметров движка

WildCat Коршунов Игорь

Orlov Учаcтник

Orlov Учаcтник

NS Нефёдов Сергей

Orlov Учаcтник

NS Нефёдов Сергей

Vertu Старожил

NS Нефёдов Сергей

Fruit Александр

Fruit Александр

WildCat Коршунов Игорь

Vertu Старожил

WildCat Коршунов Игорь

Vertu Старожил

Fruit Александр

WildCat Коршунов Игорь

NS Нефёдов Сергей

NS Нефёдов Сергей

WildCat Коршунов Игорь

WildCat Коршунов Игорь

Fruit Александр

NS Нефёдов Сергей

Vertu Старожил

Fruit Александр

NS Нефёдов Сергей

NS Нефёдов Сергей

Vertu Старожил

Vertu Старожил

NS Нефёдов Сергей

Vertu Старожил

NS Нефёдов Сергей

Vertu Старожил

Fruit Александр

NS Нефёдов Сергей

Vertu Старожил

Поделиться этой страницей