Автоматический подбор параметров движка

NS · 30 мар 2007

Не узнаешь, Каллисто играет слишком сильно чтоб был шанс набрать какое-то количество очков. У Каллисто есть человеческий рейтинг, правда это рейтинг не последней версии.
Попробуй поиграть со Skifi, если что-нибудь наберешь, то можно будет посчитать твою силу.

Fruit · 30 мар 2007

Ладно. Будет время, попробую....Сейчас переписка отнимает много.

NS · 21 апр 2007

В шашках вытянула первый ряд - теперь он самый дорогой (есно за исключением a1), и подняла шестой (поле f6 дороже с5) и всё это на старых плохих алгоритмах (я расчет не прерывал, согласно диспетчеру задач считает без перерыва уже 1200 часов, 50 дней) При оценке балансом шашек плохих поля три - b2,e5,h6.
Сходимость лучше, чем выходит на мат. модели.

NS · 30 июл 2007

Еще один метод улучшающий сходимость.
Путь ОФ разбита на несколько Таблиц. К каждой таблице применяем с одинаковой вероятностью один из двух метод. Либо прибавка фиксированной случайной величины, либо прибавка случайной величины пропорциональной значению в таблице.
(Все таблицы приведены к виду - сумма всех элементов в таблице равна нулю)
Коэффициенты прибавки не задаем жестко, а выбираем таким образом, чтоб процент новых порождаемых особей более сильных чем прародитель был равен некоторой заданной величине (например 5%)

NS · 31 июл 2007

только не 5%, а 25%.
(тестировал на модели - всего 300 особей, оставляем 200 лучших, 100 порождаем от случайных из этих двухсот) На всех тестах лучшая сходимость при подстройке изменений таким образом чтоб процент лучших был 25%.

Тестировал на 6, 28 и 100 параметрах в таблице, на 100 и 1000 итераций.
После каждой итерации вот такой код.
if ch<k then Dob:=Dob/1.2 Else Dob:=Dob*1.2;
Лучший вариант k=25.
Изменяем вот таким образом:
Код:
      ist:=Random(200)+1;
      for j:=1 to Razm do Gen[i].V[j]:=Gen[ist].V[j]+Random*Dob;
      Norm(Gen[i].V); // приводит вектор к виду - сумма элеметов равна нулю,
                             // сумма квадратов элементов равна единице.
      Gen[i].Rod:=ist;

NS · 1 авг 2007

Похоже никому не интересно
Буду сам с собой.
Нашел статью где авторы утверждают что смогли заставить программу искать экстремум функции Розенброка от 2000 параметров (Гибридными методами) - основное это часть порождений градиентным спуском от сильнейшей особи.
Мне пока удалось добиться поиска большого числа локальных экстремумов и очень быстрой (по сравнению со старыми алгоритмами) сходимости - пока метод случайных направлением с повторными попытками в направлении наискорейшего спуска и с сложными алгоритмами смерти особей (наиболее отдаленные неприкасаемые + смерть от перенаселения) Попробую добавить градиентный спуск от сильнейшей особи.

Chemer · 1 авг 2007

Блин пропустил - конечно же интересно! Если есть сцылка на эту статью - скинь. Оптимизация моя любимая тема в вышке еще с института.

NS · 1 авг 2007

http://paklin.newmail.ru/mater/hybrid.html
только для настройки Оф это не нужно. Не имеет смысла настолько близко подходить к экстремуму, а вдали от экстремума градиентные методы работают не так хорошо. Главное собирать все экстремумы, а это у меня получилось.
(прошлая версия программы собрала все особи в практически в одну точку - нашла один локальный экстремум, правда достаточно хороший )
Новая умеет собирать очень большое количество локальных экстремумов + имеет на порядки лучшую сходимость: правильный расчет шага, плюс повторные шаги в направлении наискорейшего спуска, плюс больше порождений от сильнейшей версии, ну и все остальные алгоритмы улучшены - готов считать тысячи параметров (прошлая за пару месяцев хорошо посчитала чуть больше 80-ти).
Вдобавок почти в 3 раза ускорил (NPS) саму шашечную программу, сделал хорошие сортировки.
Так что готов сделать нечто весьма сильное.

вот, если интересно еще ссылка на метод главных осей (на хороших функциях без аналитической производной просто зверь)
http://alglib.sources.ru/optimization/principalaxis.php

WildCat · 26 окт 2007

Тут буржуи обсуждают нашу тему: http://64.68.157.89/forum/viewtopic.php?t=16919
Мне понравилась забавная идея от автора Спайка. Может стоит попробовать еще раз?

NS · 26 окт 2007

Я не понимаю чего обсуждать - делать надо По силе моей программы становится понятно что всё получилось, и настроить ОФ автоматическими методами можно.
И я получил не 10-20 пунктов прибавки, а несколько сотен.

NS · 26 окт 2007

Мне понравилась забавная идея от автора Спайка. Может стоит попробовать еще раз?
Нажмите, чтобы раскрыть...

В ней нет ничего нового. Только он опять сводит всё к генетике, хотя кто сказал что генетика будет лучше?
Чтоб генетика работала - гены должны быть малосвязанными между собой, чтоб сочетание генов от разных особей могло работать... Мне кажется что классические спуски надежней, они гарантируют появление более сильных особей в направлении локального экстремума. А в случае генетики (брать гены от двух и более особей) - нет такой гарантии.

WildCat · 26 окт 2007

NS пишет:

Я не понимаю чего обсуждать - делать надо
Нажмите, чтобы раскрыть...

Объясни подробно как ты делал.

NS · 26 окт 2007

Как я делал - лучше не делать. Я получил сходимость намного меньшую чем можно было бы добиться.
Что лучше написать - как делал, или как лучше делать?

Насчет генетики, что я имею против - допустим у нас два праметра. Разместим особей на плоскости.
Проведем от каждой особи горизонтальные и вертикальные линии (параллельно оси координат).
Что такое предложенный алгоритм - это беганье по узлам нарисованной сетки.
Тяжело придумать вид функции силы движка от этих двух параметров при котором такой метод будет работать.

WildCat · 26 окт 2007

NS пишет:

Что лучше написать - как делал, или как лучше делать?
Нажмите, чтобы раскрыть...

Ты делай, как лучше, и за одно расписывай как делаешь.

NS · 26 окт 2007

Как делал - 30 особей. Не помню уже сколько начальных позиций.
Каждая с каждой играют микроматчи по две партии (с переменой цвета) по четырем случайным позициям из списка. Потом особи сортируются по результату. 15 (хотя точно не помню сколько, может и не 15) слабейших отбрасываются.
Каждая новая особь формируется от случайной из оставшихся. Генерируется изменением на некоторую дельту каждого из параметров входящих в группу. Группа это случайный узел из дерева признаков...
Вероятности выпадения каждой группы я проставлял вручную, но можно сделать пропорционально количеству элементов в группе.
Дельта расчетная, для каждого из изменяемых признаков случайное число в интервале
-/+ Коэффициент/SQRT(КоличествоИзменяемыхПризнаков);

но лучше конечно делать по-другому...

варяг · 26 окт 2007

NS пишет:

настроить ОФ автоматическими методами можно.
И я получил не 10-20 пунктов прибавки, а несколько сотен.
Нажмите, чтобы раскрыть...

Как думаете, какую можно получить прибавку в силе после автоматической настройки весов по сравнению с теми весами, которые вручную подобраны уже неплохо, как в сильнейших программах типа WildCat? Неужели несколько сотен пунктов?

NS · 26 окт 2007

Как думаете, какую можно получить прибавку в силе после автоматической настройки весов по сравнению с теми весами, которые вручную подобраны уже неплохо, как в сильнейших программах типа WildCat? Неужели несколько сотен пунктов?
Нажмите, чтобы раскрыть...

И как было определено что они подобраны "неплохо"?

варяг · 26 окт 2007

NS пишет:

И как было определено что они подобраны "неплохо"?
Нажмите, чтобы раскрыть...

Вероятно, значения весов тестировались многократно. Да и будь они совсем плохими, сильнейшие программы не были бы сильнейшими.

NS · 26 окт 2007

Вероятно, значения весов тестировались многократно. Да и будь они совсем плохими, сильнейшие программы не были бы сильнейшими.
Нажмите, чтобы раскрыть...

Тестировались многократно? Да хоть миллион раз протестируй набор весов - это не докажет что они оптимальные, и не покажет их близость к оптимальным.

WildCat · 23 ноя 2007

Вот мысли Юрия Осипова по поводу подбора параметров движка с помощью корреляционного анализа:

1. Создадим EPD-файл, в который сложим довольно большое число позиций из разных стадий игры. Для каждой позиции укажем оценку, которую дает такой позиции кто-то весьма авторитетный - например, Рыбка после некоторого перебора из этой позиции. После этого запустим свой движок, с нашей функцией оценки, и пусть он тоже выполнит перебор, и выдаст оценку каждой позиции. В итоге получаем два столбца чисел: X - наша оценка, Y - оценка авторитета. Вычислим коэффициент корреляции между этими столбцами.
После этого начинаем варьировать весами своей оценочной функции, а также менять эвристики перебора (продления, сокращения, форсированный вариант и т.д.). После каждого варьирования вычисляем коэффициент корреляции. Из всех возможных вариантов выбираем такой, при котором коэффициент корреляции максимален.
Замечание: поскольку в этом методе мы сравниваем две аналогичных величины - оценки позиций, то вместо коэффициента корреляции можно вычислять среднее квадратичное отклонение между ними, и пытаться минимизировать это отклонение. Если мы это сделаем, то получим просто близкие оценки двух программ, а добиваться этого совершенно не обязательно. Достаточно того, чтобы более высоким значениям одной оценки соответствовали более высокие значения другой, и наоборот. Поэтому, в этом случае вычисление коэффициента корреляции предпочтительнее.

2. Возьмем большую базу партий, сыгранных игроками с довольно высоким рейтингом (например, выше 2300). Результат каждой партии известен, поэтому можно вычислять коэффициент корреляции между своими оценками позиций, и процентом выигранных партий. Оптимизируем свою оценку тем же методом, что и в п.1.

3. Для эндшпилей есть таблицы Налимова, которые точно указывают - выиграна позиция или нет. Здесь тоже можно подбирать такую оценку позиции, которая имеет максимальную корреляцию с величиной, обратно пропорциональной дистанции до выигрыша. В ничейных позициях можно ограничиться вычислением среднего квадратичного отклонения оценки от нуля (если у нас оценка ничьи равна нулю).

4. Получив таким образом некую оптимальную оценочную функцию, мы со временем убеждаемся, что что эта оценка хорошо работает в довольно большом множестве позиций, но ошибается в отдельных частных случаях. Чтобы добиться лучшей оптимизации, начинаем делить все исследуемые позиции на классы - например, по наличию суммарного материала, т.е. по стадиям игры, или по каким-то другим шахматным критериям. Составив таким образом набор классов позиций, и написав процедуру, которая каждую позицию относит к своему классу, мы можем выполнить оптимизацию оценочной функции отдельно для каждого класса.

5. Есть еще один способ оптимизации, который позволяет обойтись без оценок авторитетов и без больших баз партий. Мы можем вычислить статическую оценку позиций, а затем выполнить перебор из этих позиций, и получить минимаксную оценку. В результате имеем пары чисел: X - статическая оценка, Y - минимаксная оценка. Добиваемся максимальной корреляции между этими величинами. В результате получаем оценочную функцию, которая безо всякого перебора умеет с высокой степенью вероятности угадывать потенциальный минимакс. Такая программа могла бы обладать более глубоким пониманием позиций, даже без глубокого перебора.

6. Еще один способ - подгонка весов оценочной функции и других параметров программы динамически, прямо по ходу партии. Для этого во время игры вычисляем корреляцию между статикой и минимаксом. Пока корреляция высокая - пользуемся теми параметрами, которые есть. Как только коэффициент корреляции начинает уменьшаться - корректируем параметы оценки и поиска, добиваясь увеличения корреляции.

thenewone · 23 ноя 2007

5 и 6 — талантливо (чтоб не сказать — гениально )
На мой диллетантский взгляд, конечно.

Fruit · 23 ноя 2007

Да, всё чётко и просто. Правда, очень знакомо по беседем в ICQ :

NS (22:03:10 11/07/2007)
3. После этого началась работа по совершенствованию оценочной функции и алгоритма поиска. Оптимизация оценочной функции выполнялась путем корреляционного анализа. Я добивался максимальной корреляции статической оценки и минимакса.

варяг · 23 ноя 2007

Fruit пишет:

Да, всё чётко и просто.
Нажмите, чтобы раскрыть...

ИМХО Слишком просто, чтобы быть похожим на правду. Известны ли достоверные случаи (кроме Стрелки), когда данные методы приводили к реальному результату (повышению силы)?

варяг · 23 ноя 2007

Дискуссия на эту тему на talkchess как-то слишком быстро сошла на нет...
http://64.68.157.89/forum/viewtopic.php?t=16919

Fruit · 23 ноя 2007

варяг пишет:

Fruit пишет:

Да, всё чётко и просто.
Нажмите, чтобы раскрыть...

ИМХО Слишком просто, чтобы быть похожим на правду. Известны ли достоверные случаи (кроме Стрелки), когда данные методы приводили к реальному результату (повышению силы)?
Нажмите, чтобы раскрыть...

NS и его шашечная программа. В кратчайшие сроки, уже вторая по силе в мире. По видимому, Рыбка также использовала указанные методы....ИМХО описать можно просто, а реализовывать явно сложнее и значительно дольше по времени. Хорошее описание всегда должно быть простым и понятным. Что ещё можно от него тербовать?

варяг · 23 ноя 2007

Fruit пишет:

NS и его шашечная программа.
Нажмите, чтобы раскрыть...

NS использовал один из этих методов?

А еще? И желательно, чтобы не "по видимому", а какой-нибудь реальный пример

Кажется Марков что-то делал в этом направлении. Кто-нибудь знает подробности?

Fruit · 23 ноя 2007

варяг пишет:

Fruit пишет:

NS и его шашечная программа.
Нажмите, чтобы раскрыть...

NS использовал один из этих методов?

А еще? И желательно, чтобы не "по видимому", а какой-нибудь реальный пример

Кажется Марков что-то делал в этом направлении. Кто-нибудь знает подробности?
Нажмите, чтобы раскрыть...

По рыбке мы точной правды долго не узнаем. Но заявления Сергея Маркова (общался с Райлихом и тот ему говорил о чём-то подобном), NS (о том, что Райлих так сделал и то, что у него получилось в шашках также) и Юрия Осипова (где он говорил о рыбке), позволяют не воспринимать всерьёз моё "по видимому".

Последный раз, когда я общался с С. Марковым (достаточно давно, до Стрелки), он говорил, что интуитивно настроил веса (те, которые уже были давно) в SmarThink очень хорошо и метод подбора весов по базе партий не дал существенных изменений в силе игры

Fruit · 23 ноя 2007

варяг пишет:

Fruit пишет:

NS и его шашечная программа.
Нажмите, чтобы раскрыть...

NS использовал один из этих методов?
Нажмите, чтобы раскрыть...

Юрий Осипов:В результате имеем пары чисел: X - статическая оценка, Y - минимаксная оценка. Добиваемся максимальной корреляции между этими величинами. В результате получаем оценочную функцию, которая безо всякого перебора умеет с высокой степенью вероятности угадывать потенциальный минимакс

NS: После этого началась работа по совершенствованию оценочной функции и алгоритма поиска. Оптимизация оценочной функции выполнялась путем корреляционного анализа. Я добивался максимальной корреляции статической оценки и минимакса.

bankuss · 23 ноя 2007

Шашечная программа Сергея уже первая в мире по последним данным

WildCat · 24 ноя 2007

Это откуда такие данные?

WildCat · 24 ноя 2007

Лично мне кажется интересным пункт 5.

Осипов Юрий пишет:

После этого начинаем варьировать весами своей оценочной функции, а также менять эвристики перебора (продления, сокращения, форсированный вариант и т.д.).
Нажмите, чтобы раскрыть...

Вся проблема в том, чтобы придумать хорошую схему изменения весов. Может быть лучше будет попробовать МНК.

NS · 26 ноя 2007

варяг пишет:

Fruit пишет:

NS и его шашечная программа.
Нажмите, чтобы раскрыть...

NS использовал один из этих методов?

А еще? И желательно, чтобы не "по видимому", а какой-нибудь реальный пример

Кажется Марков что-то делал в этом направлении. Кто-нибудь знает подробности?
Нажмите, чтобы раскрыть...

Реальный пример. Оф у меня была посчитана чисто автоматически, но не корреляционным анализом.
Может программа и не сильнейшая, но одна из сильнейших (среди доступных скорей всего делит первое-второе место с Каллисто)

WildCat · 26 ноя 2007

Ну тогда посмотрим что будет, если я посчитаю свою ОФ автоматически.

NS · 26 ноя 2007

На работающую схему уйдет какое-то время. А у меня уже есть работающие алгоритмы.
Так что наверно у меня хороший шанс подойти к чемпионату с заметным перевесом в силе.

Осипов Юрий · 26 ноя 2007

А работающие алгоритмы, как я понимаю - большой секрет ?

Я как-то пытался построить оценочную функцию методом наименьших квадратов. Долго добавлял все новые и новые коэффициенты в формулу. Когда число искомых коэффициентов (а стало быть и уравнений в системе) перевалило через сотню, а среднее квадратичное отклонение оставалось неприлично большим, я это дело бросил.

Войти или зарегистрироваться

Автоматический подбор параметров движка

NS Нефёдов Сергей баннер

Fruit Александр баннер

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

Chemer Максим

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

варяг Учаcтник

NS Нефёдов Сергей баннер

варяг Учаcтник

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

thenewone Евгений Манев

Fruit Александр баннер

варяг Учаcтник

варяг Учаcтник

Fruit Александр баннер

варяг Учаcтник

Fruit Александр баннер

Fruit Александр баннер

bankuss Александр баннер

WildCat Коршунов Игорь Команда форума

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

WildCat Коршунов Игорь Команда форума

NS Нефёдов Сергей баннер

Осипов Юрий Учаcтник