AlphaZero. Нейронная сеть играет в шахматы

Strat7 · 1 ноя 2020

nh2008 пишет: ↑

А что такое идеальный игрок? Есть разные уровни идеальности.
Нажмите, чтобы раскрыть...

идеальный - играет безошибочно. безошибочно, значит каждый раз делается лучший ход. какие тут другие уровни идеальности???

nh2008 пишет: ↑

Один движок просчитывает на 100 ходов вперёд, другой - на 1000.
Нажмите, чтобы раскрыть...

При разговоре об идеальности неважно насколько он просчитал - если ходы иделаьны и наилучшие то этого достаточно. после остается сделать этот ход. если противник тоже идеален то рассуждения - я вот сейчас немногожко ошибусь а зато может выиграю - беспочвенны, ведь противник идеален и просто использует эту ошибку (любой неидеальный ход равен ошибке)

nh2008 пишет: ↑

Надо ли рисковать
Нажмите, чтобы раскрыть...

При игре против идеального противника не надо, просто проиграешь.
А если ты играешь против неидеального, то какой опять же смысл делать ошибки? Просто играй идеально и рано или поздно выиграешь.

—- добавлено: 1 ноя 2020 —-

nh2008 пишет: ↑

Но ведь наверняка можно сильно ослабить условия "всезнайства", оставив, например, таблицу фигур до 24
Нажмите, чтобы раскрыть...

Не понимаю о чем тут говорится. Либо игрок идеален, либо нет. Что хотели сказать?

Mustitz · 1 ноя 2020

Strat7 пишет: ↑

Сейчас пока между компами иногда они проигрывают, а значит идеала нет.
Нажмите, чтобы раскрыть...

Я уже давно не видел матчей компов с дебютными книжками из начальной позиции. Финал TCEC играется без дебютной книги из 50-ти часто достаточно несбалансированных позиций а-ля гамбит Хэллоуина. Поэтому, я готов допустить, что уже сейчас комбинация движок+книга могут играть идеально из начальной позиции, она не самая сложная и там есть где получить надёжность.

Strat7 пишет: ↑

Так что весь этот пример с крестиками ноликами ни о чем.
Нажмите, чтобы раскрыть...

Пример с крестикими-ноликами о том, что достаточно сложно решить, какой из первых ходов ставит перед противником больше проблем. После хода в угол у ноликов только один спасительный ход в центр, остальное проигрывает. Но, с точки зрения человека, ход в центр более естественный. Но пусть крестик в угол, нолик в центр. Любая угроза поставить три в ряд вынуждает единственный ответ. Но как раз такую угрозу человеку легче распознать. А вот сыграть диагонально симметрично в угол может поставить ловушку. И т. д. и т. п.

Поэтому все разговоры о том, что есть один сильнейший ход это ерунда. Если соперник играет рандомными ходями, то наибольшие шансы дают одни ходы. Если соперник вначале защищается от угрозы три в ряд, а уже потом играет рандомно, то наибольшие шансы даст уже другие продолжения, если соперник предпочитает играть в центр, а потом защищается от угрозы три в ряд, то уже третий и т. п.

Strat7 · 1 ноя 2020

Mustitz пишет: ↑

уже сейчас комбинация движок+книга могут играть идеально из начальной позиции, она не самая сложная и там есть где получить надёжность.
Нажмите, чтобы раскрыть...

Да, может быть, но как только мы меняем начальную позицию кое кто иногда проигрывает. То есть один частный случай начальной позиции не говорит что игрок идеален.

Mustitz пишет: ↑

все разговоры о том, что есть один сильнейший ход это ерунда
Нажмите, чтобы раскрыть...

В каждой позиции есть ограниченный набор ходов. Один или несколько из них - лучший. При этом частный случай, когда ход один возможны значит это одновременно и лучший и худший ход. Все остальное их вариации. При этом лучший ход всегда есть. С чем тут спорить - не

понятно.

Mustitz пишет: ↑

Если соперник играет рандомными ходями
Нажмите, чтобы раскрыть...

то он неидеален и лучшая стратегия - играть против него идеально, как и против любого другого соперника

все возражения сводятся к тому, что если соперник неидеален то против него можно якобы делать плохие ходы. можно, но скорее проиграешь и тут будет сильно важна разница в рейтинге.

nh2008 · 1 ноя 2020

Strat7 пишет: ↑

Не понимаю о чем тут говорится. Либо игрок идеален, либо нет. Что хотели сказать?
Нажмите, чтобы раскрыть...

С этой точки зрения лучшим является любой ход, не ухудшающий результат игры и не повторяющий уже встретившуюся в партии позицию, пусть даже выбранный рандомно. Ни о каком всегда одном лучшем ходе и речи быть не может. Что Вы имели ввиду, когда говорили, что в каждой позиции есть лучший ход?

Strat7 · 1 ноя 2020

nh2008 пишет: ↑

Что Вы имели ввиду, когда говорили, что в каждой позиции есть лучший ход?
Нажмите, чтобы раскрыть...

Вроде попытался это разъяснить выше.

Strat7 пишет: ↑

Всегда есть лучший ход, а когда их несколько, то это значит, что число ходов до конечного результата одинаково (например два хода ведут к мату в 1 ход - оба лучшие)
Нажмите, чтобы раскрыть...

Но попробую еще раз.
Результат игры по приоритету - выигрыш, ничья, проигрыш.
Соответственно лучший ход тот, который ведет к выигрышу, Если ходов несколько ведут к выигрышу, то лучший тот, который ведет к выигрышу в меньшее число ходов (в силу того, что есть фактор ограничения числа ходов, а значит меньше ходов - быстрее успеваешь выиграть).

Если несколько ходов ведут к выигрышу с одинаковой длительностью, то выбор равнозначен - каждый из ходов лучший. Тут вступает в силу то, что вам НУЖНО сделать ход, вот какой из этих вы выберете тот и будет лучший окончательно

nh2008 · 2 ноя 2020

Strat7 пишет: ↑

Если ходов несколько ведут к выигрышу, то лучший тот, который ведет к выигрышу в меньшее число ходов (в силу того, что есть фактор ограничения числа ходов, а значит меньше ходов - быстрее успеваешь выиграть).
Нажмите, чтобы раскрыть...

Ограничение количества ходов нужно чисто для биологических шахматистов, как и ничья после троекратного повторения позиции по желанию делающего ход. Для идеальных достаточно одного ограничения - повтор позиции (т.е. её двукратное возникновение) - автоматическая ничья.
Убираем надуманное ограничение количества ходов, мы же для идеальных игроков всё делаем, получим равнозначность всех ходов, ведущих к одинаковому результату.

Strat7 · 2 ноя 2020

nh2008 пишет: ↑

получим равнозначность всех ходов, ведущих к одинаковому результату.
Нажмите, чтобы раскрыть...

Получили. Дальше то что? ВЫБИРАЕМ и ДЕЛАЕМ ход. Все, был сделан лучший ход. И так до конца партии.

nh2008 · 2 ноя 2020

Strat7 пишет: ↑

Получили. Дальше то что? ВЫБИРАЕМ и ДЕЛАЕМ ход. Все, был сделан лучший ход. И так до конца партии.
Нажмите, чтобы раскрыть...

Мы не заморачиваемся длиной пути к победе поэтому "лучших ходов" достаточно часто больше, чем один, а не то, что Вы пытаетесь доказать.

Strat7 · 2 ноя 2020

nh2008 пишет: ↑

"лучших ходов" достаточно часто больше, чем один
Нажмите, чтобы раскрыть...

я это писал уже

nh2008 пишет: ↑

а не то, что Вы пытаетесь доказать
Нажмите, чтобы раскрыть...

а что я пытаюсь доказать? вернемся к началу?
приходится в очередной раз цитировать себя же

Strat7 пишет: ↑

В каждой позиции должен быть самый лучший ход (в шахматах может быть не один) раз пока есть проигрыши, то такой ход не найден.
Нажмите, чтобы раскрыть...

ну он есть этот лучший ход. вы с этим спорите? что нет лучшего хода?

nh2008 · 2 ноя 2020

Strat7 пишет: ↑

ну он есть этот лучший ход. вы с этим спорите? что нет лучшего хода?
Нажмите, чтобы раскрыть...

Я не спорю, но объект "лучший ход" определяю иначе, чем Вы. Я не заморачиваюсь длиной пути к получению результата. Вот и всё.

Или Вы не согласны, что ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход и оба они одинаково лучшие?

Strat7 · 2 ноя 2020

nh2008 пишет: ↑

ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход
Нажмите, чтобы раскрыть...

не хуже

nh2008 пишет: ↑

оба они одинаково лучшие?
Нажмите, чтобы раскрыть...

На практике это уже будет зависеть от настроек программы, правил игры типа тех же ограничений в 50 ходов, и не надо забывать, что в практике всегда будет сделан ход. Вот тот который сделали, его выберут по каким-то критериям внесенным в логику программы, хоть рандомом но выберут. С точки зрения прийти к конечному результат любым путем - разницы нет.

Crest · 2 ноя 2020

Strat7 пишет: ↑

nh2008 пишет: ↑

ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход
Нажмите, чтобы раскрыть...

не хуже.
Нажмите, чтобы раскрыть...

Нет, хуже.
И намного!
Примерно в тысячу раз.
Потому что в наше жёсткое и безжалостное время имеет значение всё.
И результат, и метод, и скорость, и затраты...

nh2008 · 2 ноя 2020

Crest пишет: ↑

Нет, хуже.
И намного!
Примерно в тысячу раз.
Потому что в наше жёсткое и безжалостное время имеет значение всё.
И результат, и метод, и скорость, и затраты...
Нажмите, чтобы раскрыть...

Ну, у нас же "сферический игрок в вакууме"

Benas · 3 ноя 2020

nh2008 пишет: ↑

Или Вы не согласны, что ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход и оба они одинаково лучшие?
Нажмите, чтобы раскрыть...

Такой банальный пример - цейтнот - противник ошибься и прозевал случайный мат в 1 ход, однако ты сделал ход после которого выигрываешь через ХХ ходов - но просрочил время и проиграл ...

nh2008 · 3 ноя 2020

Benas пишет: ↑

Такой банальный пример - цейтнот - противник ошибься и прозевал случайный мат в 1 ход, однако ты сделал ход после которого выигрываешь через ХХ ходов - но просрочил время и проиграл ...
Нажмите, чтобы раскрыть...

Я веду речь об "идеальном игроке". Это абстракция. Я постарался убрать всё лишнее.
Осталось одно правило: повторение позиции - автоматическая ничья. Ведь правило 50 ходов грешит против "шахматной истины" тем, что есть позиции выигранные, но при этом цепочка ходов без пешечной активности и взятий больше тех самых 50 ходов.

И то, что позиция должна возникнуть 3 раза, чтобы получить право требовать ничью для идеального игрока не нужно. Достаточно возникновения позиции 2 раза. При этом одинаковые фигуры могут меняться местами - всё равно повтор. Важно изменение возможностей взятий на проходе и рокировок. При их изменениях позиции считаются разными.

Так что рано или поздно партия придёт к финалу.

nh2008 · 4 ноя 2020

Разработан новый математический процесс, позволяющий кардинально уменьшить наборы данных для обучения систем искусственного интеллекта

Группа ученых университета Ватерлоо, Канада, работающих в области математической статистики, предложила и реализовала идею нового математического процесса, позволяющего быстро и эффективно производить обучение систем искусственного интеллекта. При этом, для достаточно высококачественного обучения при помощи нового метода не требуется использования больших наборов исходных данных, таких, которые необходимы при традиционном подходе.
Нажмите, чтобы раскрыть...

nh2008 · 23 ноя 2020

Система искусственного интеллекта разнесла в пух и прах суперкомпьютер на задаче масштабного моделирования

В свое время мы рассказывали нашим читателям о компании Cerebras Systems, которая прославилась созданием самого большого в мире процессора, предназначенного для мощных систем искусственного интеллекта. Основной задачей, для которой создавался мини-суперкомпьютер CS-1 на основе этого процессора, являлся процесс ускоренного обучения нейронных сетей, но недавно специалисты компании Cerebras решили испытать свое детище на поприще масштабных научных вычислений, там, где до этого безраздельно властвовали традиционные суперкомпьютеры. И это испытание дало ошеломляющий результат, при расчетах математической модели, включающей в себя более 500 миллионов переменных, компьютер CS-1 буквально разнес в пух и прах один из самых мощных суперкомпьютеров в мире, который занимает сейчас 69 строчку мирового рейтинга TOP-500.
...
Нажмите, чтобы раскрыть...

WinPooh · 1 окт 2021

svoitsl · 2 окт 2021

Число тренировок Лилы уже вроде перевалило за 0,5 млрд, а во результат хотелось бы получше...

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Strat7 Учаcтник

Mustitz Заслуженный

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

Crest Админ, МГ

nh2008 Старожил

Benas Учаcтник

nh2008 Старожил

nh2008 Старожил

nh2008 Старожил

WinPooh В.М.

svoitsl Учаcтник

Поделиться этой страницей