AlphaZero. Нейронная сеть играет в шахматы

Strat7 · 1 Nov 2020

nh2008 said: ↑

А что такое идеальный игрок? Есть разные уровни идеальности.
Click to expand...

идеальный - играет безошибочно. безошибочно, значит каждый раз делается лучший ход. какие тут другие уровни идеальности???

nh2008 said: ↑

Один движок просчитывает на 100 ходов вперёд, другой - на 1000.
Click to expand...

При разговоре об идеальности неважно насколько он просчитал - если ходы иделаьны и наилучшие то этого достаточно. после остается сделать этот ход. если противник тоже идеален то рассуждения - я вот сейчас немногожко ошибусь а зато может выиграю - беспочвенны, ведь противник идеален и просто использует эту ошибку (любой неидеальный ход равен ошибке)

nh2008 said: ↑

Надо ли рисковать
Click to expand...

При игре против идеального противника не надо, просто проиграешь.
А если ты играешь против неидеального, то какой опять же смысл делать ошибки? Просто играй идеально и рано или поздно выиграешь.

—- добавлено: 1 Nov 2020 —-

nh2008 said: ↑

Но ведь наверняка можно сильно ослабить условия "всезнайства", оставив, например, таблицу фигур до 24
Click to expand...

Не понимаю о чем тут говорится. Либо игрок идеален, либо нет. Что хотели сказать?

Mustitz · 1 Nov 2020

Strat7 said: ↑

Сейчас пока между компами иногда они проигрывают, а значит идеала нет.
Click to expand...

Я уже давно не видел матчей компов с дебютными книжками из начальной позиции. Финал TCEC играется без дебютной книги из 50-ти часто достаточно несбалансированных позиций а-ля гамбит Хэллоуина. Поэтому, я готов допустить, что уже сейчас комбинация движок+книга могут играть идеально из начальной позиции, она не самая сложная и там есть где получить надёжность.

Strat7 said: ↑

Так что весь этот пример с крестиками ноликами ни о чем.
Click to expand...

Пример с крестикими-ноликами о том, что достаточно сложно решить, какой из первых ходов ставит перед противником больше проблем. После хода в угол у ноликов только один спасительный ход в центр, остальное проигрывает. Но, с точки зрения человека, ход в центр более естественный. Но пусть крестик в угол, нолик в центр. Любая угроза поставить три в ряд вынуждает единственный ответ. Но как раз такую угрозу человеку легче распознать. А вот сыграть диагонально симметрично в угол может поставить ловушку. И т. д. и т. п.

Поэтому все разговоры о том, что есть один сильнейший ход это ерунда. Если соперник играет рандомными ходями, то наибольшие шансы дают одни ходы. Если соперник вначале защищается от угрозы три в ряд, а уже потом играет рандомно, то наибольшие шансы даст уже другие продолжения, если соперник предпочитает играть в центр, а потом защищается от угрозы три в ряд, то уже третий и т. п.

Strat7 · 1 Nov 2020

Mustitz said: ↑

уже сейчас комбинация движок+книга могут играть идеально из начальной позиции, она не самая сложная и там есть где получить надёжность.
Click to expand...

Да, может быть, но как только мы меняем начальную позицию кое кто иногда проигрывает. То есть один частный случай начальной позиции не говорит что игрок идеален.

Mustitz said: ↑

все разговоры о том, что есть один сильнейший ход это ерунда
Click to expand...

В каждой позиции есть ограниченный набор ходов. Один или несколько из них - лучший. При этом частный случай, когда ход один возможны значит это одновременно и лучший и худший ход. Все остальное их вариации. При этом лучший ход всегда есть. С чем тут спорить - не

понятно.

Mustitz said: ↑

Если соперник играет рандомными ходями
Click to expand...

то он неидеален и лучшая стратегия - играть против него идеально, как и против любого другого соперника

все возражения сводятся к тому, что если соперник неидеален то против него можно якобы делать плохие ходы. можно, но скорее проиграешь и тут будет сильно важна разница в рейтинге.

nh2008 · 1 Nov 2020

Strat7 said: ↑

Не понимаю о чем тут говорится. Либо игрок идеален, либо нет. Что хотели сказать?
Click to expand...

С этой точки зрения лучшим является любой ход, не ухудшающий результат игры и не повторяющий уже встретившуюся в партии позицию, пусть даже выбранный рандомно. Ни о каком всегда одном лучшем ходе и речи быть не может. Что Вы имели ввиду, когда говорили, что в каждой позиции есть лучший ход?

Strat7 · 1 Nov 2020

nh2008 said: ↑

Что Вы имели ввиду, когда говорили, что в каждой позиции есть лучший ход?
Click to expand...

Вроде попытался это разъяснить выше.

Strat7 said: ↑

Всегда есть лучший ход, а когда их несколько, то это значит, что число ходов до конечного результата одинаково (например два хода ведут к мату в 1 ход - оба лучшие)
Click to expand...

Но попробую еще раз.
Результат игры по приоритету - выигрыш, ничья, проигрыш.
Соответственно лучший ход тот, который ведет к выигрышу, Если ходов несколько ведут к выигрышу, то лучший тот, который ведет к выигрышу в меньшее число ходов (в силу того, что есть фактор ограничения числа ходов, а значит меньше ходов - быстрее успеваешь выиграть).

Если несколько ходов ведут к выигрышу с одинаковой длительностью, то выбор равнозначен - каждый из ходов лучший. Тут вступает в силу то, что вам НУЖНО сделать ход, вот какой из этих вы выберете тот и будет лучший окончательно

nh2008 · 2 Nov 2020

Strat7 said: ↑

Если ходов несколько ведут к выигрышу, то лучший тот, который ведет к выигрышу в меньшее число ходов (в силу того, что есть фактор ограничения числа ходов, а значит меньше ходов - быстрее успеваешь выиграть).
Click to expand...

Ограничение количества ходов нужно чисто для биологических шахматистов, как и ничья после троекратного повторения позиции по желанию делающего ход. Для идеальных достаточно одного ограничения - повтор позиции (т.е. её двукратное возникновение) - автоматическая ничья.
Убираем надуманное ограничение количества ходов, мы же для идеальных игроков всё делаем, получим равнозначность всех ходов, ведущих к одинаковому результату.

Strat7 · 2 Nov 2020

nh2008 said: ↑

получим равнозначность всех ходов, ведущих к одинаковому результату.
Click to expand...

Получили. Дальше то что? ВЫБИРАЕМ и ДЕЛАЕМ ход. Все, был сделан лучший ход. И так до конца партии.

nh2008 · 2 Nov 2020

Strat7 said: ↑

Получили. Дальше то что? ВЫБИРАЕМ и ДЕЛАЕМ ход. Все, был сделан лучший ход. И так до конца партии.
Click to expand...

Мы не заморачиваемся длиной пути к победе поэтому "лучших ходов" достаточно часто больше, чем один, а не то, что Вы пытаетесь доказать.

Strat7 · 2 Nov 2020

nh2008 said: ↑

"лучших ходов" достаточно часто больше, чем один
Click to expand...

я это писал уже

nh2008 said: ↑

а не то, что Вы пытаетесь доказать
Click to expand...

а что я пытаюсь доказать? вернемся к началу?
приходится в очередной раз цитировать себя же

Strat7 said: ↑

В каждой позиции должен быть самый лучший ход (в шахматах может быть не один) раз пока есть проигрыши, то такой ход не найден.
Click to expand...

ну он есть этот лучший ход. вы с этим спорите? что нет лучшего хода?

nh2008 · 2 Nov 2020

Strat7 said: ↑

ну он есть этот лучший ход. вы с этим спорите? что нет лучшего хода?
Click to expand...

Я не спорю, но объект "лучший ход" определяю иначе, чем Вы. Я не заморачиваюсь длиной пути к получению результата. Вот и всё.

Или Вы не согласны, что ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход и оба они одинаково лучшие?

Strat7 · 2 Nov 2020

nh2008 said: ↑

ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход
Click to expand...

не хуже

nh2008 said: ↑

оба они одинаково лучшие?
Click to expand...

На практике это уже будет зависеть от настроек программы, правил игры типа тех же ограничений в 50 ходов, и не надо забывать, что в практике всегда будет сделан ход. Вот тот который сделали, его выберут по каким-то критериям внесенным в логику программы, хоть рандомом но выберут. С точки зрения прийти к конечному результат любым путем - разницы нет.

Crest · 2 Nov 2020

Strat7 said: ↑

nh2008 said: ↑

ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход
Click to expand...

не хуже.
Click to expand...

Нет, хуже.
И намного!
Примерно в тысячу раз.
Потому что в наше жёсткое и безжалостное время имеет значение всё.
И результат, и метод, и скорость, и затраты...

nh2008 · 2 Nov 2020

Crest said: ↑

Нет, хуже.
И намного!
Примерно в тысячу раз.
Потому что в наше жёсткое и безжалостное время имеет значение всё.
И результат, и метод, и скорость, и затраты...
Click to expand...

Ну, у нас же "сферический игрок в вакууме"

Benas · 3 Nov 2020

nh2008 said: ↑

Или Вы не согласны, что ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход и оба они одинаково лучшие?
Click to expand...

Такой банальный пример - цейтнот - противник ошибься и прозевал случайный мат в 1 ход, однако ты сделал ход после которого выигрываешь через ХХ ходов - но просрочил время и проиграл ...

nh2008 · 3 Nov 2020

Benas said: ↑

Такой банальный пример - цейтнот - противник ошибься и прозевал случайный мат в 1 ход, однако ты сделал ход после которого выигрываешь через ХХ ходов - но просрочил время и проиграл ...
Click to expand...

Я веду речь об "идеальном игроке". Это абстракция. Я постарался убрать всё лишнее.
Осталось одно правило: повторение позиции - автоматическая ничья. Ведь правило 50 ходов грешит против "шахматной истины" тем, что есть позиции выигранные, но при этом цепочка ходов без пешечной активности и взятий больше тех самых 50 ходов.

И то, что позиция должна возникнуть 3 раза, чтобы получить право требовать ничью для идеального игрока не нужно. Достаточно возникновения позиции 2 раза. При этом одинаковые фигуры могут меняться местами - всё равно повтор. Важно изменение возможностей взятий на проходе и рокировок. При их изменениях позиции считаются разными.

Так что рано или поздно партия придёт к финалу.

nh2008 · 4 Nov 2020

Разработан новый математический процесс, позволяющий кардинально уменьшить наборы данных для обучения систем искусственного интеллекта

Группа ученых университета Ватерлоо, Канада, работающих в области математической статистики, предложила и реализовала идею нового математического процесса, позволяющего быстро и эффективно производить обучение систем искусственного интеллекта. При этом, для достаточно высококачественного обучения при помощи нового метода не требуется использования больших наборов исходных данных, таких, которые необходимы при традиционном подходе.
Click to expand...

nh2008 · 23 Nov 2020

Система искусственного интеллекта разнесла в пух и прах суперкомпьютер на задаче масштабного моделирования

В свое время мы рассказывали нашим читателям о компании Cerebras Systems, которая прославилась созданием самого большого в мире процессора, предназначенного для мощных систем искусственного интеллекта. Основной задачей, для которой создавался мини-суперкомпьютер CS-1 на основе этого процессора, являлся процесс ускоренного обучения нейронных сетей, но недавно специалисты компании Cerebras решили испытать свое детище на поприще масштабных научных вычислений, там, где до этого безраздельно властвовали традиционные суперкомпьютеры. И это испытание дало ошеломляющий результат, при расчетах математической модели, включающей в себя более 500 миллионов переменных, компьютер CS-1 буквально разнес в пух и прах один из самых мощных суперкомпьютеров в мире, который занимает сейчас 69 строчку мирового рейтинга TOP-500.
...
Click to expand...

WinPooh · 1 Oct 2021

svoitsl · 2 Oct 2021

Число тренировок Лилы уже вроде перевалило за 0,5 млрд, а во результат хотелось бы получше...

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

Strat7 Учаcтник

Mustitz Заслуженный

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

nh2008 Старожил

Strat7 Учаcтник

Crest Админ, МГ

nh2008 Старожил

Benas Учаcтник

nh2008 Старожил

nh2008 Старожил

nh2008 Старожил

WinPooh В.М.

svoitsl Учаcтник

Share This Page