AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    идеальный - играет безошибочно. безошибочно, значит каждый раз делается лучший ход. какие тут другие уровни идеальности???

    При разговоре об идеальности неважно насколько он просчитал - если ходы иделаьны и наилучшие то этого достаточно. после остается сделать этот ход. если противник тоже идеален то рассуждения - я вот сейчас немногожко ошибусь а зато может выиграю - беспочвенны, ведь противник идеален и просто использует эту ошибку (любой неидеальный ход равен ошибке)

    При игре против идеального противника не надо, просто проиграешь.
    А если ты играешь против неидеального, то какой опять же смысл делать ошибки? Просто играй идеально и рано или поздно выиграешь.
    —- добавлено: 1 ноя 2020 —-
    Не понимаю о чем тут говорится. Либо игрок идеален, либо нет. Что хотели сказать?
  2. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.546
    Симпатии:
    1.265
    Репутация:
    36
    Адрес:
    Киев
    Оффлайн
    Я уже давно не видел матчей компов с дебютными книжками из начальной позиции. Финал TCEC играется без дебютной книги из 50-ти часто достаточно несбалансированных позиций а-ля гамбит Хэллоуина. Поэтому, я готов допустить, что уже сейчас комбинация движок+книга могут играть идеально из начальной позиции, она не самая сложная и там есть где получить надёжность.

    Пример с крестикими-ноликами о том, что достаточно сложно решить, какой из первых ходов ставит перед противником больше проблем. После хода в угол у ноликов только один спасительный ход в центр, остальное проигрывает. Но, с точки зрения человека, ход в центр более естественный. Но пусть крестик в угол, нолик в центр. Любая угроза поставить три в ряд вынуждает единственный ответ. Но как раз такую угрозу человеку легче распознать. А вот сыграть диагонально симметрично в угол может поставить ловушку. И т. д. и т. п.

    Поэтому все разговоры о том, что есть один сильнейший ход это ерунда. Если соперник играет рандомными ходями, то наибольшие шансы дают одни ходы. Если соперник вначале защищается от угрозы три в ряд, а уже потом играет рандомно, то наибольшие шансы даст уже другие продолжения, если соперник предпочитает играть в центр, а потом защищается от угрозы три в ряд, то уже третий и т. п.
    nh2008 нравится это.
  3. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    Да, может быть, но как только мы меняем начальную позицию кое кто иногда проигрывает. То есть один частный случай начальной позиции не говорит что игрок идеален.

    В каждой позиции есть ограниченный набор ходов. Один или несколько из них - лучший. При этом частный случай, когда ход один возможны значит это одновременно и лучший и худший ход. Все остальное их вариации. При этом лучший ход всегда есть. С чем тут спорить - не

    понятно.


    то он неидеален и лучшая стратегия - играть против него идеально, как и против любого другого соперника

    все возражения сводятся к тому, что если соперник неидеален то против него можно якобы делать плохие ходы. можно, но скорее проиграешь и тут будет сильно важна разница в рейтинге.
  4. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    С этой точки зрения лучшим является любой ход, не ухудшающий результат игры и не повторяющий уже встретившуюся в партии позицию, пусть даже выбранный рандомно. Ни о каком всегда одном лучшем ходе и речи быть не может. Что Вы имели ввиду, когда говорили, что в каждой позиции есть лучший ход?
  5. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    Вроде попытался это разъяснить выше.

    Но попробую еще раз.
    Результат игры по приоритету - выигрыш, ничья, проигрыш.
    Соответственно лучший ход тот, который ведет к выигрышу, Если ходов несколько ведут к выигрышу, то лучший тот, который ведет к выигрышу в меньшее число ходов (в силу того, что есть фактор ограничения числа ходов, а значит меньше ходов - быстрее успеваешь выиграть).

    Если несколько ходов ведут к выигрышу с одинаковой длительностью, то выбор равнозначен - каждый из ходов лучший. Тут вступает в силу то, что вам НУЖНО сделать ход, вот какой из этих вы выберете тот и будет лучший окончательно :)
  6. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Ограничение количества ходов нужно чисто для биологических шахматистов, как и ничья после троекратного повторения позиции по желанию делающего ход. Для идеальных достаточно одного ограничения - повтор позиции (т.е. её двукратное возникновение) - автоматическая ничья.
    Убираем надуманное ограничение количества ходов, мы же для идеальных игроков всё делаем, получим равнозначность всех ходов, ведущих к одинаковому результату.
  7. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    Получили. Дальше то что? ВЫБИРАЕМ и ДЕЛАЕМ ход. Все, был сделан лучший ход. И так до конца партии.
  8. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Мы не заморачиваемся длиной пути к победе поэтому "лучших ходов" достаточно часто больше, чем один, а не то, что Вы пытаетесь доказать.
  9. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    я это писал уже

    а что я пытаюсь доказать? вернемся к началу?
    приходится в очередной раз цитировать себя же
    ну он есть этот лучший ход. вы с этим спорите? что нет лучшего хода?
  10. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Я не спорю, но объект "лучший ход" определяю иначе, чем Вы. Я не заморачиваюсь длиной пути к получению результата. Вот и всё.

    Или Вы не согласны, что ход приводящий к победе в 1000 ходов ничуть не хуже того, который приводит к победе в 1 ход и оба они одинаково лучшие?
  11. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    806
    Симпатии:
    372
    Репутация:
    11
    Оффлайн
    не хуже

    На практике это уже будет зависеть от настроек программы, правил игры типа тех же ограничений в 50 ходов, и не надо забывать, что в практике всегда будет сделан ход. Вот тот который сделали, его выберут по каким-то критериям внесенным в логику программы, хоть рандомом но выберут. С точки зрения прийти к конечному результат любым путем - разницы нет.
    nh2008 нравится это.
  12. Crest Админ, МГ

    • Команда форума
    Рег.:
    05.02.2006
    Сообщения:
    57.245
    Симпатии:
    21.136
    Репутация:
    628
    Адрес:
    Москва, Россия
    Оффлайн
    Нет, хуже.
    И намного!
    Примерно в тысячу раз.
    Потому что в наше жёсткое и безжалостное время имеет значение всё.
    И результат, и метод, и скорость, и затраты...
  13. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Ну, у нас же "сферический игрок в вакууме" :)
  14. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    147
    Симпатии:
    27
    Репутация:
    1
    Оффлайн
    Такой банальный пример - цейтнот - противник ошибься и прозевал случайный мат в 1 ход, однако ты сделал ход после которого выигрываешь через ХХ ходов - но просрочил время и проиграл ...
  15. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Я веду речь об "идеальном игроке". Это абстракция. Я постарался убрать всё лишнее.
    Осталось одно правило: повторение позиции - автоматическая ничья. Ведь правило 50 ходов грешит против "шахматной истины" тем, что есть позиции выигранные, но при этом цепочка ходов без пешечной активности и взятий больше тех самых 50 ходов.
    И то, что позиция должна возникнуть 3 раза, чтобы получить право требовать ничью для идеального игрока не нужно. Достаточно возникновения позиции 2 раза. При этом одинаковые фигуры могут меняться местами - всё равно повтор. Важно изменение возможностей взятий на проходе и рокировок. При их изменениях позиции считаются разными.
    Так что рано или поздно партия придёт к финалу.
    SKY нравится это.
  16. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Разработан новый математический процесс, позволяющий кардинально уменьшить наборы данных для обучения систем искусственного интеллекта
  17. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Система искусственного интеллекта разнесла в пух и прах суперкомпьютер на задаче масштабного моделирования
  18. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Комсюк нравится это.
  19. svoitsl Учаcтник

    • Участник
    Рег.:
    06.01.2018
    Сообщения:
    374
    Симпатии:
    91
    Репутация:
    7
    Оффлайн
    Число тренировок Лилы уже вроде перевалило за 0,5 млрд, а во результат хотелось бы получше...

Поделиться этой страницей