AlphaZero. Нейронная сеть играет в шахматы

zeroalphazero · 18 Dec 2017

Океюшки, парочка подсказок:

Мобуту said: ↑

... Причина поражения Стокфиша: его ладья a8 и конь b8 были вне игры...
Click to expand...

Точно ли причина? Не следствие ли? Тогда следствие чего? Произошедшего до того как?

Мобуту said: ↑

... Первый напрашивающийся момент, когда можно было развить коня...
Click to expand...

Если идея верна, ее невозможно довести до абсурда.
Даже не буду пытаться доводить. Сэкономлю свое и Ваше время: а что мешало сыграть Nc6 на первом ходу? Ладье "простор", коню воля!
Т.е. 1... Nc6?! — момент-то это уж действительно первый, первее не бывает! Но напрашивающийся ли?!

Комсюк · 18 Dec 2017

zeroalphazero said: ↑

Если идея верна, ее невозможно довести до абсурда.
Click to expand...

можно бы и лайкнуть, но

zeroalphazero said: ↑

1... Nc6?!
Click to expand...

знак разрушил впечатление

zeroalphazero · 18 Dec 2017

О-о-о!..
Был у меня тезка-тренер, простой КМС, но порой, в обидке за державу, 9-му чемпиону письменно дебютные советы-рекомендации давал перед матчем с будущим 11-ым.
Не прислушался 9-ый. А жаль. Проиграл, конечно...
Так я о чем? — совсем пацаном, помнится, с ним блицевал иногда-порой, постоянно озадачивая белыми новинкой в Рети на... 2-ом (!) ходу. Балаганили при этом — ну просто труба! Эх,.. есть о чем вспомнить, нечего детям рассказать...
Ну а уж 1. Nf3!! Nc6?! — знаки сами просятся. Статистика у меня СВОЯ!

Комсюк · 18 Dec 2017

Какой к чёрту тёзка может быть у человека с именем zeroalphazero?

Нестор · 18 Dec 2017

zeroalphazero, есть комментаторы, которые даже к ходу 1. ...Na6 ставят !?, а не ?!

hornet · 18 Dec 2017

Кстати в обсуждаемой на этой странице партии, ходом g5 сток играл на победу (как мне кажется, и как казалось стоку). Если бы в приоритете была безопасность короля, и гармоничная игра всех фигур - ничейку можно было сделать без проблем. Надо привлечь любителей системы Чужакина, попросить проанализировать опасные элементы по ходу партии (правда как положено по всем пунктам, а не там где хочется). Вообще, на это я намекал, упоминая в одном из постов человеческие критерии...

zeroalphazero · 18 Dec 2017

Комсюк said: ↑

Какой к чёрту тёзка...
Click to expand...

Царствие Ему неБесное!

zeroalphazero · 18 Dec 2017

hornet said: ↑

человеческие критерии
Click to expand...

Подсказка третья.
Что такое план?
Затрудняетесь с ответом? — Google Яндекс вам в помощь!

Комсюк · 18 Dec 2017

zeroalphazero said: ↑

Комсюк said: ↑

Какой к чёрту тёзка...
Click to expand...

Царствие Ему неБесное!
Click to expand...

Виорел, перелогиньтесь!

zeroalphazero · 18 Dec 2017

Комсюк said: ↑

Виорел, перелогиньтесь!
Click to expand...

Он еще молоденок, со мною тягаться слабенок.

Baron · 19 Dec 2017

Немного в тему
Компьютер обыграл лучших игроков в покер, «заработав» два миллиона долларов

Искусственный интеллект Libratus, сыгравший в покер с одними из лучших игроков в мире в техасский холдем, победил их и набрал 1,8 миллиона долларов в фишках.
Click to expand...

zeroalphazero · 19 Dec 2017

Вновь идя навстречу требующим продолжения банкета, по-царски готовым пожертвовать свой проц ради всеобщего блага и остро заинтересованным по истечении выплаты долга по кредиту в даже приобретении компа с видеокартами, хочу подкинуть еще парочку картинок — для на их вкус оценки и сравнения.

хрен поймёшь, бардак строенные пешки и т.п.
Click to expand...

наоборот притягивает
Click to expand...

Camon14 · 19 Dec 2017

zeroalphazero said: ↑

Ну а уж 1. Nf3!!
Click to expand...

приятно видеть разумного человека
http://kasparovchess.crestbook.com/threads/3628/page-355#post-765865

Нестор · 19 Dec 2017

Baron said: ↑

Немного в тему
Компьютер обыграл лучших игроков в покер, «заработав» два миллиона долларов

Искусственный интеллект Libratus, сыгравший в покер с одними из лучших игроков в мире в техасский холдем, победил их и набрал 1,8 миллиона долларов в фишках.
Click to expand...

Click to expand...

Ждем матч АльфаЗеро - Либратус ?

zeroalphazero · 19 Dec 2017

Camon14 said: ↑

1.Кф3! сильнейший ход. тем более он сохраняет все самое ценное от хода е4, например 1. Nf3 c5 2. e4!
Click to expand...

У меня своя "теория дебютов" для блица.
1. Nf3 c5 2. b4!? cxb4 3. a3!? bxa3 4. e4
или
1. Nf3 e6 2. e4 d5 3. e5 c5 4. b4!?

NS · 19 Dec 2017

Не знаю оффтоп ли тут Го,
но вот так играет на текущий момент сильнейшая версия Leela Zero
http://www.yss-aya.com/cgos/viewer.cgi?19x19/SGF/2017/12/18/332701.sgf
Тут она одержала победу черными.

WinPooh · 19 Dec 2017

NS said: ↑

Не знаю оффтоп ли тут Го,
но вот так играет на текущий момент сильнейшая версия Leela Zero
http://www.yss-aya.com/cgos/viewer.cgi?19x19/SGF/2017/12/18/332701.sgf
Тут она одержала победу черными.
Click to expand...

???
Не понял
Чёрных же съели

А, победа по времени. Видимо, у GNU Go при попытке досчитать лесенку до конца доски переполнились какие-то структуры данных

WinPooh · 19 Dec 2017

А вот ещё партия.
http://eidogo.com/#4g8pS0Opz
Доставляют комментарии к ходам 57, 58 и 67

Benas · 19 Dec 2017

NS said: ↑

но вот так играет на текущий момент сильнейшая версия Leela
Click to expand...

Я не знаю но то, что имею я 3 Дану не победить....

zeroalphazero · 19 Dec 2017

zeroalphazero said: ↑

Как приятно осознавать, что не одинок во Вселенной!..
Click to expand...

Пророческие строки!

Чудесен шахматный закон и непреложен:
Кто перевес хотя б ничтожный получил
В пространстве, массе, времени, напоре сил —
Лишь для того прямой к победе путь возможен.

Шахматная мысль, превратившая уездный город в столицу земного шара, превратится в прикладную науку и изобретет способы междупланетного сообщения. Из Васюков полетят сигналы на Марс, Юпитер и Нептун. Сообщение с Венерой сделается таким же легким, как переезд из Рыбинска в Ярославль. А там, как знать, может быть, лет через восемь в Васюках состоится первый в истории мироздания междупланетный шахматный турнир!
Click to expand...

Пророчество сбылось! => https://www.cfa.harvard.edu/~avanderb/kepler90i.pdf

https://www.popmech.ru/science/news-401872-ii-nashel-ekzoplanety-tam-gde-ih-ne-nashli-lyudi/
NASA любит раз в год созвать журналистов и рассказать о новом открытии. Обычно о конференции становится известно за несколько дней, и по составу докладчиков мы пытаемся угадать, о чем пойдет речь. На этой неделе стало известно, что новая конференция пройдет в четверг, и участвовать в ней будут астрономы — члены команды телескопа «Кеплер», который ищет экзопланеты, и программисты — разработчики искусственного интеллекта Google. Мы сразу поняли, что речь пойдет об экзопланетах — но при чем тут ИИ?
На самом деле мы догадывались, зачем астрофизикам понадобился искусственный интеллект — конечно, для того, чтобы обрабатывать огромное количество данных. А вчера мы узнали, что нашел ИИ, в который загрузили данные «Кеплера».
Нашел он новые экзопланеты, причем там, где люди их уже искали и нашли, но кое-что пропустили...
Статья о Kepler-90i будет опубликована в журнале The Astronomical Journal.
Click to expand...

http://www.bbc.com/russian/news-42364441

zeroalphazero · 19 Dec 2017

— Почему в провинции нет никакой игры мысли?
Например, вот ваша шахсекция. Так она и называется шахсекция. Скучно, девушки!
Click to expand...

Скука — двигатель прогресса!
Теперь, надеюсь, поубавится количество скептиков?
С сарказмом и иронией относились к рассказу Кирсана Николаевича о встрече с инопланетянами?
А ведь даже шахматному коню ясно, что это сущая правда!
Кибернетика многим обязана шахматам. Пришло время возвращать долги! — даже тем, кто некогда вышел из шахматного "Кибернетического клуба", основав нейросетевой.
Инопланетянам тоже бывает скучно, тоже нравится играть. А у землян — чудесные и мудрые игры!

crem · 19 Dec 2017

MS said: ↑

Ещё раз, Г просто продемонстрировал. что современное железо, пусть не на бытовом уровне, а на уровне крупной корпорации, способно решать сложные
задачи, базируясь на подходах, которые, по большому счёту, были известны, но не были поддержаны адекватным железом.
Click to expand...

Дело не только в железе, а в множестве улучшений алгоритма, существенно ускоряющих обучение. Действительно, общие методы известны уже десятки лет, но без этих улучшений, даже на современном оборудовании гугла обучение бы заняло не часы а годы.
Даже если сравнить AlphaGo и AlphaZero, то AlphaGo тренировали полтора месяца, а AlphaZero достигла такого же уровня за 8 часов. У AlphaGo по сравнению с предшественниками тоже были существенные улучшения алгоритма (задним числом кажущиеся очевидными).

Напомню, что за пару часов до того, когда гугл объявил, что AlphaGo обыграл профессионального игрока Go, фейсбук тоже объявил о том, что "мы создали программу, играющую в Go на нейронных сетях, которая играет так же сильно как GnuGo":
https://www.facebook.com/zuck/videos/vb.4/10102619979032811/
Фейсбук тоже располагает большими вычислительными мощностями, но одного лишь этого не хватило, чтобы обыграть человека.

Когда читаешь свежие статьи о machine learning (вообще все, не только от гугла), то они вызывают одну из двух реакций:
1. Вроде бы это улучшение и так очевидно, зачем об этом писать? (90% статей)
2. Вот этот совсем простой и общеизвестный метод даёт такие хорошие результаты? Ничего себе! (10% статей).

Но на самом деле если собрать все эти "очевидные мелочи" вместе, сотнями, то они ускоряют обучение в десятки тысяч раз. И до этих "очевидных мелочей" надо:
1. Додуматься. Додуматься до нескольких очевидных мелочей просто, а до сотни — не очень.
2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).

NS · 19 Dec 2017

crem said: ↑

Дело не только в железе, а в множестве улучшений алгоритма обучения, существенно ускоряющих обучение.
Click to expand...

Дело не только в железе, но и без железа никак.
Например. MCTS/UCT для нормальной игры требует некоторой производительности. Изначально в ГО оно слабее Альфа-беты, но удвоение скорости дает прибавку больше чем альфа-бета.
Первые программы на MCTS появились ровно тогда, когда они хоть как-то могли конкурировать с стандартными ГО-программами на доске 9x9.
Селективный null-move, history - появились тогда, когда производительности железа стало хватать для того чтоб они давали заметную прибавку.

ИМХО и тут так-же. Шахматы на MCTS+НС появились именно тогда, когда у Гугла появилась возможность запустить обучение на сверхмощностях.
На GPU и на обучение уйдут годы, и производительности для нормальной силы игры не хватит.
Железо, на котором обучалась AlphaZero - в сотню тысяч раз мощнее достаточно серьезного компа.

То есть если бы не Гугл, то это бы сделал кто-нибудь другой, когда появились бы необходимые вычислительные ресурсы.

—- добавлено: 19 Dec 2017 —-

crem said: ↑

2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).
Click to expand...

Были попытки сделать играющую шахматную программу на MCTS. И были попытки сделать играющую шахматную программу на НС. И то и другое не ново.

—- добавлено: 19 Dec 2017, опубликовано: 19 Dec 2017 —-

crem said: ↑

Напомню, что за пару часов до того, когда гугл объявил, что AlphaGo обыграл профессионального игрока Go, фейсбук тоже объявил о том, что "мы создали программу, играющую в Go на нейронных сетях, которая играет так же сильно как GnuGo":
Click to expand...

Если я правильно прочел аннотацию, Фейсбук сделал программу, играющую в силу GnuGo без перебора, только НС. А Alpha играет с перебором.

MS · 20 Dec 2017

crem said: ↑

Когда читаешь свежие статьи о machine learning (вообще все, не только от гугла), то они вызывают одну из двух реакций:
1. Вроде бы это улучшение и так очевидно, зачем об этом писать? (90% статей)
2. Вот этот совсем простой и общеизвестный метод даёт такие хорошие результаты? Ничего себе! (10% статей).

Но на самом деле если собрать все эти "очевидные мелочи" вместе, сотнями, то они ускоряют обучение в десятки тысяч раз. И до этих "очевидных мелочей" надо:
1. Додуматься. Додуматься до нескольких очевидных мелочей просто, а до сотни — не очень.
2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).
Click to expand...

Готов поверить на слово, поскольку я посмотрел материалы только с одной стороны - Монте-Карло, там шибко интересного не проглядывается. На подробности обучения НС пороху не хватило.

Мобуту · 20 Dec 2017

zeroalphazero said: ↑

Даже не буду пытаться доводить. Сэкономлю свое и Ваше время: а что мешало сыграть Nc6 на первом ходу? Ладье "простор", коню воля!
Т.е. 1... Nc6?! — момент-то это уж действительно первый, первее не бывает! Но напрашивающийся ли?!
Click to expand...

Ну я согласен, что это тоже очень сильный ход. В том плане, что дебюты специально подобрали невыгодные для Стокфиша, а чтоб с них не соскочил с помощью генератора случайных чисел - лишили дебютной книжки. Такой первый ход мог бы смешать белым все карты.

Но всё-таки это вряд ли была последняя возможность развить лошадку. А вот 23-й ход - возможно, действительно последняя.

zeroalphazero · 20 Dec 2017

Мобуту said: ↑

Но всё-таки это вряд ли была последняя возможность развить лошадку. А вот 23-й ход - возможно, действительно последняя.
Click to expand...

По-человечески: 23... b5, зная дальнейшее, выглядит потерей темпа.
Но если в "план" AlphaZero действительно входило это "дальнейшее" (вскрытие вертикали h, гармонично цельная и быстрая перегруппировка с темповой игрой — переброска ферзя, создание батареи ферзь+слон, освобождение диагонали разменом для безопасного подъема короля-занозы — коммуникации созданы! — нижняя горизонталь и правая вертикаль свободны, тяжелая артиллерия выведена на идеальные позиции, 32. с4 и 33. Bd4 заключительными аккордами), то 23. Qc4 выглядит провокацией.
Т.е. почему не сразу привести весь план в действие?
Т.е. что за корректировка плана?!

—- добавлено: 20 Dec 2017, опубликовано: 20 Dec 2017 —-

Кстати, в одном из вариантов (см. предложенное выше 23... Kg7!?) при не совсем точной игре черных белые не вскрывают вертикаль, а доводят пешку до h7.

Как Вам позиция?

Yury_Solomatin · 20 Dec 2017

На chess.com будет выходить цикл статей про AlphaZero
Как AlphaZero играет в шахматы?

ШахматыЭтоДиагноз · 20 Dec 2017

Будут цитировать эту ветку.

zeroalphazero · 20 Dec 2017

У шахмат много общего с музыкой.
Таких смен тональностей (модуляций) я до этого матча не видел.
Шедевры! Фантастика! Искусство...

Fruit · 21 Dec 2017

cs111g said: ↑

В этой позиции (после 59. Bd5!?) непонятно, как добиваться прогресса (рано или поздно происходит переход в различные ничейные ладейные окончания, так как ферзя с h7 не вытащить без размена).
Click to expand...

Вообщем-то, согласен. Все опасные, на первый взгляд, эндшпили там ничейны.
А если сыграть этот ход на 9 ходов раньше:

50.Bd5!?....Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5

cs111g · 21 Dec 2017

Fruit said: ↑

Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5
Click to expand...

Шикарнейший вариант (похоже, там выиграно).
Пока удалось нащупать лишь 50... Rc8 51. Qf4 Qg8 52. Bb7 Rce8 53. Qd6 c4 54. a4 c3 55. Bd5 Rd8 56. Qc5 Ke8 57. Qxc3 Qf8 58. Rf4 Re6 59. a5 Qd6 60. Bxe6 dxe6 61. Qh8 Qf8, где также нет гарантии ничьей.
Про 50. Qf4 можно забыть =)

Fruit · 21 Dec 2017

cs111g said: ↑

Fruit said: ↑

Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5
Click to expand...

Шикарнейший вариант (похоже, там выиграно).
Пока удалось нащупать лишь 50... Rc8 51. Qf4 Qg8 52. Bb7 Rce8 53. Qd6 c4 54. a4 c3 55. Bd5 Rd8 56. Qc5 Ke8 57. Qxc3 Qf8 58. Rf4 Re6 59. a5 Qd6 60. Bxe6 dxe6 61. Qh8 Qf8, где также нет гарантии ничьей.
Про 50. Qf4 можно забыть =)
Click to expand...

Тут основной принцип, чем раньше играешь Bd5, тем лучше. Поэтому, наверняка, сильнее 54. Bd5

cs111g · 21 Dec 2017

Fruit said: ↑

Поэтому, наверняка, сильнее 54. Bd5
Click to expand...

Тогда что-то типа 54... Rd8 55. Rf4 Ke8 56. Qf6 Qf8 57. Rxc4 Re6 58. Bxe6 dxe6 59. Qe5 Qf5 60. Qh8+ Ke7 61. Qg7+ Qf7 62. Qc3 Qf5.
В общем, сохранить красавца-слона сложно.

PS: А вы не подскажите, как в оболочке Fritz копировать варианты ходов из нотации?

hornet · 21 Dec 2017

Вот что ответил товарищ NeuNeuro в теме Система Чужакина ...:
- " Нейронная сеть не то что в шахматы играть не умеет, её даже ходу шахматной ладьи не научить.

Статьи, в которых пишут об успехах ИНС (искусственной нейронной сети) в игре в шахматы или шашки, обычно мелким шрифтом добавляют, что ИНС используется лишь в оценке позиций, которые прежде получены обычными необучаемыми программами.
Выше писал о том, что человека от обезьяны отличает умение использовать пальцы для расчёта бананов. Так вот - пока не существует ИНС или иной обучаемой автоматической системы, которую можно "по-честному" обучить СЧИТАТЬ. ИНС легко научить "аналоговым" расчётам по типу "много - мало" или "больше-меньше", но цифровой расчёт - нет. Логическое мышление - это будущее ИИ, в настоящем оно практически отсутствует.".

NS · 21 Dec 2017

hornet said: ↑

Статьи, в которых пишут об успехах ИНС (искусственной нейронной сети) в игре в шахматы или шашки, обычно мелким шрифтом добавляют, что ИНС используется лишь в оценке позиций, которые прежде получены обычными необучаемыми программами.
Click to expand...

Отличие AlphaZero (и AlphaGo Zero) от предыдущих версий в том, что она учится с нуля. То есть не использует партии и позиции человеческие и полученные другими программами. Учится на партиях наигранных самой с собой. Именно об этом и говорит слово Zero в названии.

—- добавлено: 21 Dec 2017 —-

Шахматная AlphaZero знает только правила - есть генератор ходов, есть определение мата/пата и ничейных правил, немного эвристик типа SEE (правда этот момент я не понял, они пишут что SEE используют классические программы, или что используется в AlphaZero), и больше о шахматах она изначально не знает ничего.

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

zeroalphazero Учаcтник

Комсюк народный модератор баннер

zeroalphazero Учаcтник

Комсюк народный модератор баннер

Нестор консультант_ специалист по черной магии баннер

hornet Учаcтник

zeroalphazero Учаcтник

zeroalphazero Учаcтник

Комсюк народный модератор баннер

zeroalphazero Учаcтник

Baron Учаcтник

zeroalphazero Учаcтник

Camon14 Хранитель традиций баннер

Нестор консультант_ специалист по черной магии баннер

zeroalphazero Учаcтник

NS Нефёдов Сергей баннер

WinPooh В.М. Staff Member

WinPooh В.М. Staff Member

Benas Учаcтник

zeroalphazero Учаcтник

zeroalphazero Учаcтник

crem Учаcтник

NS Нефёдов Сергей баннер

MS Михаил Семионенков

Мобуту спаситель нации баннер

zeroalphazero Учаcтник

Yury_Solomatin Учаcтник

ШахматыЭтоДиагноз Учаcтник

zeroalphazero Учаcтник

Fruit Александр баннер

cs111g Начинающий

Fruit Александр баннер

cs111g Начинающий

hornet Учаcтник

NS Нефёдов Сергей баннер