AlphaZero. Нейронная сеть играет в шахматы

grizly · 13 дек 2017

FIBM пишет: ↑

Вы что играете на первых ходах? е4....нет нет, так нечестно, давайте заставим вас играть с4! А, что очень логично.
Нажмите, чтобы раскрыть...

Что сейчас и делается повсеместно и без всяких подобных возражений - при тестировании и составлении рейтингов, при проведении турниров, или любителями - дай-ка я протестирую на своем любимом наборе тестовых позиций на понимание, или посмотрю, как она анализирует мои партии, или дай-ка я еще раз просмотрю вариант к завтрашней партии на первенство мира.

—- добавлено: 13 дек 2017, опубликовано: 13 дек 2017 —-

Открытое письмо Google DeepMind одного из авторов Stockfish

Dear Sirs,
Please let me congratulate you on your amazing achievement in developing AlphaZero chess! As someone who completed a thesis in neural networks back in the 90's, I could not be more amazed at how far you have been able to advance the field.

I can't speak for the entire Stockfish team so I simply speak as one of its open source contributors. If you read other posts on this forum or talkchess.com however you may find that what I'm about to point out may mirror the sentiment of others in the computer chess community as well.

AlphaZero won the 100 game match against Stockfish very impressively by a total score of 28 wins and 72 draws and 0 loses. This translates to an Elo difference of 100. However the details of the match described in your paper show that this match might have been much closer and more interesting had it not been for some IMO rather unfair conditions. These might not be immediately obvious even to those using chess engines on a regular basis.

1) In the match version 8 of Stockfish was used which is now over a year old. The latest version of Stockfish is over 40 Elo stronger in fast self play.
http://tests.stockfishchess.org/tests/view/5a23e7c10ebc590ccbb8b6d8
When consulted the Stockfish team always enters the latest version into serious competition such as TCEC.

2) The 1GB amount of memory used for the hash table on a 64 core machine with 1 minute per move is sorely inadequate. Stockfish displays the % of hash used so anyone can see how quickly it fills up. An reasonable amount of memory would likely have been around 16 times more at 16GB. The reason this is especially critical with many threads is because Stockfish uses the hash as the main mechanism through which all threads communicate(aka Lazy SMP). It is almost certain that this resulted in another significant Elo reduction in Stockfish.

3) Much effort has been put into making Stockfish understand which positions are critical and which are not. Based on this Stockfish manages its clock very carefully spending significantly more time on some positions during a game and very little on others. Disabling this feature and forcing Stockfish to use its time based on your same 1 minute for every move time control results in yet another large Elo reduction.

Since the Stockfish team wasn't contacted prior to the match I believe the issues outlined above were simply a result of unfamiliarity with the Stockfish engine. With the above issues corrected the 100 Elo gap should change quite significantly. I believe you are interested in a fair match more than winning and it is therefore my hope that a second proper rematch can be played for the benefit of both scientific research as well as the chess community. I wish to thank you for the tremendous contribution you have made to computer chess with a completely novel approach and hope that Stockfish has been a useful competitor for your testing. Please don't hesitate to contact myself or the Stockfish team in the future. We are your fans.

Sincerely
Michael Stembera(Fisherman)
Нажмите, чтобы раскрыть...

Комсюк · 13 дек 2017

FIBM, я Вас дико уважаю, как учёного, но это неконструктивный подход
Альфа насчитала себе книжку, будьте добры дать и Стоку
И такая книжка есть! Он сам её сотворил тоскливыми зимними вечерами (пусть и не за 4 часа)
Там нет ни капли гениальных человеческих партий, которые веками строили теорию

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте

roman57 · 13 дек 2017

Комсюк пишет: ↑

FIBM, я Вас дико уважаю, как учёного, но это неконструктивный подход
Альфа насчитала себе книжку, будьте добры дать и Стоку
И такая книжка есть! Он сам её сотворил тоскливыми зимними вечерами (пусть и не за 4 часа)
Там нет ни капли гениальных человеческих партий, которые веками строили теорию

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте
Нажмите, чтобы раскрыть...

Картина игры А0 прояснится когда все увидят игру двух А0 между собой , а лучше турнир между десятком таких программ

Комсюк · 13 дек 2017

Картина была бы уже ясной, будь опубликованы все партии
По крайней мере, можно было судить о нынешнем уровне Альфы, посмотрев её проигранные

ШахматыЭтоДиагноз · 13 дек 2017

DIOGEN пишет: ↑

Главное в шахматах - умение далеко и точно считать. Причем быстро, в ограниченный промежуток времени. Для этого надо "видеть", чем больше, тем лучше. Это и есть "шахматные способности". Которые невозможно кардинально улучшить никакими книгами. На разряд-другой - можно, но не больше.
Нажмите, чтобы раскрыть...

На днях АльфаЗеро выиграла Стокфиш значительно уступая ему в счете, но зато превосходя в понимании. Сейчас это самая популярная тема на форуме.

Монсоро пишет: ↑

Книги поддерживают форму, книги тренируют счёт и т.д. Для того, чтобы стать мастером этого мало. Но без книг, без тренера, лишь с одним движком никогда не стать кмс. Или тренер или книги, но никак не движок. Комп не расскажет, как играть с перевесом на фланге, не объяснит висячих пешек и пр.
Нажмите, чтобы раскрыть...

Комп это в первую очередь не движок, а базы и дебютная книга. Без него сейчас не будет качественной дебютной подготовки.

DIOGEN · 13 дек 2017

ШахматыЭтоДиагноз пишет: ↑

На днях АльфаЗеро выиграла Стокфиш значительно уступая ему в счете, но зато превосходя в понимании. Сейчас это самая популярная тема на форуме.
Нажмите, чтобы раскрыть...

\АльфаЗеро выиграла Стокфиш? Ну и что нейросеть будет теперь с ним делать? Выкинет на свалку? Или продаст кому-нибудь?
Вы русский? Считаете себя образованным? Тогда почему применяете такие чудовищно безграмотные конструкции? Если это описка - искренне извиняюсь. Если Вы не native - тоже. Просто глаз режет\.
Sorry за оффтоп.
А кто сказал, что нейросеть превосходит Стокфиш в понимании? И что такое - это самое понимание - для железяки?
Смыслов как-то говорил, что с возрастом, когда ухудшились счетные способности - он хуже стал понимать позицию. То, что некоторые слабые шахматисты принимают за понимание - просто знание типовых позиций и приемов.
Для белковых понимание позиции - попытка представить и оценить возникающую через несколько ходов позицию. Человечишки после жалких 3-5 ходов вперед уже не видят ничего... Поэтому вынуждены оценивать позицию с точки зрения каких-то выдуманных ими же самими законов, (которые неверны частенько. И машина это убедительно показывает, обыгрывая людишек даже с форой. Машина - не заморачивается подобной ерундой - просто считает глубже, полностью перебирая варианты.
Вообще, мне кажется, с увеличением глубины расчета шахматных программ на высшем уровне такая вещь как "понимание", основанное на каких-то общих принципах и законах шахмат - уйдет на второй план и будет заменено глубочайшим (100 полуходов, например) расчетом.
Впрочем, на этот счет - пусть лучше выскажутся гроссы и супергроссы... Ну, или шахматные программисты.

Baron · 13 дек 2017

KEV81 пишет: ↑

Откуда столько негатива про АО?
Нажмите, чтобы раскрыть...

Вот примерное объяснение

MaxVirmir пишет:

О. А вот это вот отличная статья!
И сразу стало понятно почему порвало пуканы у "програмеров":

Шапочку из фольги в основном примеряют люди, занимающиеся шахматным программированием. Их эмоции можно понять – тысячи часов они корчевали пни и укладывали асфальт, в то время как под рукой лежал почти готовый телепорт, ведь нейросети – не какое-то сверхсекретное изобретение, а становящийся вполне стандартным метод решения ранее тупиковых проблем. Уже одно это заставляет меня с некоторым недоверием относиться к их претензиям к DeepMind.
Нажмите, чтобы раскрыть...

Undying · 13 дек 2017

NS пишет: ↑

Разница в понимании шахмат - у них ровно на 80 пунктов Эло. И тот и другой - обычные калькуляторы. Альфа это тот-же калькулятор "вид сбоку". Играет так-же за счет счета.
Нажмите, чтобы раскрыть...

Альфа Зеро считает в 1000 раз меньше позиций чем Стокфиш и при этом играет сильнее. То есть шахматы Альфа Зеро понимает по крайней мере в 1000 раз лучше, чем Стокфиш.

4547 · 13 дек 2017

DIOGEN пишет: ↑

А кто сказал, что нейросеть превосходит Стокфиш в понимании? И что такое - это самое понимание - для железяки?
Смыслов как-то говорил, что с возрастом, когда ухудшились счетные способности - он хуже стал понимать позицию. То, что некоторые слабые шахматисты принимают за понимание - просто знание типовых позиций и приемов.
Для белковых понимание позиции - попытка представить и оценить возникающую через несколько ходов позицию. Человечишки после жалких 3-5 ходов вперед уже не видят ничего... Поэтому вынуждены оценивать позицию с точки зрения каких-то выдуманных ими же самими законов, (которые неверны частенько. И машина это убедительно показывает, обыгрывая людишек даже с форой. Машина - не заморачивается подобной ерундой - просто считает глубже, полностью перебирая варианты.
Вообще, мне кажется, с увеличением глубины расчета шахматных программ на высшем уровне такая вещь как "понимание", основанное на каких-то общих принципах и законах шахмат - уйдет на второй план и будет заменено глубочайшим (100 полуходов, например) расчетом.
Нажмите, чтобы раскрыть...

Понимание - это оценка позиции с учетом дальнейших перспектив. Для белкового шахматиста полагаться исключительно на счет плохая идея.
Во-первых, велика вероятность ошибки. Особенно если это действие повторяется. Раз правильно посчитал, два посчитал, на третий ошибся..
Во-вторых, время. Подсознательное понимание намного быстрее (но больше вероятность ошибки естественно). Фактически это бессознательный расчет.
В-третьих, счет энергозатратен. Энергия ( как и время) шахматиста ограниченна во время партии. Это понимает любой игрок, участвовавший в турнирах. Игрок должен быть готов в важный момент партии посчитать варианты в сложной позиции. Но если он до этого истратил энергию и время там, где можно было быстро сыграть интуитивно, то у него не хватит ресурсов. Он ошибается и проигрывает.. После партии думает "как я мог так ошибиться?! До победы рукой было подать!". На самом деле он неправильно расходовал силы и время в партии. Это было главной ошибкой.
У движков даже с большой глубиной расчета есть "недостаток" - это заложенные человеком алгоритмы оценки позиции. Заканчивая расчет движок ориентируется на них.

DIOGEN · 13 дек 2017

4547 пишет: ↑

Понимание - это оценка позиции с учетом дальнейших перспектив.
Нажмите, чтобы раскрыть...

Компьютерное железо интенсивно развивается. Вроде как уже на 60 полуходов могут считать? (Не суть важно, через несколько лет, вполне вероятно, будут считать глубже).
Я о том, что человечишки вынуждены придумывать себе "оценку позиции". Которая является компенсацией неумения далеко и точно рассчитать вариант. У программ - не так - они перебирают все возможные варианты. По сравнению с людишками, на несколько порядков чище, точнее. В пределах 5-10 ходов - наверняка. Возможные ошибки, опять же, заложены жидкоголовыми при создании программы.
60 полуходов - это 30 ходов. 100 полуходов - это 50 ходов вперед. Столько далеко не всякая партия между белковыми шахматными дебилами (по сравнению с компами, разумеется) продолжается...
Какие шахматные законы помогут предусмотреть развитие шахматной партии на 50 ходов вперед? Зачем при такой глубине "позиционное понимание" (кроме базовых принципов, забитых изначально в алгоритм и которые никому уже не интересно отлаживать)?

4547 пишет: ↑

У движков даже с большой глубиной расчета есть "недостаток" - это заложенные человеком алгоритмы оценки позиции. Заканчивая расчет движок ориентируется на них.
Нажмите, чтобы раскрыть...

Уже сейчас это мало помогает двуногим шахматным недоразумениям играть с программами. Даже с форой проигрывают...

Комсюк · 13 дек 2017

KEV81 пишет: ↑

Откуда столько негатива про АО?
Нажмите, чтобы раскрыть...

Атомное оружие - это зло

Crest · 13 дек 2017

grizly пишет: ↑

Открытое письмо Google DeepMind одного из авторов Stockfish

Dear Sirs,
Please let me congratulate you on your amazing achievement in developing AlphaZero chess! As someone who completed a thesis in neural networks back in the 90's, I could not be more amazed at how far you have been able to advance the field.

I can't speak for the entire Stockfish team so I simply speak as one of its open source contributors. If you read other posts on this forum or talkchess.com however you may find that what I'm about to point out may mirror the sentiment of others in the computer chess community as well.

AlphaZero won the 100 game match against Stockfish very impressively by a total score of 28 wins and 72 draws and 0 loses. This translates to an Elo difference of 100. However the details of the match described in your paper show that this match might have been much closer and more interesting had it not been for some IMO rather unfair conditions. These might not be immediately obvious even to those using chess engines on a regular basis.

1) In the match version 8 of Stockfish was used which is now over a year old. The latest version of Stockfish is over 40 Elo stronger in fast self play.
http://tests.stockfishchess.org/tests/view/5a23e7c10ebc590ccbb8b6d8
When consulted the Stockfish team always enters the latest version into serious competition such as TCEC.

2) The 1GB amount of memory used for the hash table on a 64 core machine with 1 minute per move is sorely inadequate. Stockfish displays the % of hash used so anyone can see how quickly it fills up. An reasonable amount of memory would likely have been around 16 times more at 16GB. The reason this is especially critical with many threads is because Stockfish uses the hash as the main mechanism through which all threads communicate(aka Lazy SMP). It is almost certain that this resulted in another significant Elo reduction in Stockfish.

3) Much effort has been put into making Stockfish understand which positions are critical and which are not. Based on this Stockfish manages its clock very carefully spending significantly more time on some positions during a game and very little on others. Disabling this feature and forcing Stockfish to use its time based on your same 1 minute for every move time control results in yet another large Elo reduction.

Since the Stockfish team wasn't contacted prior to the match I believe the issues outlined above were simply a result of unfamiliarity with the Stockfish engine. With the above issues corrected the 100 Elo gap should change quite significantly. I believe you are interested in a fair match more than winning and it is therefore my hope that a second proper rematch can be played for the benefit of both scientific research as well as the chess community. I wish to thank you for the tremendous contribution you have made to computer chess with a completely novel approach and hope that Stockfish has been a useful competitor for your testing. Please don't hesitate to contact myself or the Stockfish team in the future. We are your fans.

Sincerely
Michael Stembera(Fisherman)
Нажмите, чтобы раскрыть...

Нажмите, чтобы раскрыть...

А можно глянуть, перевод, братцы?

Undying · 13 дек 2017

KEV81 пишет: ↑

Тут нельзя бросаться цифрами и путать теплое с мягким.
Нажмите, чтобы раскрыть...

Этим вы и занимаетесь, смешивая столь разные понятия как понимание и счет.

Комсюк · 13 дек 2017

Crest пишет: ↑

А можно глянуть, перевод, братцы?
Нажмите, чтобы раскрыть...

1. старая версия Стока
2. маленький хэш
3. контроль времени лажовый

с уважением, Рыбак (от себя лично, а не от команды разработчиков)

З.Ы. последняя строка тоже перевод

NS · 13 дек 2017

Undying пишет: ↑

Альфа Зеро считает в 1000 раз меньше позиций чем Стокфиш и при этом играет сильнее. То есть шахматы Альфа Зеро понимает по крайней мере в 1000 раз лучше, чем Стокфиш.
Нажмите, чтобы раскрыть...

Очень похоже на лозунг.
Вот вам простой пример. Есть два движка. Играют в одну силу. Один из них рассматривает в 1000 раз меньше узлов в секунду.
Вы утверждаете что он лучше понимает шахматы, но играет то он при это не сильнее, значит понимает он лучше, а что-то другое у него "хуже"? Что?
Тактика? Есть тактические тесты, и что-то никогда особо слабее в тактике медленные движки не были. То есть вопрос остается открытым - если у медленных движков лучше понимание, то что у них "хуже", раз играют они не сильнее?
А ничего у них нет "хуже" в компенсацию "понимания". Нет ни малейшей разницы в "понимании" шахмат у быстрых и медленных движков. Разницу в "понимании" показывает только разницы в силе игры. Все остальное предрассудки.

Счет в матче вроде был 61/39, разница в силе 80 пунктов.

Комсюк · 13 дек 2017

NS пишет: ↑

разница в силе 80 пунктов.
Нажмите, чтобы раскрыть...

в матче без книжек 98 Эло

—- добавлено: 13 дек 2017 —-

80 по общему зачёту

nn · 13 дек 2017

Ананд об AlphaZero

Комсюк · 13 дек 2017

KEV81 пишет: ↑

Вкратце, то же что и тут. Мощности не те, версия не та, хэш не тот, книг нет..
Нажмите, чтобы раскрыть...

про мощности и книги нету

—- добавлено: 13 дек 2017 —-

Не хотят уж совсем принижать богиню

Undying · 13 дек 2017

NS пишет: ↑

Вот вам простой пример. Есть два движка. Играют в одну силу. Один из них рассматривает в 1000 раз меньше узлов в секунду.
Вы утверждаете что он лучше понимает шахматы, но играет то он при это не сильнее, значит понимает он лучше, а что-то другое у него "хуже"? Что?
Нажмите, чтобы раскрыть...

Давайте такой пример рассмотрим. Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?

Комсюк · 13 дек 2017

Undying пишет: ↑

Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?
Нажмите, чтобы раскрыть...

этот трюк уже исполнял Васик Райлих, занижая показания приборов
Рыбка, якобы, лучше понимала...

Белковых гроссов можно не беспокоить

nn · 13 дек 2017

Комсюк пишет: ↑

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте
Нажмите, чтобы раскрыть...

Здесь вопрос в том, что конкретно утверждает DeepMind.
Если что AlphaZero играет сильнее людей и всего, что было создано до AlphaZero, то тогда Stockfish должна играть и с дебютной книгой и с эндшпильными базами.
Если же их утверждение, что алгоритм использованный ими лучше альфа-беты, то проверять на двух-ходовой книге нормально.

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.

Комсюк · 13 дек 2017

nn пишет: ↑

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.
Нажмите, чтобы раскрыть...

Ждём развёрнутое высказывание грека

NS · 13 дек 2017

Undying пишет: ↑

Давайте такой пример рассмотрим. Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?
Нажмите, чтобы раскрыть...

За счет того что гроссмейстер совершает больше ошибок, проигрывает в "мелкой тактике". И это легко показать на конкретных примерах из конкретных партий. Это не потому что у них разница в скорости просмотра позиций, а потому что "вот так устроены движки".

Теперь вы утверждаете что разница в понимании между Альфой и Стоком больше, чем разница в показанном результате. За счет того что Стокфиш лучше считает. В каких партиях он это продемонстрировал? Покажите пример партий, из которых видно что Стокфиш сильнее в счете. Или Стокфиш не сильнее в счете, и все-таки разница в понимании равна разнице в силе?

ШахматыЭтоДиагноз · 13 дек 2017

NS пишет: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Нажмите, чтобы раскрыть...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.

Комсюк · 13 дек 2017

KEV81 пишет: ↑

Если блондин играет лучше в шахматы, то никакие книги брюнету не помогут.
Нажмите, чтобы раскрыть...

показательная партия из той же ссылки

Белые начинают партию на 17-ом ходу с оценкой +1.96

—- добавлено: 13 дек 2017 —-

движок Стокфиш, это название книг

NS · 13 дек 2017

ШахматыЭтоДиагноз пишет: ↑

NS пишет: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Нажмите, чтобы раскрыть...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.
Нажмите, чтобы раскрыть...

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.

добавлено
Криво сформулировал. Если в позиции есть выигрывающая или проигрывающая тактика, то нейросеть скорректирует на неё оценку.

WinPooh · 13 дек 2017

NS пишет: ↑

ШахматыЭтоДиагноз пишет: ↑

NS пишет: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Нажмите, чтобы раскрыть...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.
Нажмите, чтобы раскрыть...

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Нажмите, чтобы раскрыть...

Нейросеть может помнить многие тысячи типовых тактических паттернов. Вроде спертого мата конем и ферзем, жертвы слона на h7 и т.д. Всё вместе это складывается в эффективное видение короткой тактики.

Мобуту · 13 дек 2017

Vladruss пишет: ↑

Завел сейчас матч по минутке между моим июньским Стокфишем и МакБрейном (это клон Стока, но играет примерно в одну с ним силу). Кому-то из них дал книгу, что Комсюк выкладывал. Кому дал, уже сам не помню, да это и неважно. После одиннадцати партий 11 ничьих. И думаю, что финальный результат не будет сильно отличаться. Думаю, что влияние дебютной книги сильно преувеличено.
Да, забыл: 100 партий. Немного, конечно, но посмотрим что получится.
Нажмите, чтобы раскрыть...

Это совсем не то. АльфаЗеро не варьировала ведь варианты, а прицельно била в одну и ту же слабую точку. Например, раз за разом выходила на французскую с 3. Nc3 Nf6 4. e5 Nfd7. Попробуйте, устройте матч двух примерно равноценных сильных движков, например Стокфиша и Гудини, где все партии начинаются с этой позиции. Дальше смотрим на результат и определяем, сколько пунктов к рейтингу белых приплюсовывает такой выбор дебюта.

Комсюк · 13 дек 2017

Комсюк пишет: ↑

mcts, несмотря на свою "странность", тактику видит. даже не смотря на доску
Нажмите, чтобы раскрыть...

эх, не знаю я умных слов

WinPooh пишет: ↑

Нейросеть может помнить многие тысячи типовых тактических паттернов. Вроде спертого мата конем и ферзем, жертвы слона на h7 и т.д. Всё вместе это складывается в эффективное видение короткой тактики.
Нажмите, чтобы раскрыть...

развёрнутые тезисы

Комсюк · 13 дек 2017

KEV81, ты вроде умеешь потоньше троллить...
По партии скажешь что-нить, програмёр хренов?

ШахматыЭтоДиагноз · 13 дек 2017

NS пишет: ↑

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Нажмите, чтобы раскрыть...

Каким образом он ее видит? Я так понимаю, что mcts видит не тактику, а вероятность. Это примерно то же самое, как если бы мы сами играя с движком имели под рукой дебютную книгу. Пока идем по варианту - у нас есть гарантия что мы не проиграем партию и не зевнем материала. Но когда он закончится то, чтобы таким же способом играть дальше, требуется просчитать квадратно-гнездовым методом и до самого мата такое количество позиций сколько нет нейронов во всей А0.

NS · 13 дек 2017

ШахматыЭтоДиагноз пишет: ↑

NS пишет: ↑

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Нажмите, чтобы раскрыть...

Каким образом он ее видит? Я так понимаю, что mcts видит не тактику, а вероятность. Это примерно то же самое, как если бы мы сами играя с движком имели под рукой дебютную книгу. Пока идем по варианту - у нас есть гарантия что мы не проиграем партию и не зевнем материала. Но когда он закончится то, чтобы таким же способом играть дальше, требуется просчитать квадратно-гнездовым методом и до самого мата такое количество позиций сколько нет нейронов во всей А0.
Нажмите, чтобы раскрыть...

mcts наигрывает партии до конца, при этом ходы делаются не случайным образом, а согласно собранной статистике и ОФ. Если вдруг в позиции выигрывается материал, то ход, выигрывающий материал будет практически всегда выигрывать, соответственно наберет хорошую статистику, и будет всегда делаться из этой позиции.
Программы на mcts (например в ГО, Symple), даже совсем без ОФ (UCT + RAVE + остальные чисто переборные эвристики) - видят тактику. А с ОФ видят её не хуже чем программы на альфа-бете.

Мобуту · 13 дек 2017

KEV81 пишет: ↑

Каспаров тоже вроде орал после поражения, что мол специально под него комп заточили, что у него книги дебютной не было... и т. д.

Сейчас вроде успокоился...
Нажмите, чтобы раскрыть...

Каспаров говорил о человечьих подсказках проге. Смысл был в том, что он вместо своих фирменных острых сицилианок стал играть в том матче скучную антикомпьютерную восьмипешечную игру. Расчёт был на то, что Deep Blue, как и все проги того времени, начнёт там тупить. И вдруг Deep Blue бодро начал выдавать крепкие гроссмейстерские планы в тех позах. Возникли подозрения в человеческих подсказках, но проконтролировать было невозможно: матч проходил на вражьей территории при тотальном контроле IBM. А в ответ на предложение проверить после матча, в самом ли деле Deep Blue исполнит сделанные ею ходы в условиях внешнего контроля, было отвергнуто IBM, которая быстренько уничтожила Deep Blue как главную улику.

Neo94 · 13 дек 2017

nn пишет: ↑

Здесь вопрос в том, что конкретно утверждает DeepMind.
Если что AlphaZero играет сильнее людей и всего, что было создано до AlphaZero, то тогда Stockfish должна играть и с дебютной книгой и с эндшпильными базами.
Если же их утверждение, что алгоритм использованный ими лучше альфа-беты, то проверять на двух-ходовой книге нормально.

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.
Нажмите, чтобы раскрыть...

По-моему совершенно очевидно, что дипмайнд высказывал именно второе про алгоритс. Если они хотели бы утверждать первое - это был бы громкий матч с вызовом, рекламой, и прочими атрибутами.
А не скромная аж ОДНА статья в научном хранилище, которое предназначено для специалистов по компьютерному обучению, а не для широкой публики (и глава дипмайнд сам удивляется шумихе)

NS · 13 дек 2017

Честно говоря ИМХО нет смысла спорить про силу, так как mcts и нейронные сети спокойно масштабируются, ну и понятно что и алгоритмически есть куда A0 развивать. Если первая попытка в шахматы играет сравнимо со Стоком - то скоро будет играть несравнимо сильнее.
У AlphaGo Zero рейтинг 5185.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

grizly Учаcтник

Комсюк народный модератор баннер

roman57 Учаcтник

Комсюк народный модератор баннер

ШахматыЭтоДиагноз Учаcтник

DIOGEN Учаcтник

Baron Учаcтник

Undying Учаcтник

4547 Учаcтник

DIOGEN Учаcтник

Комсюк народный модератор баннер

Crest Админ, МГ Команда форума Команда форума

Undying Учаcтник

Комсюк народный модератор баннер

NS Нефёдов Сергей баннер

Комсюк народный модератор баннер

nn Заблокирован

Комсюк народный модератор баннер

Undying Учаcтник

Комсюк народный модератор баннер

nn Заблокирован

Комсюк народный модератор баннер

NS Нефёдов Сергей баннер

ШахматыЭтоДиагноз Учаcтник

Комсюк народный модератор баннер

NS Нефёдов Сергей баннер

WinPooh В.М. Команда форума

Мобуту спаситель нации баннер

Комсюк народный модератор баннер

Комсюк народный модератор баннер

ШахматыЭтоДиагноз Учаcтник

NS Нефёдов Сергей баннер

Мобуту спаситель нации баннер

Neo94 Учаcтник

NS Нефёдов Сергей баннер