AlphaZero. Нейронная сеть играет в шахматы

grizly · 13 Dec 2017

FIBM said: ↑

Вы что играете на первых ходах? е4....нет нет, так нечестно, давайте заставим вас играть с4! А, что очень логично.
Click to expand...

Что сейчас и делается повсеместно и без всяких подобных возражений - при тестировании и составлении рейтингов, при проведении турниров, или любителями - дай-ка я протестирую на своем любимом наборе тестовых позиций на понимание, или посмотрю, как она анализирует мои партии, или дай-ка я еще раз просмотрю вариант к завтрашней партии на первенство мира.

—- добавлено: 13 Dec 2017, опубликовано: 13 Dec 2017 —-

Открытое письмо Google DeepMind одного из авторов Stockfish

Dear Sirs,
Please let me congratulate you on your amazing achievement in developing AlphaZero chess! As someone who completed a thesis in neural networks back in the 90's, I could not be more amazed at how far you have been able to advance the field.

I can't speak for the entire Stockfish team so I simply speak as one of its open source contributors. If you read other posts on this forum or talkchess.com however you may find that what I'm about to point out may mirror the sentiment of others in the computer chess community as well.

AlphaZero won the 100 game match against Stockfish very impressively by a total score of 28 wins and 72 draws and 0 loses. This translates to an Elo difference of 100. However the details of the match described in your paper show that this match might have been much closer and more interesting had it not been for some IMO rather unfair conditions. These might not be immediately obvious even to those using chess engines on a regular basis.

1) In the match version 8 of Stockfish was used which is now over a year old. The latest version of Stockfish is over 40 Elo stronger in fast self play.
http://tests.stockfishchess.org/tests/view/5a23e7c10ebc590ccbb8b6d8
When consulted the Stockfish team always enters the latest version into serious competition such as TCEC.

2) The 1GB amount of memory used for the hash table on a 64 core machine with 1 minute per move is sorely inadequate. Stockfish displays the % of hash used so anyone can see how quickly it fills up. An reasonable amount of memory would likely have been around 16 times more at 16GB. The reason this is especially critical with many threads is because Stockfish uses the hash as the main mechanism through which all threads communicate(aka Lazy SMP). It is almost certain that this resulted in another significant Elo reduction in Stockfish.

3) Much effort has been put into making Stockfish understand which positions are critical and which are not. Based on this Stockfish manages its clock very carefully spending significantly more time on some positions during a game and very little on others. Disabling this feature and forcing Stockfish to use its time based on your same 1 minute for every move time control results in yet another large Elo reduction.

Since the Stockfish team wasn't contacted prior to the match I believe the issues outlined above were simply a result of unfamiliarity with the Stockfish engine. With the above issues corrected the 100 Elo gap should change quite significantly. I believe you are interested in a fair match more than winning and it is therefore my hope that a second proper rematch can be played for the benefit of both scientific research as well as the chess community. I wish to thank you for the tremendous contribution you have made to computer chess with a completely novel approach and hope that Stockfish has been a useful competitor for your testing. Please don't hesitate to contact myself or the Stockfish team in the future. We are your fans.

Sincerely
Michael Stembera(Fisherman)
Click to expand...

Комсюк · 13 Dec 2017

FIBM, я Вас дико уважаю, как учёного, но это неконструктивный подход
Альфа насчитала себе книжку, будьте добры дать и Стоку
И такая книжка есть! Он сам её сотворил тоскливыми зимними вечерами (пусть и не за 4 часа)
Там нет ни капли гениальных человеческих партий, которые веками строили теорию

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте

roman57 · 13 Dec 2017

Комсюк said: ↑

FIBM, я Вас дико уважаю, как учёного, но это неконструктивный подход
Альфа насчитала себе книжку, будьте добры дать и Стоку
И такая книжка есть! Он сам её сотворил тоскливыми зимними вечерами (пусть и не за 4 часа)
Там нет ни капли гениальных человеческих партий, которые веками строили теорию

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте
Click to expand...

Картина игры А0 прояснится когда все увидят игру двух А0 между собой , а лучше турнир между десятком таких программ

Комсюк · 13 Dec 2017

Картина была бы уже ясной, будь опубликованы все партии
По крайней мере, можно было судить о нынешнем уровне Альфы, посмотрев её проигранные

ШахматыЭтоДиагноз · 13 Dec 2017

DIOGEN said: ↑

Главное в шахматах - умение далеко и точно считать. Причем быстро, в ограниченный промежуток времени. Для этого надо "видеть", чем больше, тем лучше. Это и есть "шахматные способности". Которые невозможно кардинально улучшить никакими книгами. На разряд-другой - можно, но не больше.
Click to expand...

На днях АльфаЗеро выиграла Стокфиш значительно уступая ему в счете, но зато превосходя в понимании. Сейчас это самая популярная тема на форуме.

Монсоро said: ↑

Книги поддерживают форму, книги тренируют счёт и т.д. Для того, чтобы стать мастером этого мало. Но без книг, без тренера, лишь с одним движком никогда не стать кмс. Или тренер или книги, но никак не движок. Комп не расскажет, как играть с перевесом на фланге, не объяснит висячих пешек и пр.
Click to expand...

Комп это в первую очередь не движок, а базы и дебютная книга. Без него сейчас не будет качественной дебютной подготовки.

DIOGEN · 13 Dec 2017

ШахматыЭтоДиагноз said: ↑

На днях АльфаЗеро выиграла Стокфиш значительно уступая ему в счете, но зато превосходя в понимании. Сейчас это самая популярная тема на форуме.
Click to expand...

\АльфаЗеро выиграла Стокфиш? Ну и что нейросеть будет теперь с ним делать? Выкинет на свалку? Или продаст кому-нибудь?
Вы русский? Считаете себя образованным? Тогда почему применяете такие чудовищно безграмотные конструкции? Если это описка - искренне извиняюсь. Если Вы не native - тоже. Просто глаз режет\.
Sorry за оффтоп.
А кто сказал, что нейросеть превосходит Стокфиш в понимании? И что такое - это самое понимание - для железяки?
Смыслов как-то говорил, что с возрастом, когда ухудшились счетные способности - он хуже стал понимать позицию. То, что некоторые слабые шахматисты принимают за понимание - просто знание типовых позиций и приемов.
Для белковых понимание позиции - попытка представить и оценить возникающую через несколько ходов позицию. Человечишки после жалких 3-5 ходов вперед уже не видят ничего... Поэтому вынуждены оценивать позицию с точки зрения каких-то выдуманных ими же самими законов, (которые неверны частенько. И машина это убедительно показывает, обыгрывая людишек даже с форой. Машина - не заморачивается подобной ерундой - просто считает глубже, полностью перебирая варианты.
Вообще, мне кажется, с увеличением глубины расчета шахматных программ на высшем уровне такая вещь как "понимание", основанное на каких-то общих принципах и законах шахмат - уйдет на второй план и будет заменено глубочайшим (100 полуходов, например) расчетом.
Впрочем, на этот счет - пусть лучше выскажутся гроссы и супергроссы... Ну, или шахматные программисты.

Baron · 13 Dec 2017

KEV81 said: ↑

Откуда столько негатива про АО?
Click to expand...

Вот примерное объяснение

MaxVirmir said:

О. А вот это вот отличная статья!
И сразу стало понятно почему порвало пуканы у "програмеров":

Шапочку из фольги в основном примеряют люди, занимающиеся шахматным программированием. Их эмоции можно понять – тысячи часов они корчевали пни и укладывали асфальт, в то время как под рукой лежал почти готовый телепорт, ведь нейросети – не какое-то сверхсекретное изобретение, а становящийся вполне стандартным метод решения ранее тупиковых проблем. Уже одно это заставляет меня с некоторым недоверием относиться к их претензиям к DeepMind.
Click to expand...

Undying · 13 Dec 2017

NS said: ↑

Разница в понимании шахмат - у них ровно на 80 пунктов Эло. И тот и другой - обычные калькуляторы. Альфа это тот-же калькулятор "вид сбоку". Играет так-же за счет счета.
Click to expand...

Альфа Зеро считает в 1000 раз меньше позиций чем Стокфиш и при этом играет сильнее. То есть шахматы Альфа Зеро понимает по крайней мере в 1000 раз лучше, чем Стокфиш.

4547 · 13 Dec 2017

DIOGEN said: ↑

А кто сказал, что нейросеть превосходит Стокфиш в понимании? И что такое - это самое понимание - для железяки?
Смыслов как-то говорил, что с возрастом, когда ухудшились счетные способности - он хуже стал понимать позицию. То, что некоторые слабые шахматисты принимают за понимание - просто знание типовых позиций и приемов.
Для белковых понимание позиции - попытка представить и оценить возникающую через несколько ходов позицию. Человечишки после жалких 3-5 ходов вперед уже не видят ничего... Поэтому вынуждены оценивать позицию с точки зрения каких-то выдуманных ими же самими законов, (которые неверны частенько. И машина это убедительно показывает, обыгрывая людишек даже с форой. Машина - не заморачивается подобной ерундой - просто считает глубже, полностью перебирая варианты.
Вообще, мне кажется, с увеличением глубины расчета шахматных программ на высшем уровне такая вещь как "понимание", основанное на каких-то общих принципах и законах шахмат - уйдет на второй план и будет заменено глубочайшим (100 полуходов, например) расчетом.
Click to expand...

Понимание - это оценка позиции с учетом дальнейших перспектив. Для белкового шахматиста полагаться исключительно на счет плохая идея.
Во-первых, велика вероятность ошибки. Особенно если это действие повторяется. Раз правильно посчитал, два посчитал, на третий ошибся..
Во-вторых, время. Подсознательное понимание намного быстрее (но больше вероятность ошибки естественно). Фактически это бессознательный расчет.
В-третьих, счет энергозатратен. Энергия ( как и время) шахматиста ограниченна во время партии. Это понимает любой игрок, участвовавший в турнирах. Игрок должен быть готов в важный момент партии посчитать варианты в сложной позиции. Но если он до этого истратил энергию и время там, где можно было быстро сыграть интуитивно, то у него не хватит ресурсов. Он ошибается и проигрывает.. После партии думает "как я мог так ошибиться?! До победы рукой было подать!". На самом деле он неправильно расходовал силы и время в партии. Это было главной ошибкой.
У движков даже с большой глубиной расчета есть "недостаток" - это заложенные человеком алгоритмы оценки позиции. Заканчивая расчет движок ориентируется на них.

DIOGEN · 13 Dec 2017

4547 said: ↑

Понимание - это оценка позиции с учетом дальнейших перспектив.
Click to expand...

Компьютерное железо интенсивно развивается. Вроде как уже на 60 полуходов могут считать? (Не суть важно, через несколько лет, вполне вероятно, будут считать глубже).
Я о том, что человечишки вынуждены придумывать себе "оценку позиции". Которая является компенсацией неумения далеко и точно рассчитать вариант. У программ - не так - они перебирают все возможные варианты. По сравнению с людишками, на несколько порядков чище, точнее. В пределах 5-10 ходов - наверняка. Возможные ошибки, опять же, заложены жидкоголовыми при создании программы.
60 полуходов - это 30 ходов. 100 полуходов - это 50 ходов вперед. Столько далеко не всякая партия между белковыми шахматными дебилами (по сравнению с компами, разумеется) продолжается...
Какие шахматные законы помогут предусмотреть развитие шахматной партии на 50 ходов вперед? Зачем при такой глубине "позиционное понимание" (кроме базовых принципов, забитых изначально в алгоритм и которые никому уже не интересно отлаживать)?

4547 said: ↑

У движков даже с большой глубиной расчета есть "недостаток" - это заложенные человеком алгоритмы оценки позиции. Заканчивая расчет движок ориентируется на них.
Click to expand...

Уже сейчас это мало помогает двуногим шахматным недоразумениям играть с программами. Даже с форой проигрывают...

Комсюк · 13 Dec 2017

KEV81 said: ↑

Откуда столько негатива про АО?
Click to expand...

Атомное оружие - это зло

Crest · 13 Dec 2017

grizly said: ↑

Открытое письмо Google DeepMind одного из авторов Stockfish

Dear Sirs,
Please let me congratulate you on your amazing achievement in developing AlphaZero chess! As someone who completed a thesis in neural networks back in the 90's, I could not be more amazed at how far you have been able to advance the field.

I can't speak for the entire Stockfish team so I simply speak as one of its open source contributors. If you read other posts on this forum or talkchess.com however you may find that what I'm about to point out may mirror the sentiment of others in the computer chess community as well.

AlphaZero won the 100 game match against Stockfish very impressively by a total score of 28 wins and 72 draws and 0 loses. This translates to an Elo difference of 100. However the details of the match described in your paper show that this match might have been much closer and more interesting had it not been for some IMO rather unfair conditions. These might not be immediately obvious even to those using chess engines on a regular basis.

1) In the match version 8 of Stockfish was used which is now over a year old. The latest version of Stockfish is over 40 Elo stronger in fast self play.
http://tests.stockfishchess.org/tests/view/5a23e7c10ebc590ccbb8b6d8
When consulted the Stockfish team always enters the latest version into serious competition such as TCEC.

2) The 1GB amount of memory used for the hash table on a 64 core machine with 1 minute per move is sorely inadequate. Stockfish displays the % of hash used so anyone can see how quickly it fills up. An reasonable amount of memory would likely have been around 16 times more at 16GB. The reason this is especially critical with many threads is because Stockfish uses the hash as the main mechanism through which all threads communicate(aka Lazy SMP). It is almost certain that this resulted in another significant Elo reduction in Stockfish.

3) Much effort has been put into making Stockfish understand which positions are critical and which are not. Based on this Stockfish manages its clock very carefully spending significantly more time on some positions during a game and very little on others. Disabling this feature and forcing Stockfish to use its time based on your same 1 minute for every move time control results in yet another large Elo reduction.

Since the Stockfish team wasn't contacted prior to the match I believe the issues outlined above were simply a result of unfamiliarity with the Stockfish engine. With the above issues corrected the 100 Elo gap should change quite significantly. I believe you are interested in a fair match more than winning and it is therefore my hope that a second proper rematch can be played for the benefit of both scientific research as well as the chess community. I wish to thank you for the tremendous contribution you have made to computer chess with a completely novel approach and hope that Stockfish has been a useful competitor for your testing. Please don't hesitate to contact myself or the Stockfish team in the future. We are your fans.

Sincerely
Michael Stembera(Fisherman)
Click to expand...

Click to expand...

А можно глянуть, перевод, братцы?

Undying · 13 Dec 2017

KEV81 said: ↑

Тут нельзя бросаться цифрами и путать теплое с мягким.
Click to expand...

Этим вы и занимаетесь, смешивая столь разные понятия как понимание и счет.

Комсюк · 13 Dec 2017

Crest said: ↑

А можно глянуть, перевод, братцы?
Click to expand...

1. старая версия Стока
2. маленький хэш
3. контроль времени лажовый

с уважением, Рыбак (от себя лично, а не от команды разработчиков)

З.Ы. последняя строка тоже перевод

NS · 13 Dec 2017

Undying said: ↑

Альфа Зеро считает в 1000 раз меньше позиций чем Стокфиш и при этом играет сильнее. То есть шахматы Альфа Зеро понимает по крайней мере в 1000 раз лучше, чем Стокфиш.
Click to expand...

Очень похоже на лозунг.
Вот вам простой пример. Есть два движка. Играют в одну силу. Один из них рассматривает в 1000 раз меньше узлов в секунду.
Вы утверждаете что он лучше понимает шахматы, но играет то он при это не сильнее, значит понимает он лучше, а что-то другое у него "хуже"? Что?
Тактика? Есть тактические тесты, и что-то никогда особо слабее в тактике медленные движки не были. То есть вопрос остается открытым - если у медленных движков лучше понимание, то что у них "хуже", раз играют они не сильнее?
А ничего у них нет "хуже" в компенсацию "понимания". Нет ни малейшей разницы в "понимании" шахмат у быстрых и медленных движков. Разницу в "понимании" показывает только разницы в силе игры. Все остальное предрассудки.

Счет в матче вроде был 61/39, разница в силе 80 пунктов.

Комсюк · 13 Dec 2017

NS said: ↑

разница в силе 80 пунктов.
Click to expand...

в матче без книжек 98 Эло

—- добавлено: 13 Dec 2017 —-

80 по общему зачёту

nn · 13 Dec 2017

Ананд об AlphaZero

Комсюк · 13 Dec 2017

KEV81 said: ↑

Вкратце, то же что и тут. Мощности не те, версия не та, хэш не тот, книг нет..
Click to expand...

про мощности и книги нету

—- добавлено: 13 Dec 2017 —-

Не хотят уж совсем принижать богиню

Undying · 13 Dec 2017

NS said: ↑

Вот вам простой пример. Есть два движка. Играют в одну силу. Один из них рассматривает в 1000 раз меньше узлов в секунду.
Вы утверждаете что он лучше понимает шахматы, но играет то он при это не сильнее, значит понимает он лучше, а что-то другое у него "хуже"? Что?
Click to expand...

Давайте такой пример рассмотрим. Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?

Комсюк · 13 Dec 2017

Undying said: ↑

Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?
Click to expand...

этот трюк уже исполнял Васик Райлих, занижая показания приборов
Рыбка, якобы, лучше понимала...

Белковых гроссов можно не беспокоить

nn · 13 Dec 2017

Комсюк said: ↑

nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте
Click to expand...

Здесь вопрос в том, что конкретно утверждает DeepMind.
Если что AlphaZero играет сильнее людей и всего, что было создано до AlphaZero, то тогда Stockfish должна играть и с дебютной книгой и с эндшпильными базами.
Если же их утверждение, что алгоритм использованный ими лучше альфа-беты, то проверять на двух-ходовой книге нормально.

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.

Комсюк · 13 Dec 2017

nn said: ↑

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.
Click to expand...

Ждём развёрнутое высказывание грека

NS · 13 Dec 2017

Undying said: ↑

Давайте такой пример рассмотрим. Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?
Click to expand...

За счет того что гроссмейстер совершает больше ошибок, проигрывает в "мелкой тактике". И это легко показать на конкретных примерах из конкретных партий. Это не потому что у них разница в скорости просмотра позиций, а потому что "вот так устроены движки".

Теперь вы утверждаете что разница в понимании между Альфой и Стоком больше, чем разница в показанном результате. За счет того что Стокфиш лучше считает. В каких партиях он это продемонстрировал? Покажите пример партий, из которых видно что Стокфиш сильнее в счете. Или Стокфиш не сильнее в счете, и все-таки разница в понимании равна разнице в силе?

ШахматыЭтоДиагноз · 13 Dec 2017

NS said: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Click to expand...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.

Комсюк · 13 Dec 2017

KEV81 said: ↑

Если блондин играет лучше в шахматы, то никакие книги брюнету не помогут.
Click to expand...

показательная партия из той же ссылки

Белые начинают партию на 17-ом ходу с оценкой +1.96

—- добавлено: 13 Dec 2017 —-

движок Стокфиш, это название книг

NS · 13 Dec 2017

ШахматыЭтоДиагноз said: ↑

NS said: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Click to expand...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.
Click to expand...

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.

добавлено
Криво сформулировал. Если в позиции есть выигрывающая или проигрывающая тактика, то нейросеть скорректирует на неё оценку.

WinPooh · 13 Dec 2017

NS said: ↑

ШахматыЭтоДиагноз said: ↑

NS said: ↑

Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
Click to expand...

А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.
Click to expand...

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Click to expand...

Нейросеть может помнить многие тысячи типовых тактических паттернов. Вроде спертого мата конем и ферзем, жертвы слона на h7 и т.д. Всё вместе это складывается в эффективное видение короткой тактики.

Мобуту · 13 Dec 2017

Vladruss said: ↑

Завел сейчас матч по минутке между моим июньским Стокфишем и МакБрейном (это клон Стока, но играет примерно в одну с ним силу). Кому-то из них дал книгу, что Комсюк выкладывал. Кому дал, уже сам не помню, да это и неважно. После одиннадцати партий 11 ничьих. И думаю, что финальный результат не будет сильно отличаться. Думаю, что влияние дебютной книги сильно преувеличено.
Да, забыл: 100 партий. Немного, конечно, но посмотрим что получится.
Click to expand...

Это совсем не то. АльфаЗеро не варьировала ведь варианты, а прицельно била в одну и ту же слабую точку. Например, раз за разом выходила на французскую с 3. Nc3 Nf6 4. e5 Nfd7. Попробуйте, устройте матч двух примерно равноценных сильных движков, например Стокфиша и Гудини, где все партии начинаются с этой позиции. Дальше смотрим на результат и определяем, сколько пунктов к рейтингу белых приплюсовывает такой выбор дебюта.

Комсюк · 13 Dec 2017

Комсюк said: ↑

mcts, несмотря на свою "странность", тактику видит. даже не смотря на доску
Click to expand...

эх, не знаю я умных слов

WinPooh said: ↑

Нейросеть может помнить многие тысячи типовых тактических паттернов. Вроде спертого мата конем и ферзем, жертвы слона на h7 и т.д. Всё вместе это складывается в эффективное видение короткой тактики.
Click to expand...

развёрнутые тезисы

Комсюк · 13 Dec 2017

KEV81, ты вроде умеешь потоньше троллить...
По партии скажешь что-нить, програмёр хренов?

ШахматыЭтоДиагноз · 13 Dec 2017

NS said: ↑

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Click to expand...

Каким образом он ее видит? Я так понимаю, что mcts видит не тактику, а вероятность. Это примерно то же самое, как если бы мы сами играя с движком имели под рукой дебютную книгу. Пока идем по варианту - у нас есть гарантия что мы не проиграем партию и не зевнем материала. Но когда он закончится то, чтобы таким же способом играть дальше, требуется просчитать квадратно-гнездовым методом и до самого мата такое количество позиций сколько нет нейронов во всей А0.

NS · 13 Dec 2017

ШахматыЭтоДиагноз said: ↑

NS said: ↑

1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.
Click to expand...

Каким образом он ее видит? Я так понимаю, что mcts видит не тактику, а вероятность. Это примерно то же самое, как если бы мы сами играя с движком имели под рукой дебютную книгу. Пока идем по варианту - у нас есть гарантия что мы не проиграем партию и не зевнем материала. Но когда он закончится то, чтобы таким же способом играть дальше, требуется просчитать квадратно-гнездовым методом и до самого мата такое количество позиций сколько нет нейронов во всей А0.
Click to expand...

mcts наигрывает партии до конца, при этом ходы делаются не случайным образом, а согласно собранной статистике и ОФ. Если вдруг в позиции выигрывается материал, то ход, выигрывающий материал будет практически всегда выигрывать, соответственно наберет хорошую статистику, и будет всегда делаться из этой позиции.
Программы на mcts (например в ГО, Symple), даже совсем без ОФ (UCT + RAVE + остальные чисто переборные эвристики) - видят тактику. А с ОФ видят её не хуже чем программы на альфа-бете.

Мобуту · 13 Dec 2017

KEV81 said: ↑

Каспаров тоже вроде орал после поражения, что мол специально под него комп заточили, что у него книги дебютной не было... и т. д.

Сейчас вроде успокоился...
Click to expand...

Каспаров говорил о человечьих подсказках проге. Смысл был в том, что он вместо своих фирменных острых сицилианок стал играть в том матче скучную антикомпьютерную восьмипешечную игру. Расчёт был на то, что Deep Blue, как и все проги того времени, начнёт там тупить. И вдруг Deep Blue бодро начал выдавать крепкие гроссмейстерские планы в тех позах. Возникли подозрения в человеческих подсказках, но проконтролировать было невозможно: матч проходил на вражьей территории при тотальном контроле IBM. А в ответ на предложение проверить после матча, в самом ли деле Deep Blue исполнит сделанные ею ходы в условиях внешнего контроля, было отвергнуто IBM, которая быстренько уничтожила Deep Blue как главную улику.

Neo94 · 13 Dec 2017

nn said: ↑

Здесь вопрос в том, что конкретно утверждает DeepMind.
Если что AlphaZero играет сильнее людей и всего, что было создано до AlphaZero, то тогда Stockfish должна играть и с дебютной книгой и с эндшпильными базами.
Если же их утверждение, что алгоритм использованный ими лучше альфа-беты, то проверять на двух-ходовой книге нормально.

Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.
Click to expand...

По-моему совершенно очевидно, что дипмайнд высказывал именно второе про алгоритс. Если они хотели бы утверждать первое - это был бы громкий матч с вызовом, рекламой, и прочими атрибутами.
А не скромная аж ОДНА статья в научном хранилище, которое предназначено для специалистов по компьютерному обучению, а не для широкой публики (и глава дипмайнд сам удивляется шумихе)

NS · 13 Dec 2017

Честно говоря ИМХО нет смысла спорить про силу, так как mcts и нейронные сети спокойно масштабируются, ну и понятно что и алгоритмически есть куда A0 развивать. Если первая попытка в шахматы играет сравнимо со Стоком - то скоро будет играть несравнимо сильнее.
У AlphaGo Zero рейтинг 5185.

Log in or Sign up

AlphaZero. Нейронная сеть играет в шахматы

grizly Учаcтник

Комсюк народный модератор

roman57 Учаcтник

Комсюк народный модератор

ШахматыЭтоДиагноз Учаcтник

DIOGEN Учаcтник

Baron Учаcтник

Undying Учаcтник

4547 Учаcтник

DIOGEN Учаcтник

Комсюк народный модератор

Crest Админ, МГ

Undying Учаcтник

Комсюк народный модератор

NS Нефёдов Сергей

Комсюк народный модератор

nn Заблокирован

Комсюк народный модератор

Undying Учаcтник

Комсюк народный модератор

nn Заблокирован

Комсюк народный модератор

NS Нефёдов Сергей

ШахматыЭтоДиагноз Учаcтник

Комсюк народный модератор

NS Нефёдов Сергей

WinPooh В.М.

Мобуту спаситель нации

Комсюк народный модератор

Комсюк народный модератор

ШахматыЭтоДиагноз Учаcтник

NS Нефёдов Сергей

Мобуту спаситель нации

Neo94 Учаcтник

NS Нефёдов Сергей

Share This Page