AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. TopicStarter Overlay

    grizly Новичок

    • Новичок
    Рег.:
    10.05.2015
    Сообщения:
    63
    Симпатии:
    231
    Репутация:
    10
    Оффлайн
    Что сейчас и делается повсеместно и без всяких подобных возражений - при тестировании и составлении рейтингов, при проведении турниров, или любителями - дай-ка я протестирую на своем любимом наборе тестовых позиций на понимание, или посмотрю, как она анализирует мои партии, или дай-ка я еще раз просмотрю вариант к завтрашней партии на первенство мира.
    —- добавлено: 13 дек 2017, опубликовано: 13 дек 2017 —-
    Открытое письмо Google DeepMind одного из авторов Stockfish

    Любитель_, N1mTzo, Mustitz и 3 другим нравится это.
  2. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    FIBM, я Вас дико уважаю, как учёного, но это неконструктивный подход
    Альфа насчитала себе книжку, будьте добры дать и Стоку
    И такая книжка есть! Он сам её сотворил тоскливыми зимними вечерами (пусть и не за 4 часа)
    Там нет ни капли гениальных человеческих партий, которые веками строили теорию

    nn, не нужны там позиции после второго хода, чтобы не неволить эту богиню
    Пусть играет всё, что ей нравится, но и у калькулятора костыли не отбирайте
  3. roman57 Учаcтник

    • Участник
    Рег.:
    23.09.2017
    Сообщения:
    115
    Симпатии:
    16
    Репутация:
    1
    Оффлайн
    Картина игры А0 прояснится когда все увидят игру двух А0 между собой , а лучше турнир между десятком таких программ
  4. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    Картина была бы уже ясной, будь опубликованы все партии
    По крайней мере, можно было судить о нынешнем уровне Альфы, посмотрев её проигранные :)
    N1mTzo нравится это.
  5. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    1.716
    Симпатии:
    2.171
    Репутация:
    120
    Оффлайн
    На днях АльфаЗеро выиграла Стокфиш значительно уступая ему в счете, но зато превосходя в понимании. Сейчас это самая популярная тема на форуме. :)
    Комп это в первую очередь не движок, а базы и дебютная книга. Без него сейчас не будет качественной дебютной подготовки.
  6. DIOGEN Учаcтник

    • Участник
    Рег.:
    26.05.2017
    Сообщения:
    445
    Симпатии:
    131
    Репутация:
    12
    Оффлайн
    \АльфаЗеро выиграла Стокфиш? Ну и что нейросеть будет теперь с ним делать? Выкинет на свалку? Или продаст кому-нибудь?
    Вы русский? Считаете себя образованным? Тогда почему применяете такие чудовищно безграмотные конструкции? Если это описка - искренне извиняюсь. Если Вы не native - тоже. Просто глаз режет\.
    Sorry за оффтоп.
    А кто сказал, что нейросеть превосходит Стокфиш в понимании? И что такое - это самое понимание - для железяки?
    Смыслов как-то говорил, что с возрастом, когда ухудшились счетные способности - он хуже стал понимать позицию. То, что некоторые слабые шахматисты принимают за понимание - просто знание типовых позиций и приемов.
    Для белковых понимание позиции - попытка представить и оценить возникающую через несколько ходов позицию. Человечишки после жалких 3-5 ходов вперед уже не видят ничего... Поэтому вынуждены оценивать позицию с точки зрения каких-то выдуманных ими же самими законов, (которые неверны частенько. И машина это убедительно показывает, обыгрывая людишек даже с форой. Машина - не заморачивается подобной ерундой - просто считает глубже, полностью перебирая варианты.
    Вообще, мне кажется, с увеличением глубины расчета шахматных программ на высшем уровне такая вещь как "понимание", основанное на каких-то общих принципах и законах шахмат - уйдет на второй план и будет заменено глубочайшим (100 полуходов, например) расчетом.
    Впрочем, на этот счет - пусть лучше выскажутся гроссы и супергроссы... Ну, или шахматные программисты.
    WinPooh нравится это.
  7. Baron Учаcтник

    • Участник
    Рег.:
    08.02.2008
    Сообщения:
    2.343
    Симпатии:
    233
    Репутация:
    11
    Оффлайн
    Вот примерное объяснение
  8. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Альфа Зеро считает в 1000 раз меньше позиций чем Стокфиш и при этом играет сильнее. То есть шахматы Альфа Зеро понимает по крайней мере в 1000 раз лучше, чем Стокфиш.
  9. 4547 Учаcтник

    • Участник
    Рег.:
    15.11.2016
    Сообщения:
    1.457
    Симпатии:
    1.215
    Репутация:
    112
    Оффлайн
    Понимание - это оценка позиции с учетом дальнейших перспектив. Для белкового шахматиста полагаться исключительно на счет плохая идея.
    Во-первых, велика вероятность ошибки. Особенно если это действие повторяется. Раз правильно посчитал, два посчитал, на третий ошибся..
    Во-вторых, время. Подсознательное понимание намного быстрее (но больше вероятность ошибки естественно). Фактически это бессознательный расчет.
    В-третьих, счет энергозатратен. Энергия ( как и время) шахматиста ограниченна во время партии. Это понимает любой игрок, участвовавший в турнирах. Игрок должен быть готов в важный момент партии посчитать варианты в сложной позиции. Но если он до этого истратил энергию и время там, где можно было быстро сыграть интуитивно, то у него не хватит ресурсов. Он ошибается и проигрывает.. После партии думает "как я мог так ошибиться?! До победы рукой было подать!". На самом деле он неправильно расходовал силы и время в партии. Это было главной ошибкой.
    У движков даже с большой глубиной расчета есть "недостаток" - это заложенные человеком алгоритмы оценки позиции. Заканчивая расчет движок ориентируется на них.
    thenewone нравится это.
  10. DIOGEN Учаcтник

    • Участник
    Рег.:
    26.05.2017
    Сообщения:
    445
    Симпатии:
    131
    Репутация:
    12
    Оффлайн
    Компьютерное железо интенсивно развивается. Вроде как уже на 60 полуходов могут считать? (Не суть важно, через несколько лет, вполне вероятно, будут считать глубже).
    Я о том, что человечишки вынуждены придумывать себе "оценку позиции". Которая является компенсацией неумения далеко и точно рассчитать вариант. У программ - не так - они перебирают все возможные варианты. По сравнению с людишками, на несколько порядков чище, точнее. В пределах 5-10 ходов - наверняка. Возможные ошибки, опять же, заложены жидкоголовыми при создании программы.
    60 полуходов - это 30 ходов. 100 полуходов - это 50 ходов вперед. Столько далеко не всякая партия между белковыми шахматными дебилами (по сравнению с компами, разумеется) продолжается...
    Какие шахматные законы помогут предусмотреть развитие шахматной партии на 50 ходов вперед? Зачем при такой глубине "позиционное понимание" (кроме базовых принципов, забитых изначально в алгоритм и которые никому уже не интересно отлаживать)?

    Уже сейчас это мало помогает двуногим шахматным недоразумениям играть с программами. Даже с форой проигрывают...
  11. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    Атомное оружие - это зло
  12. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    51.554
    Симпатии:
    12.741
    Репутация:
    497
    Адрес:
    Москва, Россия
    Оффлайн
    А можно глянуть, перевод, братцы?
  13. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Этим вы и занимаетесь, смешивая столь разные понятия как понимание и счет.
  14. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    1. старая версия Стока
    2. маленький хэш
    3. контроль времени лажовый

    с уважением, Рыбак (от себя лично, а не от команды разработчиков)

    З.Ы. последняя строка тоже перевод :)
  15. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Очень похоже на лозунг.
    Вот вам простой пример. Есть два движка. Играют в одну силу. Один из них рассматривает в 1000 раз меньше узлов в секунду.
    Вы утверждаете что он лучше понимает шахматы, но играет то он при это не сильнее, значит понимает он лучше, а что-то другое у него "хуже"? Что?
    Тактика? Есть тактические тесты, и что-то никогда особо слабее в тактике медленные движки не были. То есть вопрос остается открытым - если у медленных движков лучше понимание, то что у них "хуже", раз играют они не сильнее?
    А ничего у них нет "хуже" в компенсацию "понимания". Нет ни малейшей разницы в "понимании" шахмат у быстрых и медленных движков. Разницу в "понимании" показывает только разницы в силе игры. Все остальное предрассудки.

    Счет в матче вроде был 61/39, разница в силе 80 пунктов.
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    в матче без книжек 98 Эло
    —- добавлено: 13 дек 2017 —-
    80 по общему зачёту
  17. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    945
    Симпатии:
    2.412
    Репутация:
    96
    Оффлайн
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    про мощности и книги нету
    —- добавлено: 13 дек 2017 —-
    Не хотят уж совсем принижать богиню
  19. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.175
    Симпатии:
    516
    Репутация:
    12
    Оффлайн
    Давайте такой пример рассмотрим. Возьмем Стокфиш с глубиной порядка 14 полуходов и белкового гроссмейстера. Сила игры будет сопоставима. При этом счет вариантов несопоставим, Стокфиш считает сотни тысяч позиций, а гроссмейстер десятки позиций. Так за счет чего гроссмейстер играет на равных?
  20. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    этот трюк уже исполнял Васик Райлих, занижая показания приборов
    Рыбка, якобы, лучше понимала...

    Белковых гроссов можно не беспокоить
  21. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    945
    Симпатии:
    2.412
    Репутация:
    96
    Оффлайн
    Здесь вопрос в том, что конкретно утверждает DeepMind.
    Если что AlphaZero играет сильнее людей и всего, что было создано до AlphaZero, то тогда Stockfish должна играть и с дебютной книгой и с эндшпильными базами.
    Если же их утверждение, что алгоритм использованный ими лучше альфа-беты, то проверять на двух-ходовой книге нормально.

    Кругом, конечно, раструбили первое, но нужно подождать, когда они выскажутся.
    Комсюк нравится это.
  22. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    Ждём развёрнутое высказывание грека :)
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    За счет того что гроссмейстер совершает больше ошибок, проигрывает в "мелкой тактике". И это легко показать на конкретных примерах из конкретных партий. Это не потому что у них разница в скорости просмотра позиций, а потому что "вот так устроены движки".

    Теперь вы утверждаете что разница в понимании между Альфой и Стоком больше, чем разница в показанном результате. За счет того что Стокфиш лучше считает. В каких партиях он это продемонстрировал? Покажите пример партий, из которых видно что Стокфиш сильнее в счете. Или Стокфиш не сильнее в счете, и все-таки разница в понимании равна разнице в силе?
  24. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    1.716
    Симпатии:
    2.171
    Репутация:
    120
    Оффлайн
    А как она при таком подходе вообще считает тактику? Здесь одной только статистикой не обойдешься. Собрал тысячу позиций, которые по статистике были выиграны, а потом пришел какой-нибудь SF и увидел что там можно фигуру выиграть в три хода.
  25. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    показательная партия из той же ссылки



    Белые начинают партию на 17-ом ходу с оценкой +1.96
    —- добавлено: 13 дек 2017 —-
    движок Стокфиш, это название книг
    Challenger Spy нравится это.
  26. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    1. Тактику видит нейросеть. То есть то время, которое казалось бы тратится только на оценку позиции, на самом деле тратится и на тактику, на счет. То есть нейросеть работает как некий аналог счета + оценка.
    2. Как ни странно, mcts несмотря на свою "странность" - тактику видит.

    добавлено
    Криво сформулировал. Если в позиции есть выигрывающая или проигрывающая тактика, то нейросеть скорректирует на неё оценку.
  27. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.184
    Симпатии:
    2.495
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Нейросеть может помнить многие тысячи типовых тактических паттернов. Вроде спертого мата конем и ферзем, жертвы слона на h7 и т.д. Всё вместе это складывается в эффективное видение короткой тактики.
    Комсюк и crem нравится это.
  28. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.435
    Симпатии:
    1.977
    Репутация:
    103
    Адрес:
    Заир
    Оффлайн
    Это совсем не то. АльфаЗеро не варьировала ведь варианты, а прицельно била в одну и ту же слабую точку. Например, раз за разом выходила на французскую с 3. Nc3 Nf6 4. e5 Nfd7. Попробуйте, устройте матч двух примерно равноценных сильных движков, например Стокфиша и Гудини, где все партии начинаются с этой позиции. Дальше смотрим на результат и определяем, сколько пунктов к рейтингу белых приплюсовывает такой выбор дебюта.
  29. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    эх, не знаю я умных слов
    развёрнутые тезисы :writing:
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    13.968
    Симпатии:
    16.028
    Репутация:
    1.030
    Нарушения:
    13
    Оффлайн
    KEV81, ты вроде умеешь потоньше троллить...
    По партии скажешь что-нить, програмёр хренов?
  31. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    1.716
    Симпатии:
    2.171
    Репутация:
    120
    Оффлайн
    Каким образом он ее видит? Я так понимаю, что mcts видит не тактику, а вероятность. Это примерно то же самое, как если бы мы сами играя с движком имели под рукой дебютную книгу. Пока идем по варианту - у нас есть гарантия что мы не проиграем партию и не зевнем материала. Но когда он закончится то, чтобы таким же способом играть дальше, требуется просчитать квадратно-гнездовым методом и до самого мата такое количество позиций сколько нет нейронов во всей А0.
  32. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    mcts наигрывает партии до конца, при этом ходы делаются не случайным образом, а согласно собранной статистике и ОФ. Если вдруг в позиции выигрывается материал, то ход, выигрывающий материал будет практически всегда выигрывать, соответственно наберет хорошую статистику, и будет всегда делаться из этой позиции.
    Программы на mcts (например в ГО, Symple), даже совсем без ОФ (UCT + RAVE + остальные чисто переборные эвристики) - видят тактику. А с ОФ видят её не хуже чем программы на альфа-бете.
    N1mTzo, sovaz1997 и Комсюк нравится это.
  33. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    Рег.:
    15.02.2006
    Сообщения:
    6.435
    Симпатии:
    1.977
    Репутация:
    103
    Адрес:
    Заир
    Оффлайн
    Каспаров говорил о человечьих подсказках проге. Смысл был в том, что он вместо своих фирменных острых сицилианок стал играть в том матче скучную антикомпьютерную восьмипешечную игру. Расчёт был на то, что Deep Blue, как и все проги того времени, начнёт там тупить. И вдруг Deep Blue бодро начал выдавать крепкие гроссмейстерские планы в тех позах. Возникли подозрения в человеческих подсказках, но проконтролировать было невозможно: матч проходил на вражьей территории при тотальном контроле IBM. А в ответ на предложение проверить после матча, в самом ли деле Deep Blue исполнит сделанные ею ходы в условиях внешнего контроля, было отвергнуто IBM, которая быстренько уничтожила Deep Blue как главную улику.
  34. Neo94 Заблокирован

    • Участник
    • Заблокирован
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    143
    Репутация:
    -10
    Нарушения:
    31
    Оффлайн
    По-моему совершенно очевидно, что дипмайнд высказывал именно второе про алгоритс. Если они хотели бы утверждать первое - это был бы громкий матч с вызовом, рекламой, и прочими атрибутами.
    А не скромная аж ОДНА статья в научном хранилище, которое предназначено для специалистов по компьютерному обучению, а не для широкой публики (и глава дипмайнд сам удивляется шумихе)
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Честно говоря ИМХО нет смысла спорить про силу, так как mcts и нейронные сети спокойно масштабируются, ну и понятно что и алгоритмически есть куда A0 развивать. Если первая попытка в шахматы играет сравнимо со Стоком - то скоро будет играть несравнимо сильнее.
    У AlphaGo Zero рейтинг 5185.
    crem и Комсюк нравится это.

Поделиться этой страницей