AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    178
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Сомневаюсь что в природе существуют.
  2. Kalvados Учаcтник

    • Участник
    Рег.:
    27.05.2013
    Сообщения:
    786
    Симпатии:
    953
    Репутация:
    66
    Оффлайн
    Российские ученые предложили отказаться от двоичной системы счисления
    Благодаря ученым Северо-Кавказского федерального университета интеллектуальные системы обработки данных смогут работать заметно быстрее, причем при меньших аппаратных ресурсах. Такие системы станут также мобильнее и доступнее без потерь в качестве работы.
    Интеллектуальные системы обработки данных, например, по распознаванию изображений или речи, строятся по принципу нейронных сетей. Точность работы таких систем обеспечивается очень сложными вычислениями. Последние требуют времени и мощных ресурсов, что заметно ограничивает практическое применение искусственного интеллекта. Ученые всего мира пытаются оптимизировать процесс обработки данных за счет аппаратной реализации компонентов нейронной сети. Например, создаются специализированные сопроцессоры или задействуются мощные видеокарты для вычислений. Они призваны значительно ускорить работу системы, а также обеспечить ее автономность и мобильность.
    Математики из СКФУ пошли другим путем. Они разработали и опробовали на практике оригинальный подход к оптимизации сложных вычислений. В его основе – применение параллельной арифметики на основе системы остаточных классов вместо традиционной двоичной системы счисления.
    - Впереди еще год работы. Мы планируем за это время всю нейронную сеть, а не отдельные ее компоненты, реализовать на основе нашего подхода, - поделился планами руководитель проекта Павел Ляхов. – У нас уже есть идеи, как это можно сделать. Разработанные модели и методы будут еще больше превосходить аналоги по качеству и скорости обработки данных и при этом потребуют гораздо меньших аппаратных затрат. Возможно, в будущем эти результаты заложат основу широкого применения глубоких нейронных сетей на практике, особенно в медицине, беспилотном транспорте и анализе видеопотоков.
    https://rusplt.ru/sdelano-russkimi/rossiiskie-uchenie-predlozhili-otkazatsya-5ef72.html
    Может быть и в шахматах?
  3. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Ну... Во-первых, нейронные сети и так широко приеняются на практике, цена $1000 за видеокарту не есть запредельное. Собственно говоря, куда бо́льшие ресурсы идут на обучение нейронной сети, чем на вычисления.Тем более в случае условной медицины, где нам в принципе всё равно, сколько вреемени ожидать диагноз, 0.1 секунды или 10 секунд. Во-вторых, разработка чипа всегда дорогой процесс, который помимо прямых затрат на разработку ещё требует написание кучу дополнительного софта, а это много ресурсов. Поэтому без плечей гигантов, готовых инвестировать в этот процесс это дохлый номер. Даже при условии, что идея не попи́л, а действительно даёт некоторый буст.
  4. Kalvados Учаcтник

    • Участник
    Рег.:
    27.05.2013
    Сообщения:
    786
    Симпатии:
    953
    Репутация:
    66
    Оффлайн
    А как, Вы относитесь к самой идее?
  5. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.256
    Симпатии:
    2.573
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Идея, вероятно, интересная. Но заголовок желтее некуда. Вот именно что отказаться от двоичной системы! Запретить!
    В очередной раз учёный сделал что-то нехорошее с журналистом.
  6. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    В заметке нет никакой идеи. Но если бы она была интересной, то скорее всего коллектив продолжил бы работу в Amazon, nVidia или Google, а не СКФУ.
  7. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    624
    Симпатии:
    254
    Репутация:
    27
    Оффлайн
    DeepMind выпустила новый документ про AlphaZero. Теперь программа исследует альтернативные варианты шахмат вместе с Владимиром Крамником:

    https://arxiv.org/pdf/2009.04374
    wentille нравится это.
  8. Strat7 Учаcтник

    • Участник
    Рег.:
    06.05.2017
    Сообщения:
    489
    Симпатии:
    236
    Репутация:
    8
    Оффлайн
    Кратко - если внести мелкие изменения в шахматы то можно добиться новой динамичной игры и нивелирования многолетней дебютной подготовки. Это абсолютно логично и очевидно. Только смысла нет. По сути нужна политическая воля ФИДЕ, международное обсуждение проблемы ничейной смерти и заучивания многоходовых комбинаций. Если это будет признано проблемой, которую надо решить, то потом организовать конкурс на возможность внесения минимальных изменений в правила шахмат, которые внесут новую струю. А пока такой проблемы не вынесено и смысла решать их нет. Но учитывая компьютеризацию, все равно дебютка будет семимильными шагами развиваться в этом новой реальности правил, потому что наращивание мощности компов, сидение месяцами над дебютами будет давать огромный выхлоп.
  9. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору. Как представить, что Рубинштейн имел бы партии матча A0 – Stockfish.
  10. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.047
    Симпатии:
    2.602
    Репутация:
    100
    Оффлайн
    Почему только об А0 речь? Стокфиш может быть изменена достаточно быстро под все эти варианты, а тренировка сети под них потребует значительно меньше ресурсов чем А0. И играть стокфиш, очень вероятно, тоже будет сильнее. То есть доступ к А0, как экслюзив, отнюдь не потребуется.
  11. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    A0 всё-таки несколько часов, сколько надо тренировать NN для стокфиша я не знаю. В любом случае на первых порах ведущие роли будут занимать те, кто будет больше анализировать новые позиции.
  12. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Так те анализы не хватает только пересмотреть, еще запомнить нужно. У меня было несколько гроссов друзей, ты даже не представляешь сколько раз они оправдывались, что играли то что знали и изучали , но - ... забыли...

    Я сам помню в молодости на соревнования брал такую малюсенькую книжочьку/шпаргалку...и не я один так делал...
    Так что программа она как некого рода тренер - может показать твои ошибки в сыгранной партий , но все таки ты сам зубрежку должен произвести и тут уже вступает в первый план - кто знает как нужно запоминать...и именно в этом самый большой пробел многих , а не нехватка знаний...
    nh2008 нравится это.
  13. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.256
    Симпатии:
    2.573
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Вот интересно, хоть кто-то из топ-игроков пробовал для механического запоминания вариантов применять специальные мнемотехнические приёмы? Алгоритмы же подробно разработаны (методы ассоциаций, римских комнат и т.д.), спортсмены-мнемонисты десятки тысяч знаков числа пи запоминают... То есть идея в том, чтобы запомнить готовый анализ не как набор шахматных ходов, а просто как абстрактный текст. И в нужный момент в памяти "открыть книжку" и прочитать нужную страницу.
  14. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Ну... я не думаю, что речь идёт про счёт вариантов. Скорее всего, это будет как в 30-е годы получить информацию о том, что челябинский вариант сицилианки корректен и несколько классических партий, иллюстрирующие главные идеи. И т. д. и т. п.
  15. Crest Админ, МГ

    • Команда форума
    Рег.:
    04.02.2006
    Сообщения:
    52.438
    Симпатии:
    13.570
    Репутация:
    516
    Адрес:
    Москва, Россия
    Оффлайн
    Абстрактный текст? Просто набор символов и слов? Просто множество элементов?
    Это слишком усложняет процесс.
    Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
    Если один раз поймёшь - можно помнить долго.
  16. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.244
    Симпатии:
    683
    Репутация:
    22
    Адрес:
    Киев
    Оффлайн
    Практика показывает, что иногда память даёт сбои. Можно перепутать порядок ходов, взять ход из другого варианта, и т. п. Мне знакомый гроссмейстер говорил, что если на следующий день дебютный вариант повторяет предыдущую партию, то в большинстве случаев он не готовится. Но если это вариант Ботвинника, то варианты надо повторить, потому что за день выветривается. Мнемоническая память не замещает понимание, а скорее даёт дополнительный шифр для проверки правильности.
    WinPooh нравится это.
  17. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.256
    Симпатии:
    2.573
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Я понимаю, что они не пользуются мнемотехникой и, естественно, запоминают иначе. Мне интересен вопрос, что было бы, если бы пользовались. Насколько помогла бы в практической игре способность запомнить наизусть текст, скажем, сотни партий по актуальному варианту. А такие техники реально существуют, и доступны людям совершенно без выдающихся способностей, просто в результате упорных тренировок.
    Да, добавляется ещё один уровень абстракции - вместо ходов запоминаем слова и цифры. На выходе получаем возможность, сравнимую с тем, чтобы принести с собой в турнирный зал дебютную монографию и положить рядом с доской в открытом виде.
    Мнемоники могут помнить материал очень долгое время. В известной книге Лурии про Шерешевского (не шахматиста) рассказывается, что он успешно вспоминал списки слов, на которых его проверяли, через десятки лет. Шерешевский, правда, был сильным синестетиком от природы. Но принцип использовал тот же, что и профессиональные мнемонисты.
    hornet и Plastun02 нравится это.
  18. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.047
    Симпатии:
    2.602
    Репутация:
    100
    Оффлайн
    Несколько часов - это, кажется, то ли на 5000, то ли на 20000 TPU. У А0 сеть значительно больше и ресурсов требуется значительно больше для тренировки. У стокфиш нынешнюю сеть натренировал один человек, начав сначала, примерно, кажется, за неделю или две. У него есть какие-то вычилительные мощности, но с Гуглом это никак не сравнивается совсем.
    nh2008 нравится это.
  19. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Если поймешь то запоминать уже - не нужно. Не забываем, как надо дышать , кушать, плыть, ехать на велосипеде...

    Запоминаеться то, что понять не возможно или это не подходит под понятие -"понять".

    Банальный пример - слова какого то чужого языка... можно биться сколько угодно, но например понять почему то что у вас - "хорошо" у нас произноситься "герай"...в шахматах да и во многих логических играх "понимание" приходит после расчета вариантов и выбора - который - лучше других.
    Тот же Карлсен делает некий ход чаще всего потому , что помнит - что так уже играл и было хорошо, а вот если не помнит - то тогда делает какой то расчет нескольких вариантов, их сравнивает по неким критериям и выбирает того - что ему по тем критериям кажеться лучше...это пониманием назвать затруднительно.

    Вообще то есть такая , как бы наука - "как правильно учиться"... Очень многие про это и не слышали и не задумываеться что в том направлений они просто кое что делают не так и этим просто напросто обрезывают свои возможности...

    И тут вот Альфа зеро очень хороший пример - когда программа делая меньше движений - получает лучше результат. Вот почему один игрок играет лучше другого ? В подавляещем количестве случаев - тот кто играет лучше - знает или скажем помнит - больше. Можно все это называть как угодно , но от этого ни куда не денешься. И вот те знания легли через понимание, или понимание пришло через знания - ни кого не волнует...

    Но...
    Понимание очень связанно с количеством нужных знаний.
    Нужные знания - почти всегда - на первом месте. Можно иметь много - не нужных знаний и проигрывать тому , кто знаний имеет меньше - но они как раз те - что нужные в том момент !
    Сами подумайте насколько облегчит вашу разговорную речь в каком то языке - знание, как на нем звучит слово "кардиофон"...:) ?

    Поизучайте эту тему - думаю можно найти многое...видимо есть что то такое как "оптимальное изучение " что связывает и понимание и простую зубрежку...
  20. nh2008 Учаcтник

    • Участник
    Рег.:
    01.12.2013
    Сообщения:
    2.838
    Симпатии:
    3.762
    Репутация:
    291
    Адрес:
    Украина
    Оффлайн
    Это надо бы в единицах энергии измерять.
    Вот окончания по таблицам (Налимов, Ломоносов и т.п.) играть, тут явно и движений меньше, и джоулей. Запиши на энергонезависимый быстрый носитель, правильно структурируй информацию и всё хорошо. Или таблица дебютов, тоже экономия на вычислениях, если позиция знакома и оценена.
    А середина игры? Сколько вычислений делает Альфа-зеро? И склько Стокфиш?

    Да что Вы говорите.© :)

    [​IMG]
    Вундеркинд Сэмми Решевский дает сеанс одновременной игры седобородым господам. Фотография сделана в 1920 году, когда Сэмми было всего восемь лет.
    И как Решевский подходит под Вашу теорию запоминания и понимания?
    Undying нравится это.
  21. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает

    http://kasparovchess.crestbook.com/threads/8218/


    Так он и есть точьная демонстрация той теорий , только что она - не моя :)

    Есть много людей которые чем то владеют просто так... вот мой однокласник читал очень быстро ( примерно 1500 слов в минуту или 7-8 стандартных книжных страниц ) - увидев такое в детстве не особо обращал внимание, однако попозже начал интересоваться как так...начал расспрашивать как он это делает - он немог этого обьяснить... для него это было - натурально...

    Однако все это подтолкнуло меня попытаться разузнать про такое явление больше и попытаться этому научиться, просто так как я много читал - более быстрое чтение просто экономило бы мне кучу времени. Ну и научилься... и даже какое то время читал курс в университете для библиотекарей...

    Потом как то потребование к этому упало .... однако на других языках мне неособо удавалось это применять - по крайней мере скорость была значительно меньше...

    Словом есть люди в любой сфере - двух типов , можно назвать - вундеркинды предмета и ... остальные. Зубрежка и запоминание - это для тех остальных...:)

    Однако именно те, чуть ли не механические действия - понемножку дает им то, что имеют те вундеркинды не понятно откуда... может из " прошлых жизней" :)...
  22. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.256
    Симпатии:
    2.573
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    А вы учли в этом расчёте, сколько вычислительных операций уходит у АльфаЗеро на одно обращение к нейросети за оценкой? Там матрицы перемножать надо о-го-го какого размера. А потом ещё всякие сигмоиды и тангенсы гиперболические вычислять, тоже в большом количестве. Просто эти вычисления производятся не на CPU, а на отдельном устройстве. Бесплатного сыра не бывает, алгоритмическую сложность шахмат как математической задачи под ковёр не спрятать.
    nh2008 и sovaz1997 нравится это.
  23. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    178
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Давно уже не побеждает.
  24. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Самое важное чтоб вы не забыли , о чем разговор и чтоб небыло такого :
    первый- "это - белое"
    Второй - " да ты - дурак и не понимающий - это же - белое !"
    первый - " да что ты чушь несешь - это ведь белое..."

    Суть то не в том, кто больше тренировалься, чтоб дойти до какого то уровня или решения. Важен сам факт достижения и почему бывает такое, что люди сами себе мешают достичь - чего то.... :)

    Пока за этим следил - побеждало...и впринципе в одни ворота...

    Такое впечатление, что вы почему то настроены против Альфы да и вообще против использования нейросетей...
  25. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    178
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Да,немного против,может от того что не достаточно понимаю как они работают,мне кажется,что сети занимаются вспоминанием,а не думанием,в отличии от традиционных движков,поэтому конечно традиционные нравятся больше.Понравится ли вам например "игра" программы какой нибудь когда будут просчитаны все ходы в шахматах и программа просто будет рыться в базе выбирая нужный ход?
  26. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Так вроде игра Стокфиша больше подходит под это описание...он ведь до какого то момента перебирает все возможные варианты и только потом отсеивает.
    А вот Альфа должна отбрасывать очевидно неверные продолжения гораздо раньше...
    При том у Альфы скорее всего - другой алгоритм оценки...Но мне кажеться что у Стокфиша оценка более исскуственная...
  27. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    178
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур и т.д.,а потом уже просчитывает что будет дальше перебирая варианты которыми может ответить соперник и свои ответы на них,точно как и люди.
  28. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.256
    Симпатии:
    2.573
    Репутация:
    90
    Адрес:
    Москва
    Оффлайн
    Чем-то напоминает рассуждение о том, что больше похоже на птицу - самолёт или вертолёт. На первый взгляд кажется, что самолёт. Хотя правильный ответ - они все слишком разные.
    В рамках этой аналогии хотелось бы также взглянуть на то, что в мире шахматных движков аналогично дирижаблю.
    nh2008 и Комсюк нравится это.
  29. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.047
    Симпатии:
    2.602
    Репутация:
    100
    Оффлайн
    У Стокфиша тоже нейронная сеть.
  30. nh2008 Учаcтник

    • Участник
    Рег.:
    01.12.2013
    Сообщения:
    2.838
    Симпатии:
    3.762
    Репутация:
    291
    Адрес:
    Украина
    Оффлайн
    И я об этом.
    —- добавлено: 13 сен 2020 —-
    А кто больше элементарных операций производит для нахождения хода? Не в процессе обучения, а в процессе игры.
  31. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    Так то так, я как раз это и имел ввиду. Но суть то в том что эта оценка - просто записанна в программе, а вот Альфа просто считает каков % путей ведет к победе, к ничьей , к поражению - словом у нее нет какой то цыфровой оценки позиций а есть процентальная.

    может быть...

    Скорее всего ни один из дискутирующих не залезал в код любой из тех программ. Вообще то под Стокфиш я подразумевал -все или большинство возможных вариантов перебирающую программу , то есть пока по заданным критериям оценка не выходит за какие то рамки. Предпологаю , что похоже действует Стокфиш. Но натурально что и там перцептроны используеться :)

    Как действует Альфа мне не ясно до сих пор, хотя я и занимаюс тем, что создаю алгоритмы и для нейронных сетей, правда очень простых. Однако как она может работать - представляю.

    Вот как раньше 5-7 лет назад работал Стокфиш, то основная разница его с Альфой ( нейросетью ) была в том , что без сети правильного решения можно и не найти а принять некое как - правильное просто из за того что плохо составлена оценочьная функция. ( в реале то никто не знает какова она должна быть )
    А вот нейросеть поступает немножко по другому и поэтому если есть например ход лучше других - то при наличий достаточьного времени она ее обязательно - найдет...
  32. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.047
    Симпатии:
    2.602
    Репутация:
    100
    Оффлайн
    A0 и намного, порядка на 3. У него было четыре TPU, не знаю какого поколения. Но второго 45 терафлопс.
    А позиций стокфиш просматривает больше. На сегодняшних типичных компьютерах тоже порядка на 3. У А0 сеть просто значительно больше и сложнее, и ее расчет занимает много времени.
    nh2008 нравится это.
  33. SKY Учаcтник

    • Участник
    Рег.:
    05.11.2018
    Сообщения:
    178
    Симпатии:
    20
    Репутация:
    1
    Оффлайн
    Сейчас да,но как помощник в оценке,но когда рукописная оценка сравняется с реальным опытом по точности,а это в любом случае когда-то случится,надобность в сети как в помощьнике отпадет.
    —- добавлено: 13 сен 2020 —-
    Как и в наших головах.Ферзь 9,ладья 5 слон 3...
    WinPooh нравится это.
  34. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.047
    Симпатии:
    2.602
    Репутация:
    100
    Оффлайн
    В стокфиш сейчас сеть используется вместо оценочной функции (в смысле точно также, ничего дополнительного), написанной ранее вручную. Несколько медленнее (в зависмости от CPU от 10% до 50% медленнее, на старых может даже еще медленнее), но значительно точнее.
    Вряд ли догонит. Просто никто не будет этим заниматься, если сеть можно научить очень быстро. Да и в последнее время изменения в оценочной функции давали, наверно, лишь 10 эло в год прироста. Дополнительные 100 эло не так просто получить.
  35. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    133
    Симпатии:
    26
    Репутация:
    1
    Оффлайн
    А здесь есть кто то, кто реально разбираеться как на А0 и ли Лиле организована нейро сеть ? Вернее как происходит обучение ?

Поделиться этой страницей