AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Сомневаюсь что в природе существуют.
  2. Kalvados Старожил

    • Участник
    • Старожил
    Member Since:
    28.05.2013
    Message Count:
    1.390
    Likes Received:
    2.226
    Репутация:
    134
    Оффлайн
    Российские ученые предложили отказаться от двоичной системы счисления
    Благодаря ученым Северо-Кавказского федерального университета интеллектуальные системы обработки данных смогут работать заметно быстрее, причем при меньших аппаратных ресурсах. Такие системы станут также мобильнее и доступнее без потерь в качестве работы.
    Интеллектуальные системы обработки данных, например, по распознаванию изображений или речи, строятся по принципу нейронных сетей. Точность работы таких систем обеспечивается очень сложными вычислениями. Последние требуют времени и мощных ресурсов, что заметно ограничивает практическое применение искусственного интеллекта. Ученые всего мира пытаются оптимизировать процесс обработки данных за счет аппаратной реализации компонентов нейронной сети. Например, создаются специализированные сопроцессоры или задействуются мощные видеокарты для вычислений. Они призваны значительно ускорить работу системы, а также обеспечить ее автономность и мобильность.
    Математики из СКФУ пошли другим путем. Они разработали и опробовали на практике оригинальный подход к оптимизации сложных вычислений. В его основе – применение параллельной арифметики на основе системы остаточных классов вместо традиционной двоичной системы счисления.
    - Впереди еще год работы. Мы планируем за это время всю нейронную сеть, а не отдельные ее компоненты, реализовать на основе нашего подхода, - поделился планами руководитель проекта Павел Ляхов. – У нас уже есть идеи, как это можно сделать. Разработанные модели и методы будут еще больше превосходить аналоги по качеству и скорости обработки данных и при этом потребуют гораздо меньших аппаратных затрат. Возможно, в будущем эти результаты заложат основу широкого применения глубоких нейронных сетей на практике, особенно в медицине, беспилотном транспорте и анализе видеопотоков.
    https://rusplt.ru/sdelano-russkimi/rossiiskie-uchenie-predlozhili-otkazatsya-5ef72.html
    Может быть и в шахматах?
  3. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Ну... Во-первых, нейронные сети и так широко приеняются на практике, цена $1000 за видеокарту не есть запредельное. Собственно говоря, куда бо́льшие ресурсы идут на обучение нейронной сети, чем на вычисления.Тем более в случае условной медицины, где нам в принципе всё равно, сколько вреемени ожидать диагноз, 0.1 секунды или 10 секунд. Во-вторых, разработка чипа всегда дорогой процесс, который помимо прямых затрат на разработку ещё требует написание кучу дополнительного софта, а это много ресурсов. Поэтому без плечей гигантов, готовых инвестировать в этот процесс это дохлый номер. Даже при условии, что идея не попи́л, а действительно даёт некоторый буст.
  4. Kalvados Старожил

    • Участник
    • Старожил
    Member Since:
    28.05.2013
    Message Count:
    1.390
    Likes Received:
    2.226
    Репутация:
    134
    Оффлайн
    А как, Вы относитесь к самой идее?
  5. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Идея, вероятно, интересная. Но заголовок желтее некуда. Вот именно что отказаться от двоичной системы! Запретить!
    В очередной раз учёный сделал что-то нехорошее с журналистом.
  6. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    В заметке нет никакой идеи. Но если бы она была интересной, то скорее всего коллектив продолжил бы работу в Amazon, nVidia или Google, а не СКФУ.
  7. Rom Старожил

    • Участник
    • Старожил
    Member Since:
    12.02.2012
    Message Count:
    645
    Likes Received:
    276
    Репутация:
    28
    Оффлайн
    DeepMind выпустила новый документ про AlphaZero. Теперь программа исследует альтернативные варианты шахмат вместе с Владимиром Крамником:

    https://arxiv.org/pdf/2009.04374
    wentille likes this.
  8. Strat7 Учаcтник

    • Участник
    Member Since:
    06.05.2017
    Message Count:
    806
    Likes Received:
    372
    Репутация:
    11
    Оффлайн
    Кратко - если внести мелкие изменения в шахматы то можно добиться новой динамичной игры и нивелирования многолетней дебютной подготовки. Это абсолютно логично и очевидно. Только смысла нет. По сути нужна политическая воля ФИДЕ, международное обсуждение проблемы ничейной смерти и заучивания многоходовых комбинаций. Если это будет признано проблемой, которую надо решить, то потом организовать конкурс на возможность внесения минимальных изменений в правила шахмат, которые внесут новую струю. А пока такой проблемы не вынесено и смысла решать их нет. Но учитывая компьютеризацию, все равно дебютка будет семимильными шагами развиваться в этом новой реальности правил, потому что наращивание мощности компов, сидение месяцами над дебютами будет давать огромный выхлоп.
  9. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору. Как представить, что Рубинштейн имел бы партии матча A0 – Stockfish.
  10. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    Почему только об А0 речь? Стокфиш может быть изменена достаточно быстро под все эти варианты, а тренировка сети под них потребует значительно меньше ресурсов чем А0. И играть стокфиш, очень вероятно, тоже будет сильнее. То есть доступ к А0, как экслюзив, отнюдь не потребуется.
  11. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    A0 всё-таки несколько часов, сколько надо тренировать NN для стокфиша я не знаю. В любом случае на первых порах ведущие роли будут занимать те, кто будет больше анализировать новые позиции.
  12. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Так те анализы не хватает только пересмотреть, еще запомнить нужно. У меня было несколько гроссов друзей, ты даже не представляешь сколько раз они оправдывались, что играли то что знали и изучали , но - ... забыли...

    Я сам помню в молодости на соревнования брал такую малюсенькую книжочьку/шпаргалку...и не я один так делал...
    Так что программа она как некого рода тренер - может показать твои ошибки в сыгранной партий , но все таки ты сам зубрежку должен произвести и тут уже вступает в первый план - кто знает как нужно запоминать...и именно в этом самый большой пробел многих , а не нехватка знаний...
    nh2008 likes this.
  13. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Вот интересно, хоть кто-то из топ-игроков пробовал для механического запоминания вариантов применять специальные мнемотехнические приёмы? Алгоритмы же подробно разработаны (методы ассоциаций, римских комнат и т.д.), спортсмены-мнемонисты десятки тысяч знаков числа пи запоминают... То есть идея в том, чтобы запомнить готовый анализ не как набор шахматных ходов, а просто как абстрактный текст. И в нужный момент в памяти "открыть книжку" и прочитать нужную страницу.
  14. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Ну... я не думаю, что речь идёт про счёт вариантов. Скорее всего, это будет как в 30-е годы получить информацию о том, что челябинский вариант сицилианки корректен и несколько классических партий, иллюстрирующие главные идеи. И т. д. и т. п.
  15. Crest Админ, МГ

    • Команда форума
    Member Since:
    05.02.2006
    Message Count:
    57.242
    Likes Received:
    21.128
    Репутация:
    627
    Location:
    Москва, Россия
    Оффлайн
    Абстрактный текст? Просто набор символов и слов? Просто множество элементов?
    Это слишком усложняет процесс.
    Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
    Если один раз поймёшь - можно помнить долго.
  16. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Практика показывает, что иногда память даёт сбои. Можно перепутать порядок ходов, взять ход из другого варианта, и т. п. Мне знакомый гроссмейстер говорил, что если на следующий день дебютный вариант повторяет предыдущую партию, то в большинстве случаев он не готовится. Но если это вариант Ботвинника, то варианты надо повторить, потому что за день выветривается. Мнемоническая память не замещает понимание, а скорее даёт дополнительный шифр для проверки правильности.
    WinPooh likes this.
  17. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Я понимаю, что они не пользуются мнемотехникой и, естественно, запоминают иначе. Мне интересен вопрос, что было бы, если бы пользовались. Насколько помогла бы в практической игре способность запомнить наизусть текст, скажем, сотни партий по актуальному варианту. А такие техники реально существуют, и доступны людям совершенно без выдающихся способностей, просто в результате упорных тренировок.
    Да, добавляется ещё один уровень абстракции - вместо ходов запоминаем слова и цифры. На выходе получаем возможность, сравнимую с тем, чтобы принести с собой в турнирный зал дебютную монографию и положить рядом с доской в открытом виде.
    Мнемоники могут помнить материал очень долгое время. В известной книге Лурии про Шерешевского (не шахматиста) рассказывается, что он успешно вспоминал списки слов, на которых его проверяли, через десятки лет. Шерешевский, правда, был сильным синестетиком от природы. Но принцип использовал тот же, что и профессиональные мнемонисты.
    hornet and Plastun02 like this.
  18. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    Несколько часов - это, кажется, то ли на 5000, то ли на 20000 TPU. У А0 сеть значительно больше и ресурсов требуется значительно больше для тренировки. У стокфиш нынешнюю сеть натренировал один человек, начав сначала, примерно, кажется, за неделю или две. У него есть какие-то вычилительные мощности, но с Гуглом это никак не сравнивается совсем.
    nh2008 likes this.
  19. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Если поймешь то запоминать уже - не нужно. Не забываем, как надо дышать , кушать, плыть, ехать на велосипеде...

    Запоминаеться то, что понять не возможно или это не подходит под понятие -"понять".

    Банальный пример - слова какого то чужого языка... можно биться сколько угодно, но например понять почему то что у вас - "хорошо" у нас произноситься "герай"...в шахматах да и во многих логических играх "понимание" приходит после расчета вариантов и выбора - который - лучше других.
    Тот же Карлсен делает некий ход чаще всего потому , что помнит - что так уже играл и было хорошо, а вот если не помнит - то тогда делает какой то расчет нескольких вариантов, их сравнивает по неким критериям и выбирает того - что ему по тем критериям кажеться лучше...это пониманием назвать затруднительно.

    Вообще то есть такая , как бы наука - "как правильно учиться"... Очень многие про это и не слышали и не задумываеться что в том направлений они просто кое что делают не так и этим просто напросто обрезывают свои возможности...

    И тут вот Альфа зеро очень хороший пример - когда программа делая меньше движений - получает лучше результат. Вот почему один игрок играет лучше другого ? В подавляещем количестве случаев - тот кто играет лучше - знает или скажем помнит - больше. Можно все это называть как угодно , но от этого ни куда не денешься. И вот те знания легли через понимание, или понимание пришло через знания - ни кого не волнует...

    Но...
    Понимание очень связанно с количеством нужных знаний.
    Нужные знания - почти всегда - на первом месте. Можно иметь много - не нужных знаний и проигрывать тому , кто знаний имеет меньше - но они как раз те - что нужные в том момент !
    Сами подумайте насколько облегчит вашу разговорную речь в каком то языке - знание, как на нем звучит слово "кардиофон"...:) ?

    Поизучайте эту тему - думаю можно найти многое...видимо есть что то такое как "оптимальное изучение " что связывает и понимание и простую зубрежку...
  20. nh2008 Старожил

    • Участник
    • Старожил
    Member Since:
    01.12.2013
    Message Count:
    3.961
    Likes Received:
    5.378
    Репутация:
    379
    Location:
    Украина
    Оффлайн
    Это надо бы в единицах энергии измерять.
    Вот окончания по таблицам (Налимов, Ломоносов и т.п.) играть, тут явно и движений меньше, и джоулей. Запиши на энергонезависимый быстрый носитель, правильно структурируй информацию и всё хорошо. Или таблица дебютов, тоже экономия на вычислениях, если позиция знакома и оценена.
    А середина игры? Сколько вычислений делает Альфа-зеро? И склько Стокфиш?

    Да что Вы говорите.© :)

    [​IMG]
    Вундеркинд Сэмми Решевский дает сеанс одновременной игры седобородым господам. Фотография сделана в 1920 году, когда Сэмми было всего восемь лет.
    И как Решевский подходит под Вашу теорию запоминания и понимания?
    Undying likes this.
  21. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает

    http://kasparovchess.crestbook.com/threads/8218/


    Так он и есть точьная демонстрация той теорий , только что она - не моя :)

    Есть много людей которые чем то владеют просто так... вот мой однокласник читал очень быстро ( примерно 1500 слов в минуту или 7-8 стандартных книжных страниц ) - увидев такое в детстве не особо обращал внимание, однако попозже начал интересоваться как так...начал расспрашивать как он это делает - он немог этого обьяснить... для него это было - натурально...

    Однако все это подтолкнуло меня попытаться разузнать про такое явление больше и попытаться этому научиться, просто так как я много читал - более быстрое чтение просто экономило бы мне кучу времени. Ну и научилься... и даже какое то время читал курс в университете для библиотекарей...

    Потом как то потребование к этому упало .... однако на других языках мне неособо удавалось это применять - по крайней мере скорость была значительно меньше...

    Словом есть люди в любой сфере - двух типов , можно назвать - вундеркинды предмета и ... остальные. Зубрежка и запоминание - это для тех остальных...:)

    Однако именно те, чуть ли не механические действия - понемножку дает им то, что имеют те вундеркинды не понятно откуда... может из " прошлых жизней" :)...
  22. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    А вы учли в этом расчёте, сколько вычислительных операций уходит у АльфаЗеро на одно обращение к нейросети за оценкой? Там матрицы перемножать надо о-го-го какого размера. А потом ещё всякие сигмоиды и тангенсы гиперболические вычислять, тоже в большом количестве. Просто эти вычисления производятся не на CPU, а на отдельном устройстве. Бесплатного сыра не бывает, алгоритмическую сложность шахмат как математической задачи под ковёр не спрятать.
    nh2008 and sovaz1997 like this.
  23. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Давно уже не побеждает.
  24. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Самое важное чтоб вы не забыли , о чем разговор и чтоб небыло такого :
    первый- "это - белое"
    Второй - " да ты - дурак и не понимающий - это же - белое !"
    первый - " да что ты чушь несешь - это ведь белое..."

    Суть то не в том, кто больше тренировалься, чтоб дойти до какого то уровня или решения. Важен сам факт достижения и почему бывает такое, что люди сами себе мешают достичь - чего то.... :)

    Пока за этим следил - побеждало...и впринципе в одни ворота...

    Такое впечатление, что вы почему то настроены против Альфы да и вообще против использования нейросетей...
  25. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Да,немного против,может от того что не достаточно понимаю как они работают,мне кажется,что сети занимаются вспоминанием,а не думанием,в отличии от традиционных движков,поэтому конечно традиционные нравятся больше.Понравится ли вам например "игра" программы какой нибудь когда будут просчитаны все ходы в шахматах и программа просто будет рыться в базе выбирая нужный ход?
  26. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Так вроде игра Стокфиша больше подходит под это описание...он ведь до какого то момента перебирает все возможные варианты и только потом отсеивает.
    А вот Альфа должна отбрасывать очевидно неверные продолжения гораздо раньше...
    При том у Альфы скорее всего - другой алгоритм оценки...Но мне кажеться что у Стокфиша оценка более исскуственная...
  27. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур и т.д.,а потом уже просчитывает что будет дальше перебирая варианты которыми может ответить соперник и свои ответы на них,точно как и люди.
  28. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Чем-то напоминает рассуждение о том, что больше похоже на птицу - самолёт или вертолёт. На первый взгляд кажется, что самолёт. Хотя правильный ответ - они все слишком разные.
    В рамках этой аналогии хотелось бы также взглянуть на то, что в мире шахматных движков аналогично дирижаблю.
    nh2008 and Комсюк like this.
  29. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    У Стокфиша тоже нейронная сеть.
  30. nh2008 Старожил

    • Участник
    • Старожил
    Member Since:
    01.12.2013
    Message Count:
    3.961
    Likes Received:
    5.378
    Репутация:
    379
    Location:
    Украина
    Оффлайн
    И я об этом.
    —- добавлено: 14 Sep 2020 —-
    А кто больше элементарных операций производит для нахождения хода? Не в процессе обучения, а в процессе игры.
  31. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Так то так, я как раз это и имел ввиду. Но суть то в том что эта оценка - просто записанна в программе, а вот Альфа просто считает каков % путей ведет к победе, к ничьей , к поражению - словом у нее нет какой то цыфровой оценки позиций а есть процентальная.

    может быть...

    Скорее всего ни один из дискутирующих не залезал в код любой из тех программ. Вообще то под Стокфиш я подразумевал -все или большинство возможных вариантов перебирающую программу , то есть пока по заданным критериям оценка не выходит за какие то рамки. Предпологаю , что похоже действует Стокфиш. Но натурально что и там перцептроны используеться :)

    Как действует Альфа мне не ясно до сих пор, хотя я и занимаюс тем, что создаю алгоритмы и для нейронных сетей, правда очень простых. Однако как она может работать - представляю.

    Вот как раньше 5-7 лет назад работал Стокфиш, то основная разница его с Альфой ( нейросетью ) была в том , что без сети правильного решения можно и не найти а принять некое как - правильное просто из за того что плохо составлена оценочьная функция. ( в реале то никто не знает какова она должна быть )
    А вот нейросеть поступает немножко по другому и поэтому если есть например ход лучше других - то при наличий достаточьного времени она ее обязательно - найдет...
  32. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    A0 и намного, порядка на 3. У него было четыре TPU, не знаю какого поколения. Но второго 45 терафлопс.
    А позиций стокфиш просматривает больше. На сегодняшних типичных компьютерах тоже порядка на 3. У А0 сеть просто значительно больше и сложнее, и ее расчет занимает много времени.
    nh2008 likes this.
  33. SKY Учаcтник

    • Участник
    Member Since:
    05.11.2018
    Message Count:
    190
    Likes Received:
    20
    Репутация:
    1
    Оффлайн
    Сейчас да,но как помощник в оценке,но когда рукописная оценка сравняется с реальным опытом по точности,а это в любом случае когда-то случится,надобность в сети как в помощьнике отпадет.
    —- добавлено: 14 Sep 2020 —-
    Как и в наших головах.Ферзь 9,ладья 5 слон 3...
    WinPooh likes this.
  34. nn Заблокирован

    • Участник
    • Заблокирован
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Нарушения:
    31
    Оффлайн
    В стокфиш сейчас сеть используется вместо оценочной функции (в смысле точно также, ничего дополнительного), написанной ранее вручную. Несколько медленнее (в зависмости от CPU от 10% до 50% медленнее, на старых может даже еще медленнее), но значительно точнее.
    Вряд ли догонит. Просто никто не будет этим заниматься, если сеть можно научить очень быстро. Да и в последнее время изменения в оценочной функции давали, наверно, лишь 10 эло в год прироста. Дополнительные 100 эло не так просто получить.
  35. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    А здесь есть кто то, кто реально разбираеться как на А0 и ли Лиле организована нейро сеть ? Вернее как происходит обучение ?

Share This Page