AlphaZero. Нейронная сеть играет в шахматы

SKY · 15 июн 2020

smpin пишет: ↑

А есть в формате chessbase?
Нажмите, чтобы раскрыть...

Сомневаюсь что в природе существуют.

Kalvados · 29 июн 2020

Российские ученые предложили отказаться от двоичной системы счисления
Благодаря ученым Северо-Кавказского федерального университета интеллектуальные системы обработки данных смогут работать заметно быстрее, причем при меньших аппаратных ресурсах. Такие системы станут также мобильнее и доступнее без потерь в качестве работы.
Интеллектуальные системы обработки данных, например, по распознаванию изображений или речи, строятся по принципу нейронных сетей. Точность работы таких систем обеспечивается очень сложными вычислениями. Последние требуют времени и мощных ресурсов, что заметно ограничивает практическое применение искусственного интеллекта. Ученые всего мира пытаются оптимизировать процесс обработки данных за счет аппаратной реализации компонентов нейронной сети. Например, создаются специализированные сопроцессоры или задействуются мощные видеокарты для вычислений. Они призваны значительно ускорить работу системы, а также обеспечить ее автономность и мобильность.
Математики из СКФУ пошли другим путем. Они разработали и опробовали на практике оригинальный подход к оптимизации сложных вычислений. В его основе – применение параллельной арифметики на основе системы остаточных классов вместо традиционной двоичной системы счисления.
- Впереди еще год работы. Мы планируем за это время всю нейронную сеть, а не отдельные ее компоненты, реализовать на основе нашего подхода, - поделился планами руководитель проекта Павел Ляхов. – У нас уже есть идеи, как это можно сделать. Разработанные модели и методы будут еще больше превосходить аналоги по качеству и скорости обработки данных и при этом потребуют гораздо меньших аппаратных затрат. Возможно, в будущем эти результаты заложат основу широкого применения глубоких нейронных сетей на практике, особенно в медицине, беспилотном транспорте и анализе видеопотоков.
https://rusplt.ru/sdelano-russkimi/rossiiskie-uchenie-predlozhili-otkazatsya-5ef72.html
Может быть и в шахматах?

Mustitz · 29 июн 2020

Kalvados пишет: ↑

Может быть и в шахматах?
Нажмите, чтобы раскрыть...

Ну... Во-первых, нейронные сети и так широко приеняются на практике, цена $1000 за видеокарту не есть запредельное. Собственно говоря, куда бо́льшие ресурсы идут на обучение нейронной сети, чем на вычисления.Тем более в случае условной медицины, где нам в принципе всё равно, сколько вреемени ожидать диагноз, 0.1 секунды или 10 секунд. Во-вторых, разработка чипа всегда дорогой процесс, который помимо прямых затрат на разработку ещё требует написание кучу дополнительного софта, а это много ресурсов. Поэтому без плечей гигантов, готовых инвестировать в этот процесс это дохлый номер. Даже при условии, что идея не попи́л, а действительно даёт некоторый буст.

Kalvados · 29 июн 2020

А как, Вы относитесь к самой идее?

WinPooh · 29 июн 2020

Идея, вероятно, интересная. Но заголовок желтее некуда. Вот именно что отказаться от двоичной системы! Запретить!
В очередной раз учёный сделал что-то нехорошее с журналистом.

Mustitz · 29 июн 2020

Kalvados пишет: ↑

А как, Вы относитесь к самой идее?
Нажмите, чтобы раскрыть...

В заметке нет никакой идеи. Но если бы она была интересной, то скорее всего коллектив продолжил бы работу в Amazon, nVidia или Google, а не СКФУ.

Rom · 10 сен 2020

DeepMind выпустила новый документ про AlphaZero. Теперь программа исследует альтернативные варианты шахмат вместе с Владимиром Крамником:

https://arxiv.org/pdf/2009.04374

Strat7 · 10 сен 2020

Rom пишет: ↑

Теперь программа исследует альтернативные варианты
Нажмите, чтобы раскрыть...

Кратко - если внести мелкие изменения в шахматы то можно добиться новой динамичной игры и нивелирования многолетней дебютной подготовки. Это абсолютно логично и очевидно. Только смысла нет. По сути нужна политическая воля ФИДЕ, международное обсуждение проблемы ничейной смерти и заучивания многоходовых комбинаций. Если это будет признано проблемой, которую надо решить, то потом организовать конкурс на возможность внесения минимальных изменений в правила шахмат, которые внесут новую струю. А пока такой проблемы не вынесено и смысла решать их нет. Но учитывая компьютеризацию, все равно дебютка будет семимильными шагами развиваться в этом новой реальности правил, потому что наращивание мощности компов, сидение месяцами над дебютами будет давать огромный выхлоп.

Mustitz · 11 сен 2020

Strat7 пишет: ↑

нивелирования многолетней дебютной подготовки
Нажмите, чтобы раскрыть...

Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору. Как представить, что Рубинштейн имел бы партии матча A0 – Stockfish.

nn · 11 сен 2020

Mustitz пишет: ↑

Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору. Как представить, что Рубинштейн имел бы партии матча A0 – Stockfish.
Нажмите, чтобы раскрыть...

Почему только об А0 речь? Стокфиш может быть изменена достаточно быстро под все эти варианты, а тренировка сети под них потребует значительно меньше ресурсов чем А0. И играть стокфиш, очень вероятно, тоже будет сильнее. То есть доступ к А0, как экслюзив, отнюдь не потребуется.

Mustitz · 11 сен 2020

A0 всё-таки несколько часов, сколько надо тренировать NN для стокфиша я не знаю. В любом случае на первых порах ведущие роли будут занимать те, кто будет больше анализировать новые позиции.

Benas · 11 сен 2020

Mustitz пишет: ↑

Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору.
Нажмите, чтобы раскрыть...

Так те анализы не хватает только пересмотреть, еще запомнить нужно. У меня было несколько гроссов друзей, ты даже не представляешь сколько раз они оправдывались, что играли то что знали и изучали , но - ... забыли...

Я сам помню в молодости на соревнования брал такую малюсенькую книжочьку/шпаргалку...и не я один так делал...
Так что программа она как некого рода тренер - может показать твои ошибки в сыгранной партий , но все таки ты сам зубрежку должен произвести и тут уже вступает в первый план - кто знает как нужно запоминать...и именно в этом самый большой пробел многих , а не нехватка знаний...

WinPooh · 11 сен 2020

Benas пишет: ↑

Mustitz пишет: ↑

Или наоборот, у кого будет доступ к анализам альфа-зеро, тот будет иметь солидную фору.
Нажмите, чтобы раскрыть...

Так те анализы не хватает только пересмотреть, еще запомнить нужно. У меня было несколько гроссов друзей, ты даже не представляешь сколько раз они оправдывались, что играли то что знали и изучали , но - ... забыли...

Я сам помню в молодости на соревнования брал такую малюсенькую книжочьку/шпаргалку...и не я один так делал...
Так что программа она как некого рода тренер - может показать твои ошибки в сыгранной партий , но все таки ты сам зубрежку должен произвести и тут уже вступает в первый план - кто знает как нужно запоминать...и именно в этом самый большой пробел многих , а не нехватка знаний...
Нажмите, чтобы раскрыть...

Вот интересно, хоть кто-то из топ-игроков пробовал для механического запоминания вариантов применять специальные мнемотехнические приёмы? Алгоритмы же подробно разработаны (методы ассоциаций, римских комнат и т.д.), спортсмены-мнемонисты десятки тысяч знаков числа пи запоминают... То есть идея в том, чтобы запомнить готовый анализ не как набор шахматных ходов, а просто как абстрактный текст. И в нужный момент в памяти "открыть книжку" и прочитать нужную страницу.

Mustitz · 11 сен 2020

Benas пишет: ↑

У меня было несколько гроссов друзей, ты даже не представляешь сколько раз они оправдывались, что играли то что знали и изучали , но - ... забыли...
Нажмите, чтобы раскрыть...

Ну... я не думаю, что речь идёт про счёт вариантов. Скорее всего, это будет как в 30-е годы получить информацию о том, что челябинский вариант сицилианки корректен и несколько классических партий, иллюстрирующие главные идеи. И т. д. и т. п.

Crest · 11 сен 2020

WinPooh пишет: ↑

Вот интересно, хоть кто-то из топ-игроков пробовал для механического запоминания вариантов применять специальные мнемотехнические приёмы? Алгоритмы же подробно разработаны (методы ассоциаций, римских комнат и т.д.), спортсмены-мнемонисты десятки тысяч знаков числа пи запоминают... То есть идея в том, чтобы запомнить готовый анализ не как набор шахматных ходов, а просто как абстрактный текст. И в нужный момент в памяти "открыть книжку" и прочитать нужную страницу.
Нажмите, чтобы раскрыть...

Абстрактный текст? Просто набор символов и слов? Просто множество элементов?
Это слишком усложняет процесс.
Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
Если один раз поймёшь - можно помнить долго.

Mustitz · 11 сен 2020

Crest пишет: ↑

Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
Если один раз поймёшь - можно помнить долго.
Нажмите, чтобы раскрыть...

Практика показывает, что иногда память даёт сбои. Можно перепутать порядок ходов, взять ход из другого варианта, и т. п. Мне знакомый гроссмейстер говорил, что если на следующий день дебютный вариант повторяет предыдущую партию, то в большинстве случаев он не готовится. Но если это вариант Ботвинника, то варианты надо повторить, потому что за день выветривается. Мнемоническая память не замещает понимание, а скорее даёт дополнительный шифр для проверки правильности.

WinPooh · 11 сен 2020

Crest пишет: ↑

Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
Если один раз поймёшь - можно помнить долго.
Нажмите, чтобы раскрыть...

Я понимаю, что они не пользуются мнемотехникой и, естественно, запоминают иначе. Мне интересен вопрос, что было бы, если бы пользовались. Насколько помогла бы в практической игре способность запомнить наизусть текст, скажем, сотни партий по актуальному варианту. А такие техники реально существуют, и доступны людям совершенно без выдающихся способностей, просто в результате упорных тренировок.
Да, добавляется ещё один уровень абстракции - вместо ходов запоминаем слова и цифры. На выходе получаем возможность, сравнимую с тем, чтобы принести с собой в турнирный зал дебютную монографию и положить рядом с доской в открытом виде.
Мнемоники могут помнить материал очень долгое время. В известной книге Лурии про Шерешевского (не шахматиста) рассказывается, что он успешно вспоминал списки слов, на которых его проверяли, через десятки лет. Шерешевский, правда, был сильным синестетиком от природы. Но принцип использовал тот же, что и профессиональные мнемонисты.

nn · 12 сен 2020

Mustitz пишет: ↑

A0 всё-таки несколько часов, сколько надо тренировать NN для стокфиша я не знаю. В любом случае на первых порах ведущие роли будут занимать те, кто будет больше анализировать новые позиции.
Нажмите, чтобы раскрыть...

Несколько часов - это, кажется, то ли на 5000, то ли на 20000 TPU. У А0 сеть значительно больше и ресурсов требуется значительно больше для тренировки. У стокфиш нынешнюю сеть натренировал один человек, начав сначала, примерно, кажется, за неделю или две. У него есть какие-то вычилительные мощности, но с Гуглом это никак не сравнивается совсем.

Benas · 13 сен 2020

Crest пишет: ↑

Мы запоминаем варианты иначе - понимая логическую связь между ходами. Понимая, почему в той или иной позиции надо играть так, а не иначе.
Если один раз поймёшь - можно помнить долго.
Нажмите, чтобы раскрыть...

Если поймешь то запоминать уже - не нужно. Не забываем, как надо дышать , кушать, плыть, ехать на велосипеде...

Запоминаеться то, что понять не возможно или это не подходит под понятие -"понять".

Банальный пример - слова какого то чужого языка... можно биться сколько угодно, но например понять почему то что у вас - "хорошо" у нас произноситься "герай"...в шахматах да и во многих логических играх "понимание" приходит после расчета вариантов и выбора - который - лучше других.
Тот же Карлсен делает некий ход чаще всего потому , что помнит - что так уже играл и было хорошо, а вот если не помнит - то тогда делает какой то расчет нескольких вариантов, их сравнивает по неким критериям и выбирает того - что ему по тем критериям кажеться лучше...это пониманием назвать затруднительно.

Вообще то есть такая , как бы наука - "как правильно учиться"... Очень многие про это и не слышали и не задумываеться что в том направлений они просто кое что делают не так и этим просто напросто обрезывают свои возможности...

И тут вот Альфа зеро очень хороший пример - когда программа делая меньше движений - получает лучше результат. Вот почему один игрок играет лучше другого ? В подавляещем количестве случаев - тот кто играет лучше - знает или скажем помнит - больше. Можно все это называть как угодно , но от этого ни куда не денешься. И вот те знания легли через понимание, или понимание пришло через знания - ни кого не волнует...

Но...
Понимание очень связанно с количеством нужных знаний.
Нужные знания - почти всегда - на первом месте. Можно иметь много - не нужных знаний и проигрывать тому , кто знаний имеет меньше - но они как раз те - что нужные в том момент !
Сами подумайте насколько облегчит вашу разговорную речь в каком то языке - знание, как на нем звучит слово "кардиофон"... ?

Поизучайте эту тему - думаю можно найти многое...видимо есть что то такое как "оптимальное изучение " что связывает и понимание и простую зубрежку...

nh2008 · 13 сен 2020

Benas пишет: ↑

делая меньше движений
Нажмите, чтобы раскрыть...

Это надо бы в единицах энергии измерять.
Вот окончания по таблицам (Налимов, Ломоносов и т.п.) играть, тут явно и движений меньше, и джоулей. Запиши на энергонезависимый быстрый носитель, правильно структурируй информацию и всё хорошо. Или таблица дебютов, тоже экономия на вычислениях, если позиция знакома и оценена.
А середина игры? Сколько вычислений делает Альфа-зеро? И склько Стокфиш?

Benas пишет: ↑

В подавляещем количестве случаев - тот кто играет лучше - знает или скажем помнит - больше.
Нажмите, чтобы раскрыть...

Да что Вы говорите.©

Вундеркинд Сэмми Решевский дает сеанс одновременной игры седобородым господам. Фотография сделана в 1920 году, когда Сэмми было всего восемь лет.

В 1920 году Самуэль отправился в свое первое шахматное турне по станам Европы. Он посетил Париж, Лондон, Вену, Берлин и везде его встречала рукоплещущая публика, недоумевавшая, как столь юный шахматист обыгрывает седобородых соперников. Из 23 сыгранных партии он не проиграл ни одной и лишь 4 свел вничью.
Нажмите, чтобы раскрыть...

Поговаривают, что у Решевского была ужасная память, в ней не фиксировались даже игры сыгранные несколько месяцев назад. Существует история о человеке, который показал Решевскому партию и при этом заявил, что игроки играли плохо и игра была неинтересной. Это была одна из игр Решевского, но он не смог её «идентифицировать».
Нажмите, чтобы раскрыть...

Решевский не посещал школу и никогда не видел книг с иллюстрациями. Поэтому во время проведенного теста он почти ничего не узнавал на картинках, даже льва, обезьяну или тигра. Он знал, какой был день недели — среда, но не имел понятия о числе. В арифметике шахматист безнадежно отставал от своих сверстников. Вместе с тем Сэмми легко решал головоломки, трудные для детей 13 лет (то есть вдвое старше его). Справился даже с такой, которую до него не смог решить ни один ребенок.
Нажмите, чтобы раскрыть...

По возвращении в Нью-Йорк в октябре 1922 года — Сэму еще не исполнилось 11 — он впервые принял участие в турнире мастеров, где играли такие корифеи, как Осип Бернштейн, Давид Яновский и Эдуард Ласкер. Мальчик показал превосходную игру; например, Ласкеру пришлось выжимать выигрыш в течение 70 ходов. А победа над Яновским — один из самых ярких эпизодов в биографии юного Решевского. Он был так взволнован и счастлив, что по дороге домой в такси не мог спокойно сидеть — то и дело подпрыгивал и пел.
Нажмите, чтобы раскрыть...

Впоследствии Решевский писал: «Уже в 6 лет шахматы были для меня как дыхание — естественной функцией, не требующей сознательных усилий. Правильные ходы приходили сами собой, как поступает воздух в легкие. Попробуйте объяснить кому-нибудь, как вы дышите, и вам станет ясно, почему мне так трудно было давать объяснения».
Нажмите, чтобы раскрыть...

И как Решевский подходит под Вашу теорию запоминания и понимания?

Benas · 13 сен 2020

nh2008 пишет: ↑

Сколько вычислений делает Альфа-зеро? И склько Стокфиш?
Нажмите, чтобы раскрыть...

Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает

nh2008 пишет: ↑

Вундеркинд Сэмми Решевский дает сеанс одновременной игры седобородым господам. Фотография сделана в 1920 году, когда Сэмми было всего восемь лет.
Нажмите, чтобы раскрыть...

http://kasparovchess.crestbook.com/threads/8218/

nh2008 пишет: ↑

И как Решевский подходит под Вашу теорию запоминания и понимания?
Нажмите, чтобы раскрыть...

Так он и есть точьная демонстрация той теорий , только что она - не моя

Есть много людей которые чем то владеют просто так... вот мой однокласник читал очень быстро ( примерно 1500 слов в минуту или 7-8 стандартных книжных страниц ) - увидев такое в детстве не особо обращал внимание, однако попозже начал интересоваться как так...начал расспрашивать как он это делает - он немог этого обьяснить... для него это было - натурально...

Однако все это подтолкнуло меня попытаться разузнать про такое явление больше и попытаться этому научиться, просто так как я много читал - более быстрое чтение просто экономило бы мне кучу времени. Ну и научилься... и даже какое то время читал курс в университете для библиотекарей...

Потом как то потребование к этому упало .... однако на других языках мне неособо удавалось это применять - по крайней мере скорость была значительно меньше...

Словом есть люди в любой сфере - двух типов , можно назвать - вундеркинды предмета и ... остальные. Зубрежка и запоминание - это для тех остальных...

Однако именно те, чуть ли не механические действия - понемножку дает им то, что имеют те вундеркинды не понятно откуда... может из " прошлых жизней" ...

WinPooh · 13 сен 2020

Benas пишет: ↑

Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает
Нажмите, чтобы раскрыть...

А вы учли в этом расчёте, сколько вычислительных операций уходит у АльфаЗеро на одно обращение к нейросети за оценкой? Там матрицы перемножать надо о-го-го какого размера. А потом ещё всякие сигмоиды и тангенсы гиперболические вычислять, тоже в большом количестве. Просто эти вычисления производятся не на CPU, а на отдельном устройстве. Бесплатного сыра не бывает, алгоритмическую сложность шахмат как математической задачи под ковёр не спрятать.

SKY · 13 сен 2020

Benas пишет: ↑

Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает
Нажмите, чтобы раскрыть...

Давно уже не побеждает.

Benas · 13 сен 2020

WinPooh пишет: ↑

А вы учли в этом расчёте, сколько вычислительных операций уходит у АльфаЗеро на одно обращение к нейросети за оценкой?
Нажмите, чтобы раскрыть...

Самое важное чтоб вы не забыли , о чем разговор и чтоб небыло такого :
первый- "это - белое"
Второй - " да ты - дурак и не понимающий - это же - белое !"
первый - " да что ты чушь несешь - это ведь белое..."

Суть то не в том, кто больше тренировалься, чтоб дойти до какого то уровня или решения. Важен сам факт достижения и почему бывает такое, что люди сами себе мешают достичь - чего то....

SKY пишет: ↑

Давно уже не побеждает.
Нажмите, чтобы раскрыть...

Пока за этим следил - побеждало...и впринципе в одни ворота...

Такое впечатление, что вы почему то настроены против Альфы да и вообще против использования нейросетей...

SKY · 13 сен 2020

Benas пишет: ↑

Такое впечатление, что вы почему то настроены против Альфы
Нажмите, чтобы раскрыть...

Да,немного против,может от того что не достаточно понимаю как они работают,мне кажется,что сети занимаются вспоминанием,а не думанием,в отличии от традиционных движков,поэтому конечно традиционные нравятся больше.Понравится ли вам например "игра" программы какой нибудь когда будут просчитаны все ходы в шахматах и программа просто будет рыться в базе выбирая нужный ход?

Benas · 13 сен 2020

SKY пишет: ↑

Понравится ли вам например "игра" программы какой нибудь когда будут просчитаны все ходы в шахматах и программа просто будет рыться в базе выбирая нужный ход?
Нажмите, чтобы раскрыть...

Так вроде игра Стокфиша больше подходит под это описание...он ведь до какого то момента перебирает все возможные варианты и только потом отсеивает.
А вот Альфа должна отбрасывать очевидно неверные продолжения гораздо раньше...
При том у Альфы скорее всего - другой алгоритм оценки...Но мне кажеться что у Стокфиша оценка более исскуственная...

SKY · 13 сен 2020

Benas пишет: ↑

мне кажеться что у Стокфиша оценка более исскуственная.
Нажмите, чтобы раскрыть...

Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур и т.д.,а потом уже просчитывает что будет дальше перебирая варианты которыми может ответить соперник и свои ответы на них,точно как и люди.

WinPooh · 14 сен 2020

SKY пишет: ↑

Benas пишет: ↑

мне кажеться что у Стокфиша оценка более исскуственная.
Нажмите, чтобы раскрыть...

Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур и т.д.,а потом уже просчитывает что будет дальше перебирая варианты которыми может ответить соперник и свои ответы на них,точно как и люди.
Нажмите, чтобы раскрыть...

Чем-то напоминает рассуждение о том, что больше похоже на птицу - самолёт или вертолёт. На первый взгляд кажется, что самолёт. Хотя правильный ответ - они все слишком разные.
В рамках этой аналогии хотелось бы также взглянуть на то, что в мире шахматных движков аналогично дирижаблю.

nn · 14 сен 2020

SKY пишет: ↑

Benas пишет: ↑

мне кажеться что у Стокфиша оценка более исскуственная.
Нажмите, чтобы раскрыть...

Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур и т.д.,а потом уже просчитывает что будет дальше перебирая варианты которыми может ответить соперник и свои ответы на них,точно как и люди.
Нажмите, чтобы раскрыть...

У Стокфиша тоже нейронная сеть.

nh2008 · 14 сен 2020

WinPooh пишет: ↑

Benas пишет: ↑

Альфа делает сотни если не тысячи раз меньше чем Стокфиш...и его побеждает
Нажмите, чтобы раскрыть...

А вы учли в этом расчёте, сколько вычислительных операций уходит у АльфаЗеро на одно обращение к нейросети за оценкой? Там матрицы перемножать надо о-го-го какого размера. А потом ещё всякие сигмоиды и тангенсы гиперболические вычислять, тоже в большом количестве. Просто эти вычисления производятся не на CPU, а на отдельном устройстве. Бесплатного сыра не бывает, алгоритмическую сложность шахмат как математической задачи под ковёр не спрятать.
Нажмите, чтобы раскрыть...

И я об этом.

—- добавлено: 14 сен 2020 —-

nn пишет: ↑

У Стокфиша тоже нейронная сеть.
Нажмите, чтобы раскрыть...

А кто больше элементарных операций производит для нахождения хода? Не в процессе обучения, а в процессе игры.

Benas · 14 сен 2020

SKY пишет: ↑

Как раз наоборот,сети обучаются,а потом вспоминают партии ассоциативно,а AB движки рассуждают как человек,то есть оценивают расстановку фигур,их количество зная вес фигур
Нажмите, чтобы раскрыть...

Так то так, я как раз это и имел ввиду. Но суть то в том что эта оценка - просто записанна в программе, а вот Альфа просто считает каков % путей ведет к победе, к ничьей , к поражению - словом у нее нет какой то цыфровой оценки позиций а есть процентальная.

nn пишет: ↑

У Стокфиша тоже нейронная сеть.
Нажмите, чтобы раскрыть...

может быть...

Скорее всего ни один из дискутирующих не залезал в код любой из тех программ. Вообще то под Стокфиш я подразумевал -все или большинство возможных вариантов перебирающую программу , то есть пока по заданным критериям оценка не выходит за какие то рамки. Предпологаю , что похоже действует Стокфиш. Но натурально что и там перцептроны используеться

Как действует Альфа мне не ясно до сих пор, хотя я и занимаюс тем, что создаю алгоритмы и для нейронных сетей, правда очень простых. Однако как она может работать - представляю.

Вот как раньше 5-7 лет назад работал Стокфиш, то основная разница его с Альфой ( нейросетью ) была в том , что без сети правильного решения можно и не найти а принять некое как - правильное просто из за того что плохо составлена оценочьная функция. ( в реале то никто не знает какова она должна быть )
А вот нейросеть поступает немножко по другому и поэтому если есть например ход лучше других - то при наличий достаточьного времени она ее обязательно - найдет...

nn · 14 сен 2020

nh2008 пишет: ↑

А кто больше элементарных операций производит для нахождения хода? Не в процессе обучения, а в процессе игры.
Нажмите, чтобы раскрыть...

A0 и намного, порядка на 3. У него было четыре TPU, не знаю какого поколения. Но второго 45 терафлопс.
А позиций стокфиш просматривает больше. На сегодняшних типичных компьютерах тоже порядка на 3. У А0 сеть просто значительно больше и сложнее, и ее расчет занимает много времени.

SKY · 14 сен 2020

nn пишет: ↑

У Стокфиша тоже нейронная сеть
Нажмите, чтобы раскрыть...

Сейчас да,но как помощник в оценке,но когда рукописная оценка сравняется с реальным опытом по точности,а это в любом случае когда-то случится,надобность в сети как в помощьнике отпадет.

—- добавлено: 14 сен 2020 —-

Benas пишет: ↑

просто записанна в программе
Нажмите, чтобы раскрыть...

Как и в наших головах.Ферзь 9,ладья 5 слон 3...

nn · 14 сен 2020

SKY пишет: ↑

Сейчас да,но как помощник в оценке,но когда рукописная оценка сравняется с реальным опытом по точности,а это в любом случае когда-то случится,надобность в сети как в помощьнике отпадет.
Нажмите, чтобы раскрыть...

В стокфиш сейчас сеть используется вместо оценочной функции (в смысле точно также, ничего дополнительного), написанной ранее вручную. Несколько медленнее (в зависмости от CPU от 10% до 50% медленнее, на старых может даже еще медленнее), но значительно точнее.
Вряд ли догонит. Просто никто не будет этим заниматься, если сеть можно научить очень быстро. Да и в последнее время изменения в оценочной функции давали, наверно, лишь 10 эло в год прироста. Дополнительные 100 эло не так просто получить.

Benas · 14 сен 2020

nn пишет: ↑

В стокфиш сейчас сеть используется вместо оценочной функции
Нажмите, чтобы раскрыть...

А здесь есть кто то, кто реально разбираеться как на А0 и ли Лиле организована нейро сеть ? Вернее как происходит обучение ?

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

SKY Учаcтник

Kalvados Старожил

Mustitz Заслуженный

Kalvados Старожил

WinPooh В.М.

Mustitz Заслуженный

Rom Старожил

Strat7 Учаcтник

Mustitz Заслуженный

nn Старожил

Mustitz Заслуженный

Benas Учаcтник

WinPooh В.М.

Mustitz Заслуженный

Crest Админ, МГ

Mustitz Заслуженный

WinPooh В.М.

nn Старожил

Benas Учаcтник

nh2008 Старожил

Benas Учаcтник

WinPooh В.М.

SKY Учаcтник

Benas Учаcтник

SKY Учаcтник

Benas Учаcтник

SKY Учаcтник

WinPooh В.М.

nn Старожил

nh2008 Старожил

Benas Учаcтник

nn Старожил

SKY Учаcтник

nn Старожил

Benas Учаcтник

Поделиться этой страницей