AlphaZero. Нейронная сеть играет в шахматы

Mellio · 11 дек 2017

Комсюк пишет: ↑

Mellio пишет: ↑

И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения.
Нажмите, чтобы раскрыть...

а Стокфиш не играл вообще
-4 Альфы чёрными это просто уничтожение, да

—- добавлено: 11 дек 2017 —-

ладно, пустое это... я ушёл
Нажмите, чтобы раскрыть...

а ну да, -15 белым из 50 это видимо очень близкий матч равных соперников

Хорошо жонглируем фактам

Vladruss · 11 дек 2017

Комсюк пишет: ↑

-4 Альфы чёрными это просто уничтожение, да
Нажмите, чтобы раскрыть...

Ну, недообучилась в процессе обучения, делов-то. Зато в других компонентах сильнее оказалась, чем Стокфиш.

Комсюк · 11 дек 2017

Mellio, а что насчёт 160 прироста с книгой?
Будем жонглировать?
Альфа у них умная и в плохие дебюты не пойдёт, а Сток - тупица, наступает на одни и те же грабли

Так дайте ему книгу, им же созданную, и всё

N1mTzo · 11 дек 2017

Комсюк пишет: ↑

Так дайте ему книгу, им же созданную, и всё
Нажмите, чтобы раскрыть...

И еще Камского в придачу не забудьте. Хотя, если А0 еще пару лишних часиков обучаться будет, то придется и Магнуса в помощники Вяленому звать.

Challenger Spy · 12 дек 2017

N1mTzo пишет: ↑

Хотя, если А0 еще пару лишних часиков обучаться будет, то придется и Магнуса в помощники Вяленому звать.
Нажмите, чтобы раскрыть...

Не придумывайте, много раз уже был график, который выходит на горизонталь. Они сначала попробовали обучать много-много часов(может дней), увидели тупик, откатились и озвучили "наша Альфа обучалась всего Х часов", где Х - выход на точку, в которой дальнейшая эффективность обучения падает в ноль )

Mellio · 12 дек 2017

Комсюк пишет: ↑

Mellio, а что насчёт 160 прироста с книгой?
Будем жонглировать?
Альфа у них умная и в плохие дебюты не пойдёт, а Сток - тупица, наступает на одни и те же грабли

Так дайте ему книгу, им же созданную, и всё
Нажмите, чтобы раскрыть...

Это прирост против самого себя, что сильно отличается допустим от реального прироста ELO против разноплановых соперников. Вы же сами это прекрасно понимаете. Если вы нашли дырку в дебютной игре стокфиша, поправите её вручную и пустите междусобойчик играть, конечно прирост будет ощутимый, это же битва с тенью. А вот против какого-то другого движка, который не совершает ошибку в этом месте, такая правка дебютной библиотеки не даст такого эффекта (он вообще может эту ветку не играть например).

Списывать разгром стока на дебют, посмотрев эти 10 партий, вы серьезно? Там по партиям видно огромную разницу в классе игры. Перекат в закрытой позиции в анти-берлине - это дебют что ли виноват? Это по вашему у A0 в дебютной книге та жертва фигуры на g6? Тут все также, как и у людей, можно получить перевес по дебюту, но вот реализовать его - это совсем другое дело.

Если уж на то пошло, можно еще добавить обучение A0 на партиях со стокфишем. Сейчас она просто сама с собой училась играть, а так еще и слабые места стокфиша выявит и будет идти на конректные типы позиции против него. В итоге получите разрыв грелки тузиком. Это уже будет как человеческая подготовка к конкретному сопернику.

tiger · 12 дек 2017

tiger пишет: ↑

Challenger Spy пишет: ↑

Много содержательного от программиста SuperZerror (из обсуждения на канале):
SuperZerror
.... Мой опыт построения таких алгоритмов говорит о том, что сложнее всего сделать сильную программу играя самим с собой. Ты неизбежно попадаешь на локальные минимумы, из которых почти невозможно вытащить самообучалку.
Нажмите, чтобы раскрыть...

Все-таки вероятность локального минимума у функции большого числа переменных близка к нулю. Проблема не минимумах, а в том что почти гарантировано попадание на локально почти плоскую часть. Алгоритмы поиска минимума часто не могут уйти вниз с плоских частей, хотя статистически (с очень большой вероятностью) это можно сделать по нескольким направлениям.
Нажмите, чтобы раскрыть...

FIBM пишет: ↑

Понял, вы вообще в этом ничего НЕ понимаете.
Нажмите, чтобы раскрыть...

Чтобы в точке, где градиент обращается в ноль был локальный минимум нужно чтобы все собственные значения Гессиана (матрицы вторых производных) были одного знака, положительными в данном случае. Если функция от N переменных, то вероятность этого 2 в степени -N. Так как у знака две равновероятных возможности.

Mellio · 12 дек 2017

Challenger Spy пишет: ↑

N1mTzo пишет: ↑

Хотя, если А0 еще пару лишних часиков обучаться будет, то придется и Магнуса в помощники Вяленому звать.
Нажмите, чтобы раскрыть...

Не придумывайте, много раз уже был график, который выходит на горизонталь. Они сначала попробовали обучать много-много часов(может дней), увидели тупик, откатились и озвучили "наша Альфа обучалась всего Х часов", где Х - выход на точку, в которой дальнейшая эффективность обучения падает в ноль )
Нажмите, чтобы раскрыть...

В шахматах выход ELO на насыщение не означает остановку прогресса. Из-за "ничейной смерти" вы никогда 5000 ELO не получите. Ничья с позиции силы, или когда всю игру изо всех сил боролись за ничью, дает те же пол-очка.

Вообще, я не хочу сказать, что стокфиш совсем уж плох. Обратите внимание на комментарии его разработчика. Он говорил именно о проценте ничьих. Действительно, если задаться целью, он может отсушить гораздо больше партий. Но в целом играет он намного слабее и тут ничего не сделать. Всему приходит время отправляться на свалку истории.

просроченый_кмс · 12 дек 2017

У меня где то завалялась старинная книга тензорный анализ, вот оно что оказывается) надо было читать хотя нихрена непонятно.

Gordon10 · 12 дек 2017

Baron пишет: ↑

А с лишним конем даже я обыграл бы боженьку (правда не уверен, но с лишним ферзем - это точно).
Нажмите, чтобы раскрыть...

С лишней легкой фигурой любой квалифицированный шахматист, например с 2300 и выше (а может и пониже) обыграет и Стока и А0 в сухую. Я умудрился пару раз делать ничью и то, когда смотрел в полгаза на экран, а вполглаза в ТВ. А вот уже с форой в 2 пешки, С А0, если все правда, боюсь человек может рассчитывать только на ничью.

sovaz1997 · 12 дек 2017

Mellio пишет: ↑

Challenger Spy пишет: ↑

N1mTzo пишет: ↑

Хотя, если А0 еще пару лишних часиков обучаться будет, то придется и Магнуса в помощники Вяленому звать.
Нажмите, чтобы раскрыть...

Не придумывайте, много раз уже был график, который выходит на горизонталь. Они сначала попробовали обучать много-много часов(может дней), увидели тупик, откатились и озвучили "наша Альфа обучалась всего Х часов", где Х - выход на точку, в которой дальнейшая эффективность обучения падает в ноль )
Нажмите, чтобы раскрыть...

В шахматах выход ELO на насыщение не означает остановку прогресса. Из-за "ничейной смерти" вы никогда 5000 ELO не получите. Ничья с позиции силы, или когда всю игру изо всех сил боролись за ничью, дает те же пол-очка.

Вообще, я не хочу сказать, что стокфиш совсем уж плох. Обратите внимание на комментарии его разработчика. Он говорил именно о проценте ничьих. Действительно, если задаться целью, он может отсушить гораздо больше партий. Но в целом играет он намного слабее и тут ничего не сделать. Всему приходит время отправляться на свалку истории.
Нажмите, чтобы раскрыть...

Если SF с нейросетью будет побежать SF без неё, в SF будет нейросеть. На данный момент времени это не так.

Jadn · 12 дек 2017

Mellio пишет: ↑

Хотелось бы напомнить уважаемой аудитории, которая тут до хрипоты спорит как дебютная книга даёт +9000 ELO стокфишу, что в препринте приведена статистика по 10 самым популярным человеческим дебютам и в каждом из них A0 сыграла по 100 партий с вяленным (50 белыми и черными, то есть всего 1100 партий включая 100 партий матча со свободным дебютом). И стокфиш был уничтожен везде, даже в B30 и B40 сицилианке, где A0 практически не играла с собой во время самообучения. Более интересно, что эти 10 дебютов составляли не более 30 % партий в конце самообучения, то есть еще 70 % игр тренировалось что-то другое.

И ELO рейтинг в шахматах "сжимается" при высоком уровне игры, так как ничейные тенденции все сильнее проявляются (это кстати в препринте отмечено). Такого например нет в Го, так как там нет ничьих в принципе.
Нажмите, чтобы раскрыть...

Mellio пишет: ↑

что эти 10 дебютов составляли не более 30 % партий
Нажмите, чтобы раскрыть...

30% на 5000 TPU это не так мало.

Mellio пишет: ↑

И стокфиш был уничтожен везде
Нажмите, чтобы раскрыть...

Уничтожен, но не так. Даже двухходовая книга уменьшила перевес на 20 пунктов ЭЛО.

Ну и самый главный довод: зачем было отнимать книгу, если всё так радужно? В неопытность или наивность разработчиков я не верю.

Комсюк · 12 дек 2017

Mellio пишет: ↑

Там по партиям видно огромную разницу в классе игры.
Нажмите, чтобы раскрыть...

а если Костальба опубликует 10 выигранных партий, будем петь оду Стокфишу?

Mellio пишет: ↑

Если уж на то пошло, можно еще добавить обучение A0 на партиях со стокфишем. Сейчас она просто сама с собой училась играть, а так еще и слабые места стокфиша выявит и будет идти на конректные типы позиции против него.
Нажмите, чтобы раскрыть...

и наоборот
Разрешит Гугл потренировать Вяленого?

Mellio пишет: ↑

В итоге получите разрыв грелки тузиком. Это уже будет как человеческая подготовка к конкретному сопернику.
Нажмите, чтобы раскрыть...

В итоге мы получим равный матч

N1mTzo · 12 дек 2017

Challenger Spy пишет: ↑

Не придумывайте, много раз уже был график, который выходит на горизонталь.
Нажмите, чтобы раскрыть...

Это был

, если что

Challenger Spy пишет: ↑

Они сначала попробовали обучать много-много часов(может дней), увидели тупик, откатились и озвучили "наша Альфа обучалась всего Х часов", где Х - выход на точку, в которой дальнейшая эффективность обучения падает в ноль )
Нажмите, чтобы раскрыть...

Нам это неизвестно, здесь только гадать можно. Но логично предположить то, что А0 можно еще улучшать для игры в шахматы, ведь Альфу, заточенную под го очень сильно "прокачали".

Комсюк · 12 дек 2017

Гударт ещё до матча в интервью предрекал Альфе 4000 Эло при дальнейшем развитии, Кауфман был скромнее

Мобуту · 12 дек 2017

Jadn пишет: ↑

Уничтожен, но не так. Даже двухходовая книга уменьшила перевес на 20 пунктов ЭЛО.
Нажмите, чтобы раскрыть...

В этом матче она бы уменьшила перевес намного сильнее, я думаю. Ведь отсутствием книжки целенаправленно пользовались для выявления наиболее неприятных дебютов, чтобы Стокфиш раз за разом их повторял. Вот для примера. Насколько сильно портит перфоманс в компьютерных шахматах обязаловка всегда идти чёрными на французскую защиту с Nc3 Nf6? Если навязвать это Стокфишу, то он, судя по статистике, сольёт со счётом + 39 = 11 -0. Если навязать это Альфачессу, то будет близко к равной борьбе. В одном случае - гроссмейстер бьёт слабого кмс, а во втором этот кмс перевоплощается в такого же гросса. Это уже не о 20 пунктах речь, а раз в десять побольше.

В матче, конечно же, французскую Стокфиш играл только чёрными. Вот такая фора.

Jadn · 12 дек 2017

Мобуту пишет: ↑

Ведь отсутствием книжки целенаправленно пользовались для выявления наиболее неприятных дебютов, чтобы Стокфиш раз за разом их повторял.
Нажмите, чтобы раскрыть...

Они писали, что учили на партиях с собой, и я им верю. Незаметно для неспециалистов подкорректировать условия финального испытания и прямое враньё это две большие разницы.

dom1n1k · 12 дек 2017

Jadn пишет: ↑

Ну и самый главный довод: зачем было отнимать книгу, если всё так радужно?
Нажмите, чтобы раскрыть...

Сколько стенаний в интернете, караул, обижают, гуглогопники 20 рублей эло отобрали.
Книгу отобрали потому, что их целью был не спортивный матч с розыгрышем коровы, а научное-техническое сравнение двух разнотипных алгоритмов. Разумеется, им было интересно сравнивать именно алгоритмы и оценочные функции, а не какие-то там таблицы. Таблицы они и в Африке таблицы - какой в них интерес? Всё абсолютно логично.

Комсюк · 12 дек 2017

Undying пишет: ↑

Комсюк пишет: ↑

Вчера или позавчера я ставил эту позу на полчаса по просьбе Локомотива
ход Кс4 был на первой линии с оценкой -1.18
Нажмите, чтобы раскрыть...

То есть Стокфиш начинает что-то подозревать на глубине порядка 50 полуходов. Ему не то, что взгляда на эту позицию недостаточно, а надо на 25(!) ходов вперед посчитать, чтобы качественно правильную оценку дать. Какие вам еще нужны доказательства, что Стокфиш хреново понимает такого типа позиции?
Нажмите, чтобы раскрыть...

И он таки не досчитал чуть дальше...
Адвансёры нашли

8/6k1/7p/2p1b1p1/4P3/1P1P2PP/r1P2RK1/8 w - - 3 50

Имеем "крепость".. Оценка примерно -1.90..
Но никакого прогресса: через 15-20-25 ходов те же -1.90 и та же позиция без движений пешек...
Stockfish предлагает аж четыре равноценных хода: 50. Re2, 50. Rd2, 50. Kf3, 50. Kh2...
Нажмите, чтобы раскрыть...

Сток пошёл 50.g4?

Jadn · 12 дек 2017

dom1n1k пишет: ↑

сравнивать именно алгоритмы и оценочные функции
Нажмите, чтобы раскрыть...

Оценочная функция СФ такая, чтобы оптимально играть в любой позиции с любым контролем времени. А АЗ настроена именно на начальную позу, и может даже контроль. Во всяких TCEC-ах тоже сравнивают алгоритмы, но тестируют на наборе позиций.

dom1n1k пишет: ↑

Всё абсолютно логично.
Нажмите, чтобы раскрыть...

Нет, ничего логичного тут нет. То, что вы это не понимаете, я верю, а вот в то, что этого не понимают создатели АЗ - не очень.

—- добавлено: 12 дек 2017 —-

Комсюк пишет: ↑

Адвансёры нашли

8/6k1/7p/2p1b1p1/4P3/1P1P2PP/r1P2RK1/8 w - - 3 50

Имеем "крепость".. Оценка примерно -1.90..
Но никакого прогресса: через 15-20-25 ходов те же -1.90 и та же позиция без движений пешек...
Stockfish предлагает аж четыре равноценных хода: 50. Re2, 50. Rd2, 50. Kf3, 50. Kh2...
Нажмите, чтобы раскрыть...

Что-то не пойму, а если король черных на c3 придёт? Без компа смотрю.

Комсюк · 12 дек 2017

Jadn пишет: ↑

Что-то не пойму, а если король черных на c3 придёт? Без компа смотрю.
Нажмите, чтобы раскрыть...

я сам об этом думаю... комп проверяет есть ли ж4 в кандидатах (пока трогать не буду)

—- добавлено: 12 дек 2017 —-

Комсюк пишет: ↑

Оценка примерно -1.90
Нажмите, чтобы раскрыть...

судя по всему, чем-то другим смотрели, Сток8 кажет -3 с копейками

Undying · 12 дек 2017

Neo94 пишет: ↑

Для такого и дают адекватный контроль времени - ну там час на партию, хотя бы.
А не минута на ход...
Нажмите, чтобы раскрыть...

Если для правильной оценки позиции требуется более 40 полуходов, то считать надо полуходов на 60. Чтобы опасную позицию обнаружить заблаговременно и просто на нее не идти. Час на партию здесь мало чем поможет.

N1mTzo · 12 дек 2017

Gordon10 пишет: ↑

С лишней легкой фигурой любой квалифицированный шахматист, например с 2300 и выше (а может и пониже) обыграет и Стока и А0 в сухую.
Нажмите, чтобы раскрыть...

Был подобный матч Комодо против FM Больцони (2189). Первая часть 1,5:1,5 завершилась, а во второй (через неделю) человек потренировался и разнес железку 3:0.

Gordon10 пишет: ↑

А вот уже с форой в 2 пешки, С А0, если все правда, боюсь человек может рассчитывать только на ничью.
Нажмите, чтобы раскрыть...

Ларри Кауфман устраивал и такие матчи. Если коротко, то без подготовки железка отлупила человека (GM 2450), а подготовившись, через несколько дней, он отомстил.

Комсюк · 12 дек 2017

Jadn пишет: ↑

Что-то не пойму, а если король черных на c3 придёт? Без компа смотрю.
Нажмите, чтобы раскрыть...

грубо не получится, пешка на е4 даст контру
Но крепости похоже нет, сейчас смотрю АСМом, чёрные расставятся и загонят белых в цугцванг, пешками придётся ходить по-любому

—- добавлено: 12 дек 2017, опубликовано: 12 дек 2017 —-

Комсюк пишет: ↑

комп проверяет есть ли ж4 в кандидатах (пока трогать не буду)
Нажмите, чтобы раскрыть...

у меня мелькнул на третьей строке, но вот у чувака

При ( 4ядра х 1гиг х MultiPV = 6 )
50. g4 - явный лидер: -2.66.. Остальное: -3.25
Нажмите, чтобы раскрыть...

Undying · 12 дек 2017

Комсюк пишет: ↑

грубо не получится, пешка на е4 даст контру
Нажмите, чтобы раскрыть...

Каким образом? Вроде план за черных Сd4, сгоняя ладью с линии f. Затем преодолеваем королем линию f. Потом слона можно снова на e5 вернуть, чтобы пешка e нигде пойти вперед пойти не могла. И королем на с3 идем.

N1mTzo · 12 дек 2017

Комсюк пишет: ↑

Но крепости похоже нет
Нажмите, чтобы раскрыть...

Что крепости нет видит и древний Гудини 1.5. А что вы вообще проверяете?

Комсюк · 12 дек 2017

N1mTzo пишет: ↑

А что вы вообще проверяете?
Нажмите, чтобы раскрыть...

одновременно 2 вещи
1. сделан ли ход g4 Стокфишем? Доказано.
2. есть ли крепость? Нет.

Valen548 · 12 дек 2017

Было интересно смотреть партии АльфаЗеро. Игра Стокфиша впечатлает не меньше чем А0. Сыграть 70 партий вничью из 100 против А0- вероятно примерно 70% партий Стокфиш проводит на математически корректном уровне. Компьютеры играют намного интереснее людей, хаххх.
Ждем А0 в массы.

dom1n1k · 12 дек 2017

Jadn пишет: ↑

Оценочная функция СФ такая, чтобы оптимально играть в любой позиции с любым контролем времени. А АЗ настроена именно на начальную позу, и может даже контроль. Во всяких TCEC-ах тоже сравнивают алгоритмы, но тестируют на наборе позиций.
Нажмите, чтобы раскрыть...

И что?
Повторю в сотый раз - целью разработчиков (на данном этапе) не была "спортивная справедливость", за которую тут уже несколько дней пятые точки полыхают. Их целю было сравнение алгоритмических подходов. Сравнение научно-техническое, а не спортивное. Если бы они хотели настоящего спорта, был бы разрекламированный матч по типу Седолевского.
А именно их интересовало: может ли их софтина выйти на качественно новый уровень "понимания" игры? Сколько там эло и позиций в секунду - вопрос второй. Главное это самое "понимание". И вроде бы всё выглядит так, что да, может. Вот это и есть главный результат. А всё прочее есть вторичные подробности, тоже по-своему любопытные, но вторичные. Ими (возможно) будут заниматься позднее, если авторы на новые темы не ускачут.

Jadn · 12 дек 2017

dom1n1k пишет: ↑

целью разработчиков (на данном этапе) не была "спортивная справедливость"
Нажмите, чтобы раскрыть...

Ну так запустили бы Стокфиш на телефоне. Еще более впечатляющий успех бы был.

Gridnev · 12 дек 2017

Jadn пишет: ↑

Ну и самый главный довод: зачем было отнимать книгу, если всё так радужно? В неопытность или наивность разработчиков я не верю.
Нажмите, чтобы раскрыть...

В общем, напоминает римского императора Коммода, который любил участвовать в грязных гладиаторских боях, забивая дубинкой на арене достойных соперников - больных и калек. Не могу не восхищаться игрой ИИ, но понимаю, что фору А0 дали неспроста, жаль не погоняли тестовые позиции. Осталось много вопросов. Что-то вытрясут рецензенты, а для полного понимания глубины приоткрывшейся бездны надо запастись терпением.

Мобуту · 12 дек 2017

Jadn пишет: ↑

Мобуту пишет: ↑

Ведь отсутствием книжки целенаправленно пользовались для выявления наиболее неприятных дебютов, чтобы Стокфиш раз за разом их повторял.
Нажмите, чтобы раскрыть...

Они писали, что учили на партиях с собой, и я им верю. Незаметно для неспециалистов подкорректировать условия финального испытания и прямое враньё это две большие разницы.
Нажмите, чтобы раскрыть...

А я им не верю даже в этом. Статья - рекламная, там бабки наверняка замешаны немалые. И не абы за что, а нужен сногсшибательный результат. Ради его достижения сделаешь и не такое. Заказчика наверняка всё устроит: подумаешь, побрюзжат там какие-то русскоязычные крестбуковцы. Доказать, потреблял ли Альфачесс "допинг" при подготовке или не потреблял, всё равно не смогут: баночки с мочой не осталось.

А весь мир тем временем будет глазеть на запертого ферзя h8 и обсуждать с придыханием, как гугловые нейросети выходят на новый уровень понимания всего и вся.

Mustitz · 12 дек 2017

Выскажу несколько своих соображений. Нейросеть даёт скорее всего не оценку данной позиции, а предлагает ходы-кандидаты. Потом партии доигрываются до конца (возможно до явного перевеса одной из сторон) и на основании статистики выбирается ход. Такой подход даёт преимущество программе в закрытых позициях, он распознаёт крепости, и позволяет оценивать долговременную инициативу за горизонтом счётных движков а-ля Стокфиша. Есть у него и минусы — позиций рассматривается меньше. Поэтому в острых позициях варианта Найдорфа, имхо, ощутимое преимущество будет у Стокфиша. Ибо там важен счёт и еще раз счёт, а возникновение крепостей маловероятно, и до эндшпиля надо дожить. С другой стороны нейросеть вполне способна избегать таких позиций, потому как при обучении результат партий будет рандомный, будет много поражений, и нейросеть вполне способна отбраковать такие варианты как рискованные.

Я не согласен с тем, что оценка Стокфиша это творение человеческих рук. Думаю, последние годы оценка Стокфиша развивалась исключительно в его матчах против себя самого и/или движков из топ. И партии с AlphaZero также могут её улучшить. Также партии Стокфиша с самим собой могут послужить для создания большой дебютной библиотеки также без участия человека. Чем не самообучение?

Было бы интересно, если бы разработчики Stockfish вызвали AlphaZero на дуэль матч по причине того, что команда AlphaZero не смогла правильно оттюнить движок. А условия матча могли бы быть разными: набор позиций или, что бы было ещё интересней, версии движков фиксируются. Каждая сторона собирает желело, дебютную книгу, таблицы Ломоносова и всё, что пожелает. После чего играется суперматч. Можно даже Комодо пригласить за компанию.

Valen548 · 12 дек 2017

Мобуту пишет: ↑

Jadn пишет: ↑

Мобуту пишет: ↑

Ведь отсутствием книжки целенаправленно пользовались для выявления наиболее неприятных дебютов, чтобы Стокфиш раз за разом их повторял.
Нажмите, чтобы раскрыть...

Они писали, что учили на партиях с собой, и я им верю. Незаметно для неспециалистов подкорректировать условия финального испытания и прямое враньё это две большие разницы.
Нажмите, чтобы раскрыть...

А я им не верю даже в этом. Статья - рекламная, там бабки наверняка замешаны немалые. И не абы за что, а нужен сногсшибательный результат. Ради его достижения сделаешь и не такое. Заказчика наверняка всё устроит: подумаешь, побрюзжат там какие-то русскоязычные крестбуковцы. А весь мир тем временем будет глазеть на запертого ферзя h8 и обсуждать с придыханием, как гугловые нейросети выходят на новый уровень понимания всего и вся.
Нажмите, чтобы раскрыть...

Вы что , шутите? Программа за несколько часов научилась играть на уровне Стокфиша. Сама , без внесения знаний и параметров. А Стокфиша программируют много лет.

Деньги у Гугла и Дипмайнда есть и так на миллиарды долларов, так что думать что они пытаются заработать на своей статье не стоит.

MS · 12 дек 2017

dom1n1k пишет: ↑

Повторю в сотый раз - целью разработчиков (на данном этапе) не была "спортивная справедливость", за которую тут уже несколько дней пятые точки полыхают. Их целю было сравнение алгоритмических подходов. Сравнение научно-техническое, а не спортивное.
Нажмите, чтобы раскрыть...

Главной целью был рекламный эффект. Результат, бкзусловно, выдающийся, но если ставить эксперимент корректно, то результата "за час обучения побили сильнейшую программу" не получишь. Корректный результа - "создана программа, которая легко бьёт человека и достаточно сильна среди движков".
С помощью подкручивания параметров эксперимента создан большой медийный эффект, к корректной научной работе не имеющий отношения.
Это печально, для тех кто что-то понимает в предмете, но чувства мизерной части аудитории гугл не волновали.
Увы, "цель оправдывает средства". И подрывает авторитет гугла. Очередной прорыв со стороны гугла будет восприниматься с бОльшим скептицизмом.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

Mellio Новичок

Vladruss НедоКМС, победитель второразрядников.

Комсюк народный модератор

N1mTzo Учаcтник

Challenger Spy Технический специалист

Mellio Новичок

tiger Новичок

Mellio Новичок

просроченый_кмс Старожил

Gordon10 Учаcтник

sovaz1997 Учаcтник

Jadn Заслуженный

Комсюк народный модератор

N1mTzo Учаcтник

Комсюк народный модератор

Мобуту спаситель нации

Jadn Заслуженный

dom1n1k Учаcтник

Комсюк народный модератор

Jadn Заслуженный

Комсюк народный модератор

Undying Учаcтник

N1mTzo Учаcтник

Комсюк народный модератор

Undying Учаcтник

N1mTzo Учаcтник

Комсюк народный модератор

Valen548 Новичок

dom1n1k Учаcтник

Jadn Заслуженный

Gridnev Старожил

Мобуту спаситель нации

Mustitz Заслуженный

Valen548 Новичок

MS Михаил Семионенков

Поделиться этой страницей