AlphaZero. Нейронная сеть играет в шахматы

WinPooh · 21 дек 2017

NS пишет: ↑

немного эвристик типа SEE
Нажмите, чтобы раскрыть...

А интересно, в SEE она использует заранее заданные стоимости фигур, или те, которые насчитала в процессе обучения?

NS · 21 дек 2017

Скорей всего все-таки не использует SEE. ИМХО написано так, что путает человека плохо владеющего английским.

Mustitz · 21 дек 2017

NS пишет: ↑

немного эвристик типа SEE
Нажмите, чтобы раскрыть...

А что это за зверь, потому что Google показывает кучу слов see...

WinPooh · 21 дек 2017

Mustitz пишет: ↑

NS пишет: ↑

немного эвристик типа SEE
Нажмите, чтобы раскрыть...

А что это за зверь, потому что Google показывает кучу слов see...
Нажмите, чтобы раскрыть...

Static Exchange Evaluation
Быстрое вычисление стоимости размена фигур на каком-то одном поле, без построения обычного дерева перебора.
Может использоваться для сортировки ходов, отсечений и т.д.
https://chessprogramming.wikispaces.com/Static+Exchange+Evaluation

sovaz1997 · 21 дек 2017

NS пишет: ↑

Скорей всего все-таки не использует SEE. ИМХО написано так, что путает человека плохо владеющего английским.
Нажмите, чтобы раскрыть...

Там если и есть SEE, то несколько модифицированное. Нейронная сеть, возможно, сама выбирает, как лучше сортировать размены.

Fruit · 21 дек 2017

cs111g пишет: ↑

Fruit пишет: ↑

Поэтому, наверняка, сильнее 54. Bd5
Нажмите, чтобы раскрыть...

PS: А вы не подскажите, как в оболочке Fritz копировать варианты ходов из нотации?
Нажмите, чтобы раскрыть...

У меня далеко не последние версии фрица. В одном это Редактировать - Копировать - Скопировать игру, в другом Edit - Copy game. Да!.... еще, предварительно, я делаю вариант главным и удаляю все варианты.

Осипов Юрий · 21 дек 2017

А зачем нейронной сети какой-то убогий SEE ?
Посмотрел на позицию, распознал её, и с разменами всё ясно. Не нужно считать не только SEE, но и форсированные варианты.

cs111g · 21 дек 2017

Fruit пишет: ↑

Edit - Copy game
Нажмите, чтобы раскрыть...

Большое спасибо!
У меня Deep Fritz 14, и всё оказалось омерзительно просто: вкладка "Home" / кнопка "Copy Game" (ну и дальше текст партии в буфере обмена).

NeoNeuro · 22 дек 2017

Всем привет!
Прочитал https://arxiv.org/pdf/1712.01815.pdf. Много "воды", много общих слов, описывающих действительно колоссальные достижения искусственных нейронных сетей (ИНС), правда совсем непонятны детали.
Если кто-либо разобрался - помогите. Пример вопроса, ответить на который не смог - оценивает ли ИНС материал на доске самостоятельно?

Главное уместилось на странице номер 13:

Table S1: Input features used by AlphaZero in Go, Chess and Shogi respectively. The first set of features are repeated for each position in a T = 8-step history. Counts are represented by a single real-valued input; other input features are represented by a one-hot encoding using the specified number of binary input planes. The current player is denoted by P1 and the opponent by P2. The input to the neural network is an N × N × (MT + L) image stack that represents state using a concatenation of T sets of M planes of size N × N. Each set of planes represents the board position at a time-step t − T + 1, ..., t, and is set to zero for time-steps less than 1. The board is oriented to the perspective of the current player. The M feature planes are composed of binary feature planes indicating the presence of the player’s pieces, with one plane for each piece type, and a second set of planes indicating the presence of the opponent’s pieces. For shogi there are additional planes indicating the number of captured prisoners of each type. There are an additional L constant-valued input planes denoting the player’s colour, the total move count, and the state of special rules: the legality of castling in chess (kingside or queenside); the repetition count for that position (3 repetitions is an automatic draw in chess; 4 in shogi); and the number of moves without progress in chess (50 moves without progress is an automatic draw). Input features are summarised in Table S1. A move in chess may be described in two parts: selecting the piece to move, and then selecting among the legal moves for that piece. We represent the policy π(a|s) by a 8 × 8 × 73 stack of planes encoding a probability distribution over 4,672 possible moves. Each of the 8×8 positions identifies the square from which to “pick up” a piece. The first 56 planes encode possible ‘queen moves’ for any piece: a number of squares [1..7] in which the piece will be moved, along one of eight relative compass directions {N, NE, E, SE, S, SW, W, NW}. The next 8 planes encode possible knight moves for that piece.
Нажмите, чтобы раскрыть...

Мне эта тема интересна, см. https://neoneuro.com/ru/data-mining - первый алгоритм ИИ, который можно научить.. ходу шахматной фигуры. Не игре в шахматы на уровне МГ, даже не правилам шахматной игры, а лишь простым ходам, не более того. Учитывая личный опыт, интересно, что сделали в Google на эту тему. Google пошли немного иначе, проще. Они не стали учить программу шахматным ходам, заложили их сразу:

We represent the policy π(a|s) by a 8 × 8 × 73 stack of planes encoding a probability distribution over 4,672 possible moves. Each of the 8×8 positions identifies the square from which to “pick up” a piece. The first 56 planes encode possible ‘queen moves’ for any piece: a number of squares [1..7] in which the piece will be moved, along one of eight relative compass directions {N, NE, E, SE, S, SW, W, NW}. The next 8 planes encode possible knight moves for that piece.
Нажмите, чтобы раскрыть...

Фигуры в данном случае не используют принципы хода (вертикали, горизонтали, диагонали), а сразу используюся все возможные варианты - оказывается, всего возможно 4672 разных хода в шахматах.

На вход ИНС дают матрицу:

N × N × (MT + L) image stack that represents state using a concatenation of T sets of M planes of size N × N. Each set of planes represents the board position at a time-step t − T + 1, ..., t,..
Нажмите, чтобы раскрыть...

Кто разобрался, помогите - как они кодируют фигуру и какой же вектор на входе?
64 клетки, те. 64 числа, каждый из который может представлять из себя разный вид фигуры?

Пока впечатление такое:
В AlphaZero ИНС - это дополнение к обычному логическому шахматному алгоритму, который позволяет из 50 возможных ходов в каждой позиции выбрать десяток наиболее перспективных. То есть ИНС используется как интуиция человека, оптимизирующая поиск на базе предыдущего опыта. ИНС выбирает наиболее популярные ходы, которые встречались ранее в позициях, наиболее близких к заданной. Определение близких известных позиций на базе неизвестной - это нормальная задача для ИНС и для интуиции Человека. Но если бы это было именно так, то зачем писать о самообучаемости.. За 30 000 партий программа самообучилась до уровня ЭЛО 2000. 30 тыс. итераций - это очень мало для ИНС, обычно в нейросетях делаются тысячи проходов для обучения самым элементарным математическим задачам. А здесь такая бешеная эффективность.

Пока я считаю наиболее эпохальной задачей для ИИ будущего - возмоность полного обучения игре крестики-нолики (Tic tac toe). И в это время появляются статьи о том, что ИИ можно с нуля научить играть в шахматы до уровня, сильно превосходящего Человека... колоссальный разрыв уровней.
Я восхищаюсь достижениями Google, которые недавно смогли с нуля научить робота с ИНС открывать ручку двери.. задачка эта куда проще "крестиков-ноликов", но для ИНС - очень сложная.
Научить робота собирать яблоки, а не любой мусор с земли - это задача сложнейшая, но решить её с текущими технологиями - можно. Пока никто не решил. Научить робота игре в шахматы ... на мой взгляд - когда это действительно будет сделано, наше мнение об ИИ будет уже не таким важным, как мнение ИИ о нас.

NeoNeuro · 22 дек 2017

Здесь рассказываю о том, что такое искусственный интеллект и как отличить обычное устройство от думающего.
В частности, и пример с шахматами привожу.
Данные на входе алгоритма NeoNeuro понятны:
название_фигуры, x_откуда_пошли, y_откуда_пошли, x_куда_пошли, y_куда_пошли, можно_ли_ходить

Если обозначением пешки будет 6, то ход
e2-e4 это набор (вектор) чисел в интерфейсе ИНС (x и y считаю от единицы для удобства):
6, 5, 2, 5, 4, 1
добавляем невозможность хода e2-e5:
6, 5, 2, 5, 5, 0 (последний ноль - это невозможность хода)
и так далее.
программа изначально ничего о шахматах не знает, учится с нуля как младенец. Эти слова у AlphaZero похожи, НО - у них программа учится не шахматным правилам, а сразу "играть сильнее StockFish", при этом правила им "даны заранее" - как именно, пока загадка.

у AlphaZero видимо на вход имеется вектор в 64 числа с обозначениями фигур на каждом поле (делят ли они черные и белые или всё в одну цифру записывают - интересно), плюс ход как цифра от 1 до 4672.
Как они узнают - возможен ли ход или нет? Учитывая, что про алгоритмы обучения правилам шахмат они не говорят, можно предположить, что для этого используется обычный жёсткий шахматный алгоритм.

То, что шахматная программа, использующая ИНС для оценки позиций играет сильнее программы, которая их не использует - я вполне могу поверить и понять, как это работает. Но специалисты AlphaZero пишут, что их алгоритмы совсем не похожи на алгоритмы движков (которые они описали в статье более подробно).

zeroalphazero · 22 дек 2017

Попытался в максимально упрощенном виде сделать слепок зафиксированных до сегодняшнего дня оценок движков пользователей ChessBase.
Почему начал с 13-го хода? — думаю, не стоит объяснять.
Обратите внимание на удивительную "прозорливость" Komodo! Видимо, пользователь вел из конца к началу, что, по-моему, правильно для поиска ошибок, но вряд ли говорит о превосходстве движка над другими.
AlphaZero — Stockfish 8

13.Nc3 Nxc3
[13...Bf6 14.Nxd5 cxd5 15.Ne3 Na6
a) 15...Nc6 16.Nxd5 Re8 (16...Be5) ;
b) 15...Nd7 16.Nxd5 Nc5 (16...Bxd5) ;
16.Nxd5 Nc5 1/2 (16) Bobras,P (2565)-Macieja,B (2600) Germany 2008
17.Rb1 Rc8 (17...Ba6) и т.д. — последний писк из компьютерного творчества до эпохи AlphaZero;
13...Na6 14.Nxd5 cxd5 15.Bxd5 Bxd5 16.Qxd5 Bf6 17.Qf3 Nc5 18.Rd1 Qe8 19.Nh6+ Kh8 20.Ng4 Be7 21.Bf4 Ne6 22.Rd5 f5 23.Ne5 Rd8 24.Rxd8 Bxd8 25.Rd1 Bf6 26.Nd7 Nd4 27.Rxd4 Bxd4 28.Nxf8 Qxf8 29.b3 h6 30.Kg2 Kh7 31.h4 Qc5 32.h5 b5 33.g4 fxg4 34.Qe4+ Kh8 35.Qe8+ Kh7 36.Qg6+ Kh8 37.Qe8+ Kh7 1/2 (37) Ramakrishna,J (2224)-Kathmale,S (2334) Chennai 2013]

14.Qg4!N
[14.bxc3 Bf6 15.Qc2 Nd7 16.Rd1 Qc7 17.Bf4 Ne5 18.Nd6 Rad8 19.Nxb7 Qxb7 20.Be4 g6 21.Qe2 Qe7 22.Be3 Qe6 23.Bh6 Rfe8 24.Bg2 Qf5 25.Rxd8 Rxd8 26.Re1 Qd3 27.Qxd3 Nxd3 28.Rd1 c5 29.c4 Ne5 30.Rxd8+ Bxd8 31.Bd5 g5 32.f4 Ng4 33.fxg5 Ne3 34.Be4 Nxc4 35.h4 Nd6 36.Bc2 b5 37.Kf2 Bb6 38.Kf3 c4 39.h5 Bd4 40.g6 hxg6 41.Bf4 Nf5 42.hxg6 fxg6 43.g4 Ne7 44.Ke4 Bg7 45.Bd6 Kf7 46.Bc5 a6 47.a4 Ke6 48.axb5 axb5 49.Bxe7 Kxe7 50.Kd5 Kf6 1/2 (50) Schumacher,N (2191)-Hanisch,S (2075) Germany 2016;
14.bxc3 Bc8 15.Nxe7+ Houdini 6.03 x64/MedusaV4 0.08/31 ;
14.Qg4 Bf6 15.bxc3 Komodo 11.2.2 64-bit/MedusaV4 1.38/25 ;
14.bxc3 Bc8 15.Nxe7+ Stockfish 8 0.06/42 ]

14...g6
[14...Bf6]
15.Nh6+
[15.bxc3 h5 16.Qe2 Stockfish 181117/Omavein 0.08/53 ;
15.bxc3 Bc8 16.Nxe7+ Komodo 11.2.2 64-bit/MedusaV4 1.73/24 ;
15.Nh6+ Kg7 16.bxc3 Komodo 11.2.2 64-bit/MedusaV4 2.71/21 ]
15...Kg7 16.bxc3
[16.bxc3 Bc8 17.Qa4 Komodo 11.2.2 64-bit/MedusaV4 1.93/24 ;
16.Nf5+ Kg8 17.bxc3 Komodo 10.3 64-bit 0.00/35 ;
16.Nf5+ Kg8 17.bxc3 Stockfish 181117/Omavein 0.08/47 ]
16...Bc8 17.Qf4
[17.Qf4 Bc5 18.h4 Komodo 11.2.2 64-bit/MedusaV4 1.50/22 ;
17.Qf4 Qd6 18.Qf3 Houdini 6 x64/TwoKnights -0.09/29 ;
17.Qf4 Qd6 18.Qf3 New Engine/MedusaV4 -0.17/24 ]
17...Qd6
[17...Qd6 18.Qa4 g5 Stockfish 181117/Omavein 0.00/40 ;
17...Be6 18.Be3 Bc5 Komodo 11.2.2 64-bit/MedusaV4 1.32/23 ;
17...Qd6 18.Qa4 g5 Houdini 6 x64/TwoKnights -0.02/30 ]
18.Qa4
[18.Qa4 g5 19.Ng4 Houdini 6 x64/TwoKnights 0.00/34 ;
18.Qa4 Na6 19.Bf4 Komodo 11.2.2 64-bit/MedusaV4 1.87/24 ;
18.Qa4 Rd8 19.Re1 New Engine 0.00/43 ]
18...g5
[18...Rd8]
19.Re1!! Kxh6 20.h4
[20.h4 f6 21.Be3 Stockfish 8 0.00/40 ;
20.h4 f6 21.Be3 Komodo 11.2.2 64-bit/MedusaV4 2.95/25 ;
20.h4 f6 21.Rxe7 Komodo 8 64-bit -0.52/25 ]
20...f6
[20...f6 21.Be3 Bf5 Stockfish 111217/Omavein 0.00/54 ;
20...f6 21.Rxe7 Qxe7 Houdini 5.01 x64/Ziegler -0.68/30 ;
20...f6 21.Be3 Kg7 Komodo 11.2.2 64-bit/MedusaV4 2.94/25 ]
21.Be3 Bf5
22.Rad1! Qa3
[22...Qa3 23.hxg5+ fxg5 Stockfish 111217/schacuzi 0.00/43 ;
22...Qa3 23.Qd4 Kg7 Komodo 11.2.2 64-bit/MedusaV4 2.99/23 ;
22...Qa3 23.hxg5+ fxg5 Stockfish 051217/DerAmateur121 0.00/38 ]
23.Qc4
[23.hxg5+ fxg5 24.Qh4+ Stockfish 8 0.00/35 ;
23.Qd4 Na6 24.hxg5+ Komodo 11.2.2 64-bit/MedusaV4 -0.17/42 ;
23.hxg5+ fxg5 24.Qh4+ Stockfish 181117/Omavein 0.00/49 ]
23...b5
[23...Kg7!? zeroalphazero ;
23...Nd7!? Мобуту ]
24.hxg5+!
[24.hxg5+ fxg5 25.Qh4+ Fritz 13 -0.35/29 ;
24.Qe2 Kg7 25.g4 Komodo 11.2.2 64-bit/MedusaV4 3.73/24 ;
24.hxg5+ fxg5 25.Qh4+ Fritz 15 0.00/19 ]
24...fxg5
[24...fxg5 25.Qh4+ Kg6 Fritz 11 SE 0.00/28 ;
24...fxg5 25.Qh4+ Kg6 Stockfish 111217/schacuzi 0.00/49 ;
24...fxg5 25.Qh4+ Kg6 Komodo 11.2.2 64-bit/MedusaV4 2.15/24 ]
25.Qh4+
[25.Qh4+ Kg6 26.Qh1 Komodo 11.2.2 64-bit/MedusaV4 2.02/24 ;
25.Qh4+ Kg6 26.Qh1 Stockfish 181117/Omavein 0.00/49 ;
25.Qh4+ Kg6 26.Qh1 Fritz 13 -0.53/26 ]
25...Kg6
[25...Kg6 26.Qh1 Kg7 Stockfish 181117/Omavein 0.00/50 ;
25...Kg6 26.Qh1 Kg7 Komodo 11.2.2 64-bit/MedusaV4 1.97/25 ;
25...Kg6 26.Qh1 Kg7 Stockfish 8 0.00/38 ]
26.Qh1
[26.Qh1 Kg7 27.Bc1 Stockfish 181117/Omavein 0.00/51 ;
26.Qh1 Kg7 27.Bc1 Stockfish 8/Two80 0.00/32 ;
26.Qh1 Kg7 27.Be4 Komodo 11.01 64-bit/Pacificrabbit 0.31/36 ]
26...Kg7 27.Be4!
[27.Bc1=]
27...Bg6
[27...Bg6 28.Bxg6 hxg6 Stockfish 8 0.00/52 ;
27...Bg6 28.Bxg6 hxg6 Komodo 10 64-bit 0.00/34 ;
27...Bxe4 28.Qxe4 Kg8 Stockfish 051217 0.29/42 ]
28.Bxg6
[28.Bxg6 hxg6 29.Bc1 Stockfish 8 0.00/45 ;
28.Bxg6 hxg6 29.Qh3 Komodo 11.2.2 64-bit/MedusaV4 2.71/25 ;
28.Bxg6 hxg6 29.Bc1 Deep Fritz 13/Cux 0.00/21 ]
28...hxg6
[28...hxg6 29.Bc1 Qc5 Stockfish 8/M_Bechmann 0.00/46 ;
28...hxg6 29.Bc1 Qc5 Stockfish 111217/schacuzi 0.00/50 ;
28...hxg6 29.Qh3 Bf6 Komodo 11.2.2 64-bit/MedusaV4 2.78/26 ]
29.Qh3 Bf6
[29...Bf6 30.Kg2 Qxa2 Stockfish 111217/schacuzi 0.00/50 ;
29...Bf6 30.Kg2 Qxa2 Stockfish 111017 0.00/43 ;
29...Bf6 30.Kg2 Rh8 Stockfish 171217/Voodoo Master 0.97/41 ]
30.Kg2
[30.Kg2 Qxa2 31.Rh1 Stockfish 111217/Omavein 0.75/58 ;
30.Kg2 Qxa2 31.Rh1 Stockfish 181117 0.00/48 ;
30.Kg2 Qxa2 31.Rh1 New Engine 0.00/49 ]
30...Qxa2
[30...Rh8 31.Qg4 Rf8 Stockfish 111217/Omavein 1.44/64 ;
30...Qxa2 31.Rh1 Qg8 Houdini 6.02 x64 0.00/43 ;
30...Rh8 31.Qg4 Rf8 New Engine/Crow 0.81/52 ]
31.Rh1
[31.Rh1 Qg8 32.c4 Stockfish 111217/Omavein 1.50/53 ;
31.Rh1 Qg8 32.Rd6 Houdini 6.02 x64 0.00/43 ;
31.Rd6 Be5 32.Rh1 Stockfish 8/Kikouyou 0.00/38 ]
31...Qg8
[31...Qg8 32.Rd6 Re8 Stockfish 111217/Omavein 2.22/54 ;
31...Qg8 32.Rd6 Re8 Houdini 6.02 x64 0.00/43 ;
31...Qg8 32.c4 a5 Stockfish 061217/Omavein 1.39/37 ]

32.c4!!
[32.Rd6 Re8 33.c4 Stockfish 181117/Omavein 2.32/59 ;
32.Rd6 Be5 33.Re6 Houdini 6.03 x64/G A R G A M E L 1.07/45 ;
32.c4 Re8 33.Rd6 Komodo 11.2.2 64-bit 1.62/38 ]
32...Re8
[32...Re8 33.Rd6 Be5 Stockfish 181117/Omavein 2.58/50 ;
32...a5 33.Rd6 bxc4 Houdini 6.03 x64/Pacificrabbit 1.76/38 ;
32...c5 33.Bxc5 Re8 Stockfish 171217 0.98/40 ]
33.Bd4!!
[33.Rd6 Be5 34.Bd4 Stockfish 181117/Omavein 2.73/58 ;
33.Bd4 Bxd4 34.Rxd4 New Engine 2.35/50 ;
33.Bd4 Bxd4 34.Rxd4 Stockfish 261116/aplusk 1.63/43 ]
33...Bxd4
[33...Bxd4 34.Rxd4 Rd8 Stockfish 181117/Omavein 2.73/51 ;
33...Bxd4 34.Rxd4 Stockfish 8/fair1play 1.27/35 ;
33...Rd8 34.Qh6+ Stockfish 111217 0.63/35 ]
34.Rxd4
[34.Rxd4 Rd8 35.Rxd8 Stockfish 8 1.89/42 ;
34.Rxd4 Rd8 35.Rxd8 Komodo 11.01 64-bit/lmcarter 1.03/28 ;
34.Rxd4 Re7 35.cxb5 Houdini 6.03 x64/Pacificrabbit 1.80/27 ]
34...Rd8
[34...Rd8 35.Rxd8 Qxd8 Stockfish 181117/Omavein 2.73/58 ;
34...Rd8 35.Rxd8 Qxd8 Houdini 6.03 x64/G A R G A M E L 1.65/42 ;
34...Rd8 35.Rxd8 Qxd8 Stockfish 171217 1.63/43 ]
35.Rxd8
[35.Rxd8 Qxd8 36.Qe6 Fritz 15 1.92/26 ;
35.Rxd8 Qxd8 36.Qe6 Stockfish 111217/schacuzi 2.20/49 ;
35.Rxd8 Qxd8 36.Qe6 Stockfish 181117/Omavein 2.80/60 ]
35...Qxd8
[35...Qxd8 36.Qe6 Nd7 Stockfish 8 2.41/52 ;
35...Qxd8 36.Qe6 Nd7 Stockfish 111217/schacuzi 2.32/48 ;
35...Qxd8 36.Qe6 Nd7 Houdini 4 x64 1.13/21 ]
36.Qe6!
[36.Qe6 Nd7 37.Rd1 Stockfish 111217/Neuron 2.15/42 ;
36.Qe6 Nd7 37.Rd1 Fritz 10 0.66/21 ;
36.Qe6 Nd7 37.Rd1 Stockfish 181117/Omavein 2.80/63 ]
36...Nd7
[36...Qc7 37.Qe8 Kf6 Stockfish 061217/Omavein 9.43/51 ;
36...Nd7 37.Rd1 Nc5 Stockfish 8/grautvornix 2.23/54 ;
36...Nd7 37.Rd1 Nc5 Houdini 6.02 x64 2.74/44 ]
37.Rd1
[37.Rd1 Nf8 38.Rxd8 Stockfish 061217/Omavein 132.26/64 ;
37.Rd1 Nf8 38.Rxd8 Stockfish 181117/Omavein 4.15/54 ;
37.Rd1 Houdini 6.03 x64/Pacificrabbit 6.59/36 ]
37...Nc5
[37...Nf8 38.Rxd8 Nxe6 Fritz 16 2.18/62 ;
37...Nc5 38.Rxd8 Nxe6 Stockfish 061217/Omavein 131.31/63 ;
37...Nf8 38.Rxd8 Nxe6 Houdini 6.03 x64/Pacificrabbit 6.35/40 ]
38.Rxd8
[38.Rxd8 Nxe6 39.Rxa8 Stockfish 181117/Omavein 5.70/62 ;
38.Rxd8 Nxe6 39.Rxa8 Stockfish 8/KOTLD 2.84/47 ;
38.Rxd8 Nxe6 39.Rxa8 Stockfish 070216 1.83/46 ]
38...Nxe6
[38...Nxe6 39.Rxa8 bxc4 Stockfish 181117/Omavein 5.85/57 ;
38...Nxe6 39.Rxa8 b4 Houdini 6.03 x64/Pacificrabbit 4.69/36 ;
38...Nxe6 39.Rxa8 Nd4 Stockfish 061217/Shazbat 1.62/34 ]
39.Rxa8
[39.Rxa8 bxc4 40.Rxa7+ Stockfish 181117/Omavein 5.93/61 ;
39.Rxa8 bxc4 40.Rxa7+ Stockfish 051217/DerAmateur121 3.02/57 ;
39.Rxa8 bxc4 40.Rxa7+ Houdini 6.03 x64/Pacificrabbit 4.40/34 ]
39...Kf6
[39...b4 40.Rxa7+ Kf6 Stockfish 061217/Omavein 7.09/57 ;
39...bxc4 40.Rxa7+ Kf6 Fritz 15 2.08/30 ;
39...bxc4 40.Rxa7+ Kf8 Stockfish 171217/Voodoo Master 5.23/50 ]
40.cxb5
[40.cxb5 cxb5 41.Rxa7 Stockfish 181117/Omavein 132.61/90 ;
40.cxb5 cxb5 41.Kf3 Stockfish 111217/schacuzi 4.57/45 ;
40.cxb5 cxb5 41.Kf3 Stockfish 8/Leontxo 1.97/28 ]
40...cxb5
[40...cxb5 41.Rxa7 Ke5 Stockfish 181117/Omavein 132.62/89 ;
40...cxb5 41.Kf3 Nd4+ Stockfish 171217/Voodoo Master 132.52/49 ;
40...cxb5 41.Kf3 Ke5 Stockfish 050715 SSE/Software_012 1.74/36 ]
41.Kf3
[41.Rxa7 Ke5 42.Rb7 Stockfish 181117/Omavein 132.63/93 ;
41.Kf3 Ke5 42.Ke3 Houdini 6.03 x64/Pacificrabbit 4.93/32 ;
41.Kf3 Ke5 42.Ke3 Stockfish 111217/schacuzi 4.07/40 ]
41...Nd4+
[41...Ke5 42.Ke3 b4 Stockfish 8 7.34/46 ;
41...Ke5 42.Ke3 Kd5 Stockfish 181117/Omavein 132.54/75 ;
41...Nd4+ 42.Ke4 Nc6 Stockfish 171217/Voodoo Master 132.53/50 ]
42.Ke4
[42.Ke4 Nc6 43.Rc8 Stockfish 111217/schacuzi 5.21/39 ;
42.Ke4 Nc6 43.Rc8 Stockfish 181117/Omavein 132.58/59 ;
42.Ke4 Nc6 43.Rc8 Houdini 6.03 x64/Pacificrabbit 11.05/29 ]
42...Nc6
[42...Nc6 43.Rc8 Nb4 Stockfish 8 3.90/58 ;
42...Nc6 43.Rc8 Nb4 Stockfish 171217/Voodoo Master 132.05/45 ;
42...Nc6 43.Rc8 Houdini 6.03 x64/Pacificrabbit 10.02/30 ]
43.Rc8
[43.Rc8 Nb4 44.Rb8 Stockfish 061217/Omavein 132.55/71 ;
43.Kd5 Nb4+ 44.Kc5 Gull 3 x64/VadimR 2.07/30 ;
43.Rg8 a5 44.Rc8 Stockfish 8 2.28/41 ]
43...Ne7
[43...Nb4 44.Rf8+ Ke6 Komodo 11.01 64-bit/Pacificrabbit 4.44/46 ;
43...Ne5 44.Rc5 Nc4 Stockfish 181117/Omavein 132.61/71 ;
43...Nb4 44.Rc7 a6 Stockfish 171217/Voodoo Master 15.72/38 ]
44.Rb8
[44.Rc7 a5 45.Rb7 Stockfish 181117/Omavein 132.65/77 ;
44.Rb8 g4 45.Rxb5 Stockfish 111217/schacuzi 22.15/42 ;
44.Rb8 Ke6 45.Rxb5 Houdini 6.03 x64/Pacificrabbit 75.80/30 ]
44...Nf5
[44...g4 45.Rxb5 Ke6 Stockfish 111217/schacuzi 15.32/40 ;
44...Nf5 45.Ra8 Nd6+ Stockfish 8 6.61/48 ;
44...b4 45.Rxb4 Nc8 Stockfish 8 #41/46 ]
45.g4
[45.Kd5 Ne7+ 46.Kc5 Stockfish 221017 9.91/40 ;
45.g4 Nh6 46.f3 Houdini 6.03 x64/Pacificrabbit 148.75/41 ;
45.g4 Nh6 46.f3 Stockfish 8 #40/36 ]
45...Nh6 46.f3 Nf7 47.Ra8 Nd6+ 48.Kd5 Nc4 49.Rxa7 Ne3+ 50.Ke4 Nc4 51.Ra6+ Kg7 52.Rc6 Kf7 53.Rc5 Ke6 54.Rxg5 Kf6 55.Rc5 g5 56.Kd4
[56.Kd4 Na3 57.Kd3 b4 Stockfish 8 #24/69 ]
1-0

WinPooh · 22 дек 2017

Осипов Юрий пишет: ↑

А зачем нейронной сети какой-то убогий SEE ?
Посмотрел на позицию, распознал её, и с разменами всё ясно. Не нужно считать не только SEE, но и форсированные варианты.
Нажмите, чтобы раскрыть...

А не придётся ли для этого иметь нейросеть с информационной ёмкостью порядка числа вариантов шахматных партий? Типичные случаи разменов на одном поле, наверное, заучить можно. А вот с ФВ посложнее будет, нетривиальных случаев слишком много.
Опять же, чтобы обучить её таким разменам, надо чтобы в обучающей выборке за время игры с самой собой они все хотя бы по разу случились. А лучше не по разу...

nn · 22 дек 2017

NS пишет: ↑

Не знаю оффтоп ли тут Го,
но вот так играет на текущий момент сильнейшая версия Leela Zero
http://www.yss-aya.com/cgos/viewer.cgi?19x19/SGF/2017/12/18/332701.sgf
Тут она одержала победу черными.
Нажмите, чтобы раскрыть...

За прошедшую неделю согласно самотестированию сила игры Leela Zero увеличилась где-то на 1500 эло. Однако, эта цифра как-то плохо согласуется с рейтингом на этом сайте. Все еще не может обойти GnuGo. Возможно тесты с собой слишком растягивают шкалу, а также, что методика вычисления эло с доигрыванием прошедших sprt-тестов дает слишком большое систематическое отклонение.
Может, правда, последняя версия обойдет GnuGo, но игр пока мало.

Здесь интересно, что если судить по эло в играх со своими версиями, то скорость увеличения силы Leela Zero со значительно меньшей сетью соответствует AlphaGo Zero. Но непонятно, так ли это на самом деле.

Осипов Юрий · 22 дек 2017

WinPooh пишет: ↑

А не придётся ли для этого иметь нейросеть с информационной ёмкостью порядка числа вариантов шахматных партий? Типичные случаи разменов на одном поле, наверное, заучить можно. А вот с ФВ посложнее будет, нетривиальных случаев слишком много.
Опять же, чтобы обучить её таким разменам, надо чтобы в обучающей выборке за время игры с самой собой они все хотя бы по разу случились. А лучше не по разу...
Нажмите, чтобы раскрыть...

Но ведь умеет же AZ каким-то образом оценивать любые позиции, в том числе и те, которые она ни разу раньше не встречала.

WinPooh · 22 дек 2017

nn пишет: ↑

За прошедшую неделю согласно самотестированию сила игры Leela Zero увеличилась где-то на 1500 эло. Однако, эта цифра как-то плохо согласуется с рейтингом на этом сайте. Все еще не может обойти GnuGo.
Нажмите, чтобы раскрыть...

Но уже периодически стали появляться сообщения, что обыграна Aya на уровне 4 или 5 кю, да и люди в диапазоне однозначных кю уже время от времени проигрывают. Правда, чаще из-за какого-нибудь зевка.

I lost to LeelaZSlow (3k KGS)
Convincing win against 4k Aya!
LeelaZSlow defeats 6k on KGS

NS · 22 дек 2017

nn пишет: ↑

Все еще не может обойти GnuGo.
Нажмите, чтобы раскрыть...

Если не обращать внимания на глюк Gnugo с просрочкой - то в личном матче уже достоверно догнала Gnugo (Gnugo-3.7.10-a1 1800).
7 из 10, средний рейтинг 1873. Две сигмы на силу - нижняя граница 1800.
http://www.yss-aya.com/cgos/19x19/cross/LZ-7ba9d2-t1-p1600.html

zeroalphazero · 22 дек 2017

Осипов Юрий пишет: ↑

... умеет же AZ каким-то образом оценивать любые позиции, в том числе и те, которые она ни разу раньше не встречала.
Нажмите, чтобы раскрыть...

Моя любимица-Strelka, кстати, тоже умеет. И не только она.
Другое дело — КАК?!
Видимо, должен пояснить свой вопрос.
Есть "отмазка": русский — не мой родной, стараюсь излагать на нем-Великом, а думаю по-своему, уж простите, Христа-то ради...
Засим, скорректирую: меня (как пользователя) может совершенно не волновать вопрос типа "каким образом ОНИ иценивают", меня может интересовать лишь насколько правильно-точно.
А Монте-понте-там-Карло или Альфа-Бета — какая мне разница?!

Mustitz · 22 дек 2017

Ой, можно в качестве эксперимента заставить AlphaZero сыграть матч в шахматы Фишера со Стокфишем. Заодно увидим, как она оценивает незнакомые позиции, и насколько велика составляющая дебютной книги в её оценке.

А есть какие-то новости от создателей AlphaZero? Что-то они молчат... Могли бы 4TPU выделить на растерзание общественности

hornet · 22 дек 2017

NeoNeuro пишет: ↑

Всем привет!
Нажмите, чтобы раскрыть...

Народ, Вы видимо не врубились - Вас удостоил честью сам товарищ Чужакин (да-да, автор той самой, пока ещё не очень знаменитой системы). Он (наверное) знает о нейросетях гораздо больше вашего. Так что задавайте ему свои вопросы - и про железо для стока и остальное....

WinPooh · 23 дек 2017

Наконец-то нарисовали график рейтинга Leela Zero в нормальных координатах:

https://www.reddit.com/r/cbaduk/comments/7lnjhm/graph_of_leelazeros_cgos_bayes_elo/

WinPooh · 24 дек 2017

Сыграл партию с LeelaZeroSlow на КГС. Очень не хотелось войти в историю ещё одним вторым кю, проигравшим программе, поэтому действовать старался аккуратно...
http://eidogo.com/#3ZnXQgfed

nn · 24 дек 2017

NS пишет: ↑

Если не обращать внимания на глюк Gnugo с просрочкой - то в личном матче уже достоверно догнала Gnugo (Gnugo-3.7.10-a1 1800).
7 из 10, средний рейтинг 1873. Две сигмы на силу - нижняя граница 1800.
http://www.yss-aya.com/cgos/19x19/cross/LZ-7ba9d2-t1-p1600.html
Нажмите, чтобы раскрыть...

Да, 7ba оказалась более-менее нормальной по игре с GnuGo, даже если просрочки убрать. Но опять наблюдается то же самое. Новая версия 30f уже на 300 эло сильнее, чем 7ba по тестам с собой. Огромная цифра, но по игре на yss-aya не видно особого прогресса. Опять же набирает меньше против GnuGo. Если есть 30 эло прироста из этих 300, то хорошо.

P.S. А, ну собственно автор графика вверху о том же и говорит.

Rom · 24 дек 2017

Leela Zero, просчитывающая примерно 10 тысяч playouts на ход, вчера обыграла ayabot001 (бота уровня 4 кю), со счетом 7:5.
https://www.gokgs.com/gameArchives.jsp?user=LeelaZeroT

Michael-13 · 25 дек 2017

МФ Омариев: "AlphaZero - Революция В Шахматах! Google Меняет Мир"
https://www.youtube.com/watch?v=R5zQNmv7vNU

Benas · 25 дек 2017

WinPooh пишет: ↑

Сыграл партию с LeelaZeroSlow на КГС. Очень не хотелось войти в историю ещё одним вторым кю, проигравшим программе, поэтому действовать старался аккуратно...
Нажмите, чтобы раскрыть...

Ну возми программу отсюда
https://www.sjeng.org/leela.html
и покажи как ты ее обыграешь

WinPooh · 25 дек 2017

Benas пишет: ↑

WinPooh пишет: ↑

Сыграл партию с LeelaZeroSlow на КГС. Очень не хотелось войти в историю ещё одним вторым кю, проигравшим программе, поэтому действовать старался аккуратно...
Нажмите, чтобы раскрыть...

Ну возми программу отсюда
https://www.sjeng.org/leela.html
и покажи как ты ее обыграешь
Нажмите, чтобы раскрыть...

Со старыми версиями Лилы я полтора года назад баловался, иногда получалось очень смешно:
http://gokifu.com/share/2jra

Новые, конечно, на высших уровнях не обыграю, там на персоналке вполне честный 5-7 дан.
Я из программ регулярно только на телефоне с Crazy Stone играю, на плавающей форе. Она мне где-то 1-2 дан определяет, при своём максимуме в 5-й.

Benas · 25 дек 2017

WinPooh пишет: ↑

Со старыми версиями Лилы я полтора года назад баловался, иногда получалось очень смешно:
Нажмите, чтобы раскрыть...

Ну это не серьезно - это просто глюк в программе. Я вообще раньше с программами почти не играл а вот конда летом поставил ту Лилу, ту был удивлен , не то как она играет но том , что она очень маленькая программа и всегда вспоминал про то как говорили , что сделать программу которая играла бы хоть на первый дан - мощности офигенные нужны - оказываеться ничего такого не нужно...
Ну и вспомнил те слова последнего двухкратного чемпиона СССР Саши , что проснулься и понял как надо играть ... .
Начинаю в такое верить....

NS · 25 дек 2017

WinPooh пишет: ↑

Я из программ регулярно только на телефоне с Crazy Stone играю, на плавающей форе. Она мне где-то 1-2 дан определяет, при своём максимуме в 5-й.
Нажмите, чтобы раскрыть...

С "Crazy Stone Deep Learning"? Я думаю, покупать её или нет. Чем она лучше ChampionGo?
Бесплатная версия Deep Learning мне не понравилась.

WinPooh · 25 дек 2017

NS пишет: ↑

WinPooh пишет: ↑

Я из программ регулярно только на телефоне с Crazy Stone играю, на плавающей форе. Она мне где-то 1-2 дан определяет, при своём максимуме в 5-й.
Нажмите, чтобы раскрыть...

С "Crazy Stone Deep Learning"? Я думаю, покупать её или нет. Чем она лучше ChampionGo?
Бесплатная версия Deep Learning мне не понравилась.
Нажмите, чтобы раскрыть...

Бесплатную не смотрел. А в платной по сравнению с ChampionGo есть режим автоматического анализа партии (не очень удобный, правда) и уровни силы размечены по шкале кю-данов. Плюс рейтинговый режим, как во Фрице или Шредере - когда программа подстраивает свою силу под игрока. И, я так понимаю, движок обновлён - в оценке используется нейросеть, а в старой версии только MCTS был.

NS · 25 дек 2017

Я читал статьи Remi Coulom (когда писал свою UCT/MCTS программу в Symple) - у него с самого начала ОФ была в Crazy Stone, то есть уже не голый MCTS.

WinPooh · 25 дек 2017

NS пишет: ↑

Я читал статьи Remi Coulom (когда писал свою UCT/MCTS программу в Symple) - у него с самого начала ОФ была в Crazy Stone, то есть уже не голый MCTS.
Нажмите, чтобы раскрыть...

Я неточно выразился. Там была MTCS + классическая оценка. В новой версии добавилась оценка с нейросетью.
Кстати, пытался читать правила Symple, так ничего и не понял. Это вариант Го, где побеждает тот, у кого групп получилось меньше?

Rom · 25 дек 2017

Мне кажется, уже достаточно скоро можно будет просто скачать Sabaki, установить в неё нейросетку Leela Zero, подходящей силы, и играть сколько влезет. Даже фору устанавливать будет не нужно. Отчасти это возможно уже и сейчас.

WinPooh · 25 дек 2017

Rom пишет: ↑

Мне кажется, уже достаточно скоро можно будет просто скачать Sabaki, установить в неё нейросетку Leela Zero, подходящей силы, и играть сколько влезет. Даже фору устанавливать будет не нужно. Отчасти это возможно уже и сейчас.
Нажмите, чтобы раскрыть...

Текущая версия LeelaZero работает только с GPU, причём с достаточно новыми. На моём старом ноуте, например, запускаться она отказывается.

Rom · 25 дек 2017

WinPooh пишет: ↑

Текущая версия LeelaZero работает только с GPU, причём с достаточно новыми. На моём старом ноуте, например, запускаться она отказывается.
Нажмите, чтобы раскрыть...

Поэтому с нетерпением жду версию для CPU, которая уже на подходе. Кстати, вы наверное даже сможете скомпилировать её самостоятельно уже сейчас.

—- добавлено: 25 дек 2017, опубликовано: 25 дек 2017 —-

NS пишет: ↑

Я читал статьи Remi Coulom (когда писал свою UCT/MCTS программу в Symple) - у него с самого начала ОФ была в Crazy Stone, то есть уже не голый MCTS.
Нажмите, чтобы раскрыть...

Если я правильно понимаю, там использовалась автоматическая генерация шаблонов из партий профессионалов.

Кстати, если кому интересно почитать описание топовой "классической" Монте-Карловской программы, то рекомендую ознакомиться с диссертацией Айя Хуанга, где описывается его программа Эрика:
https://www.usgo.org/files/bh_library/Supercomputer Go Appendix Two.pdf

NS · 25 дек 2017

WinPooh пишет: ↑

NS пишет: ↑

Я читал статьи Remi Coulom (когда писал свою UCT/MCTS программу в Symple) - у него с самого начала ОФ была в Crazy Stone, то есть уже не голый MCTS.
Нажмите, чтобы раскрыть...

Я неточно выразился. Там была MTCS + классическая оценка. В новой версии добавилась оценка с нейросетью.
Кстати, пытался читать правила Symple, так ничего и не понял. Это вариант Го, где побеждает тот, у кого групп получилось меньше?
Нажмите, чтобы раскрыть...

Добавлено правило усложняющее жизнь программам - за один ход игрок делает несколько движений.
Хода два вида - свободный ход в точку не связанную со своими группами, либо расширение на один камень всех своих групп на поле. Белые играют первые. Черные для компенсации права выступки, если никто ни разу не расширялся, имеют право на ход которым сначала расширяет все свои группы, а потом ставят камень в свободное поле.

Камни с доски не снимаются, выигрывает тот, у кого больше камней на доске, и при этом меньше групп (группы лучше соединены). Количество очков каждого игрока - Количество камней на поле минус (количество групп)*6
http://archive.codecup.nl/2013/49/rules_symple.html
https://senseis.xmp.net/?Symple
В игре есть диллема - чтоб ставить больше камней нужно иметь больше групп, но при этом чем больше групп, тем больший штраф при подсчете очков. Ну и количество возможных ходов за одну сторону - может быть очень большим.

Войти или зарегистрироваться

AlphaZero. Нейронная сеть играет в шахматы

WinPooh В.М.

NS Нефёдов Сергей

Mustitz Заслуженный

WinPooh В.М.

sovaz1997 Учаcтник

Fruit Александр

Осипов Юрий Учаcтник

cs111g Начинающий

NeoNeuro Старожил

NeoNeuro Старожил

zeroalphazero Учаcтник

WinPooh В.М.

nn Старожил

Осипов Юрий Учаcтник

WinPooh В.М.

NS Нефёдов Сергей

zeroalphazero Учаcтник

Mustitz Заслуженный

hornet Учаcтник

WinPooh В.М.

WinPooh В.М.

nn Старожил

Rom Старожил

Michael-13 Господин

Benas Учаcтник

WinPooh В.М.

Benas Учаcтник

NS Нефёдов Сергей

WinPooh В.М.

NS Нефёдов Сергей

WinPooh В.М.

Rom Старожил

WinPooh В.М.

Rom Старожил

NS Нефёдов Сергей

Поделиться этой страницей