AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    А смысл? Устранится причина латанием следствий?
    Не являясь потомственным хранителем королевской печати и не претендуя на роль отца эмпиризма изобретателя 4-ого уровня защиты от дурака (poka-yoke), все же почему-то наивно верю в идею о безграничности прогресса развития человека...:sman:
    Знание — сила!
    Единоборство — один знает местечки, куда солома заблаговременно постелена, и остатком этой же соломы заманивает другого к краю, который тот не видит, т.е. не знает, что там — пропасть. Это честно?
    Ну кто, например, заставлял SF на первом ходу в интересующей Вас партии соблюсти симметрию, на втором от нее отказаться?
    Затем попытаться оспорить права на выгул слона по "большой дороге" — чтобы потом благополучно его запереть? Чертоводюжинной силы ход натыкается на одноходовую угрозу, успешно отраженную вводом в эксплуатацию второй "большой дороги", по которой под страхом смертной казни вынужден гулять король, сдавший свою печать в камеру хранения...
    Хранители хранят молчание, король и все остальные вконец сбиваются с пути,.. — занавес, приехали, оказывается.
    Не знали броду. Вместо светлого горизонта впереди ласковое журчание мутной воды и чья-то мельница...
    hornet and Комсюк like this.
  2. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    саботаж оператора таки присутствовал в матче
  3. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Ежели кого опять станут терзать смутные сомнения — рискну предложить скрасить досуг в муках творческого поиска.
    Вероятно, вяленому новоиндийцу любой свежести в одной из сладких грез могла привидеться такая картинка:

    Воплотить сон в реальность на некоторое время стало навязчивой идеей.
    Бесспорно, из прекрасного далека ожидалось лишь 28. Re8.
    При ближайшем же рассмотрении оказались не лишенными смысла и эстетической ценности перемещения ферзя вниз-влево по беленькой диагонали.
    Просыпаться было уже поздно, да и этот Белый ни во сне, ни на яву не подает.
    Маниакальная стадия сменилась депрессивной, вяленый, махнув плавником на судьбу, попытался свернуть и... поплыл по течению кверху брюхом.
    Ну... мало ли еще какая картинка привидеться могла?:kubok:
  4. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Member Since:
    31.03.2017
    Message Count:
    3.555
    Likes Received:
    4.645
    Репутация:
    210
    Оффлайн
    NS, а в Жирафе не были ли реализованы подобные идеи? Я что-то припоминаю из описания, что эта прога тоже как-то считала именно длинные варианты, исходя из того что чем сильнее ответы противника тем дольше длится партия.
  5. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    В Жирафе Альфа-бета, а не MCTS. То есть с этой точки зрения это классический движок. Ну и чем сильнее ход, тем длиннее ветвь и у традиционных движков.

    В Жирафе Probability-Limited Search для принятия решения об обрыве ветви
    https://arxiv.org/pdf/1509.01549.pdf
    Подход не такой как в классических движках, а результат похожий.
    —- добавлено: 16 Dec 2017, опубликовано: 16 Dec 2017 —-
    В большинстве случаев Probability-Limited Search и стандартные методы - будут давать одинаковый результат.
  6. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Да, кардинал и галантерейщик — это сила!:beer:
    И эта сила может спасти — и Францию, и Новую Индию.:konb:
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    Кардинал и сам бы справился, если бы руки не связали
  8. Martynas Начинающий

    • Начинающий
    Member Since:
    08.01.2017
    Message Count:
    2
    Likes Received:
    0
    Репутация:
    0
    Оффлайн
    А почему Стокфиша называют Вяленым? С чем ето связано?
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    Дословный перевод
  10. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    Сейчас так:

    Code:
    info depth 65 seldepth 71 multipv 1 score cp -147 nodes 160622641425 nps 11360470 hashfull 999 tbhits 131471567 time 14138732 pv e8e7 b3d5 e7e8 f3d3 e8e7 d5e6 f7e6 d3f3 f8g8 c3f6 e7e8 f6d4 e8e7 g2g3 g8h8 d4c5 e7e8 c5a3 d8c8 g3h3 c8a8 f3f6 h8g8 h3g2 a7a6 f6f3 g8h8 a3d6 a8d8 g2g3 d8a8 f3f6 h8g8 d6b4 a8d8 f6f3 d8c8 b4a3 g8h8 f3f6 h8g8 g3g4 c8a8 g4f3 a8a7 f3e3 a7a8 f6f4 a8d8 a3d6 d8a8 f4f6 g8h8 d6b4 h8g8 b4a3 a8d8 a3d6 d8a8 d6b4 a8d8 f2f4 d8c8 e3f3 c8a8 b4d6 g8h8 d6c5 a8d8 f3g3
    На 66-й опять меняет линию - Qe6 проверяет.
    Комсюк likes this.
  11. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    sovaz1997, не пали эл/энергию...
    Хороший план предложил cs111g, твоя линия на запасном пути :)
    —- добавлено: 16 Dec 2017 —-
    sovaz1997 likes this.
  12. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Удивительное рядом: продавщица магазина, в который выскочил за чешским пивом и английскими сигаретами (еще пока есть в продаже, в отличие от корейских овчарок и норвежских FM-радиоприемников), ваще не в курсах — мол, а кто такой этот AlphaZero?
    Конец, Света!
    Куда смотрит полиция?!
    Я всем скажу, до чего довел планету этот фигляр ПЖ!:diablo:
  13. redhelicopter Старожил

    • Участник
    • Старожил
    Member Since:
    11.11.2014
    Message Count:
    629
    Likes Received:
    2.263
    Репутация:
    41
    Оффлайн
    Ходы за SF смущают гораздо больше.

    13... Nxc3. Этот ход вообще не возникает у SF на первой линии - что я только с ним уже не делал. Практически уверен, что это не ход стокфиша, играющего в полную силу.
    21...Bf5. Этот ход может возникать на глубине менее 30, при большей глубине SF от него отказывается.
    32... Re8
    33... Bxd4?? - в общем-то, еще один ход-маркер (наряду с Rf8 в другой партии) подтверждающий что SF либо был настроен на неполную силу игры, либо ему делали force move даже раньше минуты. Этот ход SF выбирает до глубины 31 включительно, а при большей глубине по первой линии прочно встает Rd8. Ход SF из партии оценивает как потерю 1 пешки.
  14. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    не верю ©

    Hel1.jpg
  15. hornet Учаcтник

    • Участник
    Member Since:
    05.11.2016
    Message Count:
    860
    Likes Received:
    785
    Репутация:
    498
    Оффлайн
    У меня возникает до глубины 35. Слушайте который сток мне лучше подойдёт - у меня intelcore i3, 2 ядра, оперативы 8 гигов, частота проца 3400 Мгц, винда 64 разряда?
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    hornet, Стокфиш 8 и хэш ставьте 1 ГБ, смотреть полчаса
    Это если хочется доказать, что играл не он
  17. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    Ладно, я молчу про "никогда"
    жду 30 минут

    UPD
    Всё, остальные ходы даже и смотреть не буду
    Hel2.jpg
    Нестор likes this.
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    практически уверен, что ты не последовал совету прочесть ветку сначала
    Тут уже сотню раз объясняли, чем ослабили Вяленого
    Но зачем читать? Лучше верить в небылицы
  19. hornet Учаcтник

    • Участник
    Member Since:
    05.11.2016
    Message Count:
    860
    Likes Received:
    785
    Репутация:
    498
    Оффлайн
  20. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.271
    Оффлайн
    Ставьте самый простой, не ошибётесь
  21. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    hornet, проверьте все в таком порядке: Для Haswell (по-моему, с поддержкой BMI2) -> for modern (с поддержкой popcnt) -> обычный. Какой запустится, тот и лучше. Разница в скорости будет небольшая. Но это смотря для чего он вам нужен. Если для анализа, ставьте Dev-версию, если для проверки ходов из партий AZ, то используйте именно 8-ю версию.
  22. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Если кто из продавщиц магазинов простых смертных шахматистов пока не в теме (суть статьи популярным русским, вступительные бла-бла-бла и математический ликбез мною пропущены):
    И там же есть краткий FAQ от автора перевода.

    Плюс "капелька" скепсиса.
    sovaz1997 and Нестор like this.
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Да какой скепсис? Всё проходили в Го. Первая версия на 3000+ эло, через два года на 5000+ эло.
    Нестор likes this.
  24. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Вот только делать движок на 5000 будет уже не ДипМайнд, т.к. проект АльфаГо (и с ним АльфаЗеро) закрыт, а члены команды переброшены на другие проекты.
  25. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Ну... игра го тоньше, потомк там градация рейтингов более растянута.
  26. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Не люблю халтурить.
    Стараюсь не халтурить.
    Смертен — времени в обрез.
    С возрастом стал быстрее и чаще уставать.
    Усталость мешает не халтурить, но ценить время.
    Краткость — сестра? Гений Сократ — друг?
    Сколько стоит истина? Можно оптом?
    Опыт — сын?..

    Могу ошибаться, но... СТИЛЬ!
    Особенно выпукло — в ситуациях, когда трудно просчитать последствия принятия двух-трех практически равнозначных по оценке решений. Но время заставляет принять одно из них!
    Петросян предпочтет избыточную защиту, Таль ринется в жертвенную атаку.
    Смыслов попытается найти истину где-то посередине.
    А Stockfish и AlphaZero?


    Сделано 30 ходов — подвигал скудным умишком фигурки в (на мой сверхоптимистический взгляд) поучительной, но так никем пока и не проанализированной партии (наскоро состряпанной халтуры, конечно, навалом).
    Веточка побочная, выросшая из другой боковой.
    До основной руки еще не так скоро дойдут.
    Поделюсь лишь основным впечатлением: SF в этой партии (из соображений военной тайны умолчу "адрес" той позиции, откуда веточка растет к этой) — далеко не Петросян, увы.
    И просто поражает грандиозный запас ресурсов прочности в фантастическом стиле AlphaZero!
  27. просроченый_кмс Старожил

    • Участник
    • Старожил
    Member Since:
    15.02.2010
    Message Count:
    1.112
    Likes Received:
    167
    Репутация:
    6
    Оффлайн
    нашёл наконец где этот хеш поставить, установил последнюю версию стокфиша.
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Желающие найдутся. Например в ГО - http://zero.sjeng.org/ и никаких TPU не надо.
  29. просроченый_кмс Старожил

    • Участник
    • Старожил
    Member Since:
    15.02.2010
    Message Count:
    1.112
    Likes Received:
    167
    Репутация:
    6
    Оффлайн

    Закрыт не начавшись, странно немного показали всех заинтересовали и бац...
    Согласен пожертвовать свой проц на всеобщее благо, и даже когда рассчитаюсь с кредитом купить комп с видеокартами) альфазеро [оказия] живи)

    Вот реально смотришь матч прог там такие позиции иногда возникают хрен поймёшь, бардак строенные пешки и т.п. альфазеро и её игра наоборот притягивает.

  30. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    В два раза? То есть можно ожидать усиления не более чем на 1000 эло? :)
  31. sovaz1997 Учаcтник

    • Участник
    Member Since:
    30.08.2016
    Message Count:
    649
    Likes Received:
    120
    Репутация:
    3
    Оффлайн
    В смысле закрыли, я что-то пропустил?
  32. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Какой? — здоровый, по-моему. Не мешающий трезвому восприятию столь исторического события.
    Для баланса едва уловимый скепсис Маркова, правда, несколько "ренуарно" разбавлен ученой кочевницей, раскроившей материал пополам.
    Вторая половина, принадлежащая перу Коли Власова, изобилует восторгами вперемеЖку-вперемеШку с непонятками...
    По-моему, это чрезмерная дань компьютерно-карлсеновской моде.
    Ход-то — единственный! После любого другого белые могут сразу сдаться. Т.е. уместнее пометить "квадратиком".
    Отказались, потому что "зациклились" на ничейном варианте, ожидая в ответ от белых лишь преследования слоном ферзя.
    "Равноценный" вариант рано оборван и/или напутано с единственным ходом в конце: 28... Rf7?? (28... Kg8 []) 29. Qg4 — и что делать черным?
    Ну и т.д., и т.п., включая ну о-о-очень позднее определение "критического момента феерической партии":
    Улыбнуло:
    Ай, молодца, bazar!:beer:
  33. nn Старожил

    • Участник
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Оффлайн
    Выступление David Silver на NIPS - ведущего автора статьи и этих проектов. 6 декабря еще
    N1mTzo likes this.
  34. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Кстати, о "новинках" и о более точном определении "критических моментов феерических партий":
    AlphaZero оказался проворнее Шумахера!

    14. Qg4!N:to_become_senile:

    [Event "Oberliga Nord N 1516"]
    [Site "Germany"]
    [Date "2016.01.31"]
    [Round "6.6"]
    [White "Schumacher, Norbert"]
    [Black "Hanisch, Sebastian"]
    [Result "1/2-1/2"]
    [ECO "E17"]
    [WhiteElo "2191"]
    [BlackElo "2075"]
    [PlyCount "100"]
    [EventDate "2015.09.20"]
    [EventType "team-tourn"]
    [EventRounds "9"]
    [EventCountry "GER"]
    [SourceTitle "EXT 2017"]
    [Source "ChessBase"]
    [SourceDate "2016.10.25"]
    [SourceVersion "1"]
    [SourceVersionDate "2016.10.25"]
    [SourceQuality "1"]
    [WhiteTeam "Hamburger SK III"]
    [BlackTeam "Schwerin"]
    [WhiteTeamCountry "GER"]
    [BlackTeamCountry "GER"]

    1. Nf3 Nf6 2. d4 e6 3. g3 b6 4. Bg2 Bb7 5. O-O Be7 6. c4 O-O 7. d5 exd5 8. Nh4
    c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 :diablo:Nxc3
    14. bxc3 Bf6
    15. Qc2 Nd7 16. Rd1 Qc7 17. Bf4 Ne5 18. Nd6 Rad8 19. Nxb7 Qxb7 20. Be4 g6 21.
    Qe2 Qe7 22. Be3 Qe6 23. Bh6 Rfe8 24. Bg2 Qf5 25. Rxd8 Rxd8 26. Re1 Qd3 27. Qxd3
    Nxd3 28. Rd1 c5 29. c4 Ne5 30. Rxd8+ Bxd8 31. Bd5 g5 32. f4 Ng4 33. fxg5 Ne3
    34. Be4 Nxc4 35. h4 Nd6 36. Bc2 b5 37. Kf2 Bb6 38. Kf3 c4 39. h5 Bd4 40. g6
    hxg6 41. Bf4 Nf5 42. hxg6 fxg6 43. g4 Ne7 44. Ke4 Bg7 45. Bd6 Kf7 46. Bc5 a6
    47. a4 Ke6 48. axb5 axb5 49. Bxe7 Kxe7 50. Kd5 Kf6 {(=)} 1/2-1/2
  35. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    После окончания майского "Go in the Future" саммита в Вужене (Китай) было официально объявлено, что проект АльфаГо закрыт, и продолжения работ не планируется. Все результаты, которые публикуются сейчас, были получены ещё до мая 2017 года. Просто Гугл их дозированно выдаёт.
    N1mTzo, sovaz1997 and Комсюк like this.

Share This Page