AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    А смысл? Устранится причина латанием следствий?
    Не являясь потомственным хранителем королевской печати и не претендуя на роль отца эмпиризма изобретателя 4-ого уровня защиты от дурака (poka-yoke), все же почему-то наивно верю в идею о безграничности прогресса развития человека...:sman:
    Знание — сила!
    Единоборство — один знает местечки, куда солома заблаговременно постелена, и остатком этой же соломы заманивает другого к краю, который тот не видит, т.е. не знает, что там — пропасть. Это честно?
    Ну кто, например, заставлял SF на первом ходу в интересующей Вас партии соблюсти симметрию, на втором от нее отказаться?
    Затем попытаться оспорить права на выгул слона по "большой дороге" — чтобы потом благополучно его запереть? Чертоводюжинной силы ход натыкается на одноходовую угрозу, успешно отраженную вводом в эксплуатацию второй "большой дороги", по которой под страхом смертной казни вынужден гулять король, сдавший свою печать в камеру хранения...
    Хранители хранят молчание, король и все остальные вконец сбиваются с пути,.. — занавес, приехали, оказывается.
    Не знали броду. Вместо светлого горизонта впереди ласковое журчание мутной воды и чья-то мельница...
    hornet и Комсюк нравится это.
  2. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    саботаж оператора таки присутствовал в матче
  3. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Ежели кого опять станут терзать смутные сомнения — рискну предложить скрасить досуг в муках творческого поиска.
    Вероятно, вяленому новоиндийцу любой свежести в одной из сладких грез могла привидеться такая картинка:

    Воплотить сон в реальность на некоторое время стало навязчивой идеей.
    Бесспорно, из прекрасного далека ожидалось лишь 28. Re8.
    При ближайшем же рассмотрении оказались не лишенными смысла и эстетической ценности перемещения ферзя вниз-влево по беленькой диагонали.
    Просыпаться было уже поздно, да и этот Белый ни во сне, ни на яву не подает.
    Маниакальная стадия сменилась депрессивной, вяленый, махнув плавником на судьбу, попытался свернуть и... поплыл по течению кверху брюхом.
    Ну... мало ли еще какая картинка привидеться могла?:kubok:
  4. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    2.034
    Симпатии:
    2.585
    Репутация:
    135
    Оффлайн
    NS, а в Жирафе не были ли реализованы подобные идеи? Я что-то припоминаю из описания, что эта прога тоже как-то считала именно длинные варианты, исходя из того что чем сильнее ответы противника тем дольше длится партия.
  5. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    В Жирафе Альфа-бета, а не MCTS. То есть с этой точки зрения это классический движок. Ну и чем сильнее ход, тем длиннее ветвь и у традиционных движков.

    В Жирафе Probability-Limited Search для принятия решения об обрыве ветви
    https://arxiv.org/pdf/1509.01549.pdf
    Подход не такой как в классических движках, а результат похожий.
    —- добавлено: 16 дек 2017, опубликовано: 16 дек 2017 —-
    В большинстве случаев Probability-Limited Search и стандартные методы - будут давать одинаковый результат.
  6. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Да, кардинал и галантерейщик — это сила!:beer:
    И эта сила может спасти — и Францию, и Новую Индию.:konb:
  7. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Кардинал и сам бы справился, если бы руки не связали
  8. Martynas Начинающий

    • Начинающий
    Рег.:
    08.01.2017
    Сообщения:
    2
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    А почему Стокфиша называют Вяленым? С чем ето связано?
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Дословный перевод
  10. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Сейчас так:

    Код:
    info depth 65 seldepth 71 multipv 1 score cp -147 nodes 160622641425 nps 11360470 hashfull 999 tbhits 131471567 time 14138732 pv e8e7 b3d5 e7e8 f3d3 e8e7 d5e6 f7e6 d3f3 f8g8 c3f6 e7e8 f6d4 e8e7 g2g3 g8h8 d4c5 e7e8 c5a3 d8c8 g3h3 c8a8 f3f6 h8g8 h3g2 a7a6 f6f3 g8h8 a3d6 a8d8 g2g3 d8a8 f3f6 h8g8 d6b4 a8d8 f6f3 d8c8 b4a3 g8h8 f3f6 h8g8 g3g4 c8a8 g4f3 a8a7 f3e3 a7a8 f6f4 a8d8 a3d6 d8a8 f4f6 g8h8 d6b4 h8g8 b4a3 a8d8 a3d6 d8a8 d6b4 a8d8 f2f4 d8c8 e3f3 c8a8 b4d6 g8h8 d6c5 a8d8 f3g3
    На 66-й опять меняет линию - Qe6 проверяет.
    Комсюк нравится это.
  11. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    sovaz1997, не пали эл/энергию...
    Хороший план предложил cs111g, твоя линия на запасном пути :)
    —- добавлено: 16 дек 2017 —-
    sovaz1997 нравится это.
  12. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Удивительное рядом: продавщица магазина, в который выскочил за чешским пивом и английскими сигаретами (еще пока есть в продаже, в отличие от корейских овчарок и норвежских FM-радиоприемников), ваще не в курсах — мол, а кто такой этот AlphaZero?
    Конец, Света!
    Куда смотрит полиция?!
    Я всем скажу, до чего довел планету этот фигляр ПЖ!:diablo:
  13. redhelicopter Учаcтник

    • Участник
    Рег.:
    10.11.2014
    Сообщения:
    264
    Симпатии:
    1.183
    Репутация:
    19
    Оффлайн
    Ходы за SF смущают гораздо больше.

    13... Nxc3. Этот ход вообще не возникает у SF на первой линии - что я только с ним уже не делал. Практически уверен, что это не ход стокфиша, играющего в полную силу.
    21...Bf5. Этот ход может возникать на глубине менее 30, при большей глубине SF от него отказывается.
    32... Re8
    33... Bxd4?? - в общем-то, еще один ход-маркер (наряду с Rf8 в другой партии) подтверждающий что SF либо был настроен на неполную силу игры, либо ему делали force move даже раньше минуты. Этот ход SF выбирает до глубины 31 включительно, а при большей глубине по первой линии прочно встает Rd8. Ход SF из партии оценивает как потерю 1 пешки.
    Комсюк и Локомотив нравится это.
  14. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    не верю ©

    Hel1.jpg
  15. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    370
    Симпатии:
    77
    Репутация:
    0
    Оффлайн
    У меня возникает до глубины 35. Слушайте который сток мне лучше подойдёт - у меня intelcore i3, 2 ядра, оперативы 8 гигов, частота проца 3400 Мгц, винда 64 разряда?
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    hornet, Стокфиш 8 и хэш ставьте 1 ГБ, смотреть полчаса
    Это если хочется доказать, что играл не он
  17. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Ладно, я молчу про "никогда"
    жду 30 минут

    UPD
    Всё, остальные ходы даже и смотреть не буду
    Hel2.jpg
    Нестор нравится это.
  18. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    практически уверен, что ты не последовал совету прочесть ветку сначала
    Тут уже сотню раз объясняли, чем ослабили Вяленого
    Но зачем читать? Лучше верить в небылицы
  19. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    370
    Симпатии:
    77
    Репутация:
    0
    Оффлайн
  20. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.887
    Симпатии:
    17.387
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Ставьте самый простой, не ошибётесь
  21. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    hornet, проверьте все в таком порядке: Для Haswell (по-моему, с поддержкой BMI2) -> for modern (с поддержкой popcnt) -> обычный. Какой запустится, тот и лучше. Разница в скорости будет небольшая. Но это смотря для чего он вам нужен. Если для анализа, ставьте Dev-версию, если для проверки ходов из партий AZ, то используйте именно 8-ю версию.
  22. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Если кто из продавщиц магазинов простых смертных шахматистов пока не в теме (суть статьи популярным русским, вступительные бла-бла-бла и математический ликбез мною пропущены):
    И там же есть краткий FAQ от автора перевода.

    Плюс "капелька" скепсиса.
    sovaz1997 и Нестор нравится это.
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Да какой скепсис? Всё проходили в Го. Первая версия на 3000+ эло, через два года на 5000+ эло.
    Нестор нравится это.
  24. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    Вот только делать движок на 5000 будет уже не ДипМайнд, т.к. проект АльфаГо (и с ним АльфаЗеро) закрыт, а члены команды переброшены на другие проекты.
  25. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Ну... игра го тоньше, потомк там градация рейтингов более растянута.
  26. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Не люблю халтурить.
    Стараюсь не халтурить.
    Смертен — времени в обрез.
    С возрастом стал быстрее и чаще уставать.
    Усталость мешает не халтурить, но ценить время.
    Краткость — сестра? Гений Сократ — друг?
    Сколько стоит истина? Можно оптом?
    Опыт — сын?..

    Могу ошибаться, но... СТИЛЬ!
    Особенно выпукло — в ситуациях, когда трудно просчитать последствия принятия двух-трех практически равнозначных по оценке решений. Но время заставляет принять одно из них!
    Петросян предпочтет избыточную защиту, Таль ринется в жертвенную атаку.
    Смыслов попытается найти истину где-то посередине.
    А Stockfish и AlphaZero?


    Сделано 30 ходов — подвигал скудным умишком фигурки в (на мой сверхоптимистический взгляд) поучительной, но так никем пока и не проанализированной партии (наскоро состряпанной халтуры, конечно, навалом).
    Веточка побочная, выросшая из другой боковой.
    До основной руки еще не так скоро дойдут.
    Поделюсь лишь основным впечатлением: SF в этой партии (из соображений военной тайны умолчу "адрес" той позиции, откуда веточка растет к этой) — далеко не Петросян, увы.
    И просто поражает грандиозный запас ресурсов прочности в фантастическом стиле AlphaZero!
  27. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    986
    Симпатии:
    82
    Репутация:
    0
    Оффлайн
    нашёл наконец где этот хеш поставить, установил последнюю версию стокфиша.
  28. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Желающие найдутся. Например в ГО - http://zero.sjeng.org/ и никаких TPU не надо.
  29. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    986
    Симпатии:
    82
    Репутация:
    0
    Оффлайн

    Закрыт не начавшись, странно немного показали всех заинтересовали и бац...
    Согласен пожертвовать свой проц на всеобщее благо, и даже когда рассчитаюсь с кредитом купить комп с видеокартами) альфазеро [оказия] живи)

    Вот реально смотришь матч прог там такие позиции иногда возникают хрен поймёшь, бардак строенные пешки и т.п. альфазеро и её игра наоборот притягивает.

  30. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    В два раза? То есть можно ожидать усиления не более чем на 1000 эло? :)
  31. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    В смысле закрыли, я что-то пропустил?
  32. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Какой? — здоровый, по-моему. Не мешающий трезвому восприятию столь исторического события.
    Для баланса едва уловимый скепсис Маркова, правда, несколько "ренуарно" разбавлен ученой кочевницей, раскроившей материал пополам.
    Вторая половина, принадлежащая перу Коли Власова, изобилует восторгами вперемеЖку-вперемеШку с непонятками...
    По-моему, это чрезмерная дань компьютерно-карлсеновской моде.
    Ход-то — единственный! После любого другого белые могут сразу сдаться. Т.е. уместнее пометить "квадратиком".
    Отказались, потому что "зациклились" на ничейном варианте, ожидая в ответ от белых лишь преследования слоном ферзя.
    "Равноценный" вариант рано оборван и/или напутано с единственным ходом в конце: 28... Rf7?? (28... Kg8 []) 29. Qg4 — и что делать черным?
    Ну и т.д., и т.п., включая ну о-о-очень позднее определение "критического момента феерической партии":
    Улыбнуло:
    Ай, молодца, bazar!:beer:
  33. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.100
    Симпатии:
    2.769
    Репутация:
    108
    Нарушения:
    18
    Оффлайн
    Выступление David Silver на NIPS - ведущего автора статьи и этих проектов. 6 декабря еще
    N1mTzo нравится это.
  34. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Кстати, о "новинках" и о более точном определении "критических моментов феерических партий":
    AlphaZero оказался проворнее Шумахера!

    14. Qg4!N:to_become_senile:

    [Event "Oberliga Nord N 1516"]
    [Site "Germany"]
    [Date "2016.01.31"]
    [Round "6.6"]
    [White "Schumacher, Norbert"]
    [Black "Hanisch, Sebastian"]
    [Result "1/2-1/2"]
    [ECO "E17"]
    [WhiteElo "2191"]
    [BlackElo "2075"]
    [PlyCount "100"]
    [EventDate "2015.09.20"]
    [EventType "team-tourn"]
    [EventRounds "9"]
    [EventCountry "GER"]
    [SourceTitle "EXT 2017"]
    [Source "ChessBase"]
    [SourceDate "2016.10.25"]
    [SourceVersion "1"]
    [SourceVersionDate "2016.10.25"]
    [SourceQuality "1"]
    [WhiteTeam "Hamburger SK III"]
    [BlackTeam "Schwerin"]
    [WhiteTeamCountry "GER"]
    [BlackTeamCountry "GER"]

    1. Nf3 Nf6 2. d4 e6 3. g3 b6 4. Bg2 Bb7 5. O-O Be7 6. c4 O-O 7. d5 exd5 8. Nh4
    c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 :diablo:Nxc3
    14. bxc3 Bf6
    15. Qc2 Nd7 16. Rd1 Qc7 17. Bf4 Ne5 18. Nd6 Rad8 19. Nxb7 Qxb7 20. Be4 g6 21.
    Qe2 Qe7 22. Be3 Qe6 23. Bh6 Rfe8 24. Bg2 Qf5 25. Rxd8 Rxd8 26. Re1 Qd3 27. Qxd3
    Nxd3 28. Rd1 c5 29. c4 Ne5 30. Rxd8+ Bxd8 31. Bd5 g5 32. f4 Ng4 33. fxg5 Ne3
    34. Be4 Nxc4 35. h4 Nd6 36. Bc2 b5 37. Kf2 Bb6 38. Kf3 c4 39. h5 Bd4 40. g6
    hxg6 41. Bf4 Nf5 42. hxg6 fxg6 43. g4 Ne7 44. Ke4 Bg7 45. Bd6 Kf7 46. Bc5 a6
    47. a4 Ke6 48. axb5 axb5 49. Bxe7 Kxe7 50. Kd5 Kf6 {(=)} 1/2-1/2
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
    После окончания майского "Go in the Future" саммита в Вужене (Китай) было официально объявлено, что проект АльфаГо закрыт, и продолжения работ не планируется. Все результаты, которые публикуются сейчас, были получены ещё до мая 2017 года. Просто Гугл их дозированно выдаёт.
    N1mTzo, sovaz1997 и Комсюк нравится это.

Поделиться этой страницей