AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Океюшки, парочка подсказок:
    Точно ли причина? Не следствие ли? Тогда следствие чего? Произошедшего до того как?
    Если идея верна, ее невозможно довести до абсурда.
    Даже не буду пытаться доводить. Сэкономлю свое и Ваше время: а что мешало сыграть Nc6 на первом ходу? Ладье "простор", коню воля!
    Т.е. 1... Nc6?! — момент-то это уж действительно первый, первее не бывает! Но напрашивающийся ли?!
    Любитель_ нравится это.
  2. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    можно бы и лайкнуть, но

    знак разрушил впечатление :)
    Любитель_ и Нестор нравится это.
  3. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    О-о-о!..
    Был у меня тезка-тренер, простой КМС, но порой, в обидке за державу, 9-му чемпиону письменно дебютные советы-рекомендации давал перед матчем с будущим 11-ым.
    Не прислушался 9-ый. А жаль. Проиграл, конечно...
    Так я о чем? — совсем пацаном, помнится, с ним блицевал иногда-порой, постоянно озадачивая белыми новинкой в Рети на... 2-ом (!) ходу. Балаганили при этом — ну просто труба! Эх,.. есть о чем вспомнить, нечего детям рассказать...
    Ну а уж 1. Nf3!! Nc6?! — знаки сами просятся. Статистика у меня СВОЯ!
  4. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Какой к чёрту тёзка может быть у человека с именем zeroalphazero?
    Любитель_ и MS нравится это.
  5. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.315
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    zeroalphazero, есть комментаторы, которые даже к ходу 1. ...Na6 ставят !?, а не ?! ;)
    Любитель_, Camon14 и zeroalphazero нравится это.
  6. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    848
    Симпатии:
    774
    Репутация:
    477
    Оффлайн
    Кстати в обсуждаемой на этой странице партии, ходом g5 сток играл на победу (как мне кажется, и как казалось стоку). Если бы в приоритете была безопасность короля, и гармоничная игра всех фигур - ничейку можно было сделать без проблем. Надо привлечь любителей системы Чужакина, попросить проанализировать опасные элементы по ходу партии (правда как положено по всем пунктам, а не там где хочется). Вообще, на это я намекал, упоминая в одном из постов человеческие критерии...:writing:
  7. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Царствие Ему неБесное!
    Любитель_, Undying и Комсюк нравится это.
  8. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Подсказка третья.
    Что такое план?
    Затрудняетесь с ответом? — Google Яндекс вам в помощь!
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Виорел, перелогиньтесь!
  10. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Он еще молоденок, со мною тягаться слабенок.;)
  11. Baron Учаcтник

    • Участник
    Рег.:
    08.02.2008
    Сообщения:
    2.351
    Симпатии:
    237
    Репутация:
    11
    Оффлайн
  12. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Вновь идя навстречу требующим продолжения банкета, по-царски готовым пожертвовать свой проц ради всеобщего блага и остро заинтересованным по истечении выплаты долга по кредиту в даже приобретении компа с видеокартами, хочу подкинуть еще парочку картинок — для на их вкус оценки и сравнения.



  13. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Оффлайн
    Любитель_ нравится это.
  14. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.315
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Ждем матч АльфаЗеро - Либратус ? ;)
  15. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    У меня своя "теория дебютов" для блица.:to_become_senile:
    1. Nf3 c5 2. b4!? cxb4 3. a3!? bxa3 4. e4
    или
    1. Nf3 e6 2. e4 d5 3. e5 c5 4. b4!?
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
  17. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    ???
    Не понял
    Чёрных же съели

    А, победа по времени. Видимо, у GNU Go при попытке досчитать лесенку до конца доски переполнились какие-то структуры данных :)
    Zayats нравится это.
  18. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.492
    Симпатии:
    3.122
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
  19. Benas Учаcтник

    • Участник
    Рег.:
    09.05.2017
    Сообщения:
    147
    Симпатии:
    27
    Репутация:
    1
    Оффлайн
    Я не знаю но то, что имею я 3 Дану не победить....
  20. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Пророческие строки!
    Пророчество сбылось! => https://www.cfa.harvard.edu/~avanderb/kepler90i.pdf
    http://www.bbc.com/russian/news-42364441
    Любитель_ и Нестор нравится это.
  21. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Скука — двигатель прогресса!
    Теперь, надеюсь, поубавится количество скептиков?
    С сарказмом и иронией относились к рассказу Кирсана Николаевича о встрече с инопланетянами?
    А ведь даже шахматному коню ясно, что это сущая правда!
    Кибернетика многим обязана шахматам. Пришло время возвращать долги! — даже тем, кто некогда вышел из шахматного "Кибернетического клуба", основав нейросетевой.
    Инопланетянам тоже бывает скучно, тоже нравится играть. А у землян — чудесные и мудрые игры!
  22. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Дело не только в железе, а в множестве улучшений алгоритма, существенно ускоряющих обучение. Действительно, общие методы известны уже десятки лет, но без этих улучшений, даже на современном оборудовании гугла обучение бы заняло не часы а годы.
    Даже если сравнить AlphaGo и AlphaZero, то AlphaGo тренировали полтора месяца, а AlphaZero достигла такого же уровня за 8 часов. У AlphaGo по сравнению с предшественниками тоже были существенные улучшения алгоритма (задним числом кажущиеся очевидными).

    Напомню, что за пару часов до того, когда гугл объявил, что AlphaGo обыграл профессионального игрока Go, фейсбук тоже объявил о том, что "мы создали программу, играющую в Go на нейронных сетях, которая играет так же сильно как GnuGo":
    https://www.facebook.com/zuck/videos/vb.4/10102619979032811/
    Фейсбук тоже располагает большими вычислительными мощностями, но одного лишь этого не хватило, чтобы обыграть человека.

    Когда читаешь свежие статьи о machine learning (вообще все, не только от гугла), то они вызывают одну из двух реакций:
    1. Вроде бы это улучшение и так очевидно, зачем об этом писать? (90% статей)
    2. Вот этот совсем простой и общеизвестный метод даёт такие хорошие результаты? Ничего себе! (10% статей).

    Но на самом деле если собрать все эти "очевидные мелочи" вместе, сотнями, то они ускоряют обучение в десятки тысяч раз. И до этих "очевидных мелочей" надо:
    1. Додуматься. Додуматься до нескольких очевидных мелочей просто, а до сотни — не очень.
    2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Дело не только в железе, но и без железа никак.
    Например. MCTS/UCT для нормальной игры требует некоторой производительности. Изначально в ГО оно слабее Альфа-беты, но удвоение скорости дает прибавку больше чем альфа-бета.
    Первые программы на MCTS появились ровно тогда, когда они хоть как-то могли конкурировать с стандартными ГО-программами на доске 9x9.
    Селективный null-move, history - появились тогда, когда производительности железа стало хватать для того чтоб они давали заметную прибавку.

    ИМХО и тут так-же. Шахматы на MCTS+НС появились именно тогда, когда у Гугла появилась возможность запустить обучение на сверхмощностях.
    На GPU и на обучение уйдут годы, и производительности для нормальной силы игры не хватит.
    Железо, на котором обучалась AlphaZero - в сотню тысяч раз мощнее достаточно серьезного компа.

    То есть если бы не Гугл, то это бы сделал кто-нибудь другой, когда появились бы необходимые вычислительные ресурсы.
    —- добавлено: 19 дек 2017 —-
    Были попытки сделать играющую шахматную программу на MCTS. И были попытки сделать играющую шахматную программу на НС. И то и другое не ново.
    —- добавлено: 19 дек 2017, опубликовано: 19 дек 2017 —-
    Если я правильно прочел аннотацию, Фейсбук сделал программу, играющую в силу GnuGo без перебора, только НС. А Alpha играет с перебором.
    Любитель_ и MS нравится это.
  24. MS Михаил Семионенков

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    6.542
    Симпатии:
    3.361
    Репутация:
    175
    Оффлайн
    Готов поверить на слово, поскольку я посмотрел материалы только с одной стороны - Монте-Карло, там шибко интересного не проглядывается. На подробности обучения НС пороху не хватило.
  25. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.916
    Симпатии:
    3.985
    Репутация:
    141
    Адрес:
    Заир
    Оффлайн
    Ну я согласен, что это тоже очень сильный ход. В том плане, что дебюты специально подобрали невыгодные для Стокфиша, а чтоб с них не соскочил с помощью генератора случайных чисел - лишили дебютной книжки. Такой первый ход мог бы смешать белым все карты.

    Но всё-таки это вряд ли была последняя возможность развить лошадку. А вот 23-й ход - возможно, действительно последняя.
    zeroalphazero и Нестор нравится это.
  26. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    По-человечески: 23... b5, зная дальнейшее, выглядит потерей темпа.
    Но если в "план" AlphaZero действительно входило это "дальнейшее" (вскрытие вертикали h, гармонично цельная и быстрая перегруппировка с темповой игрой — переброска ферзя, создание батареи ферзь+слон, освобождение диагонали разменом для безопасного подъема короля-занозы — коммуникации созданы! — нижняя горизонталь и правая вертикаль свободны, тяжелая артиллерия выведена на идеальные позиции, 32. с4 и 33. Bd4 заключительными аккордами), то 23. Qc4 выглядит провокацией.
    Т.е. почему не сразу привести весь план в действие?
    Т.е. что за корректировка плана?!
    —- добавлено: 20 дек 2017, опубликовано: 20 дек 2017 —-
    Кстати, в одном из вариантов (см. предложенное выше 23... Kg7!?) при не совсем точной игре черных белые не вскрывают вертикаль, а доводят пешку до h7.

    Как Вам позиция?
  27. Yury_Solomatin Учаcтник

    • Участник
    Рег.:
    25.01.2017
    Сообщения:
    865
    Симпатии:
    503
    Репутация:
    24
    Оффлайн
    ШахматыЭтоДиагноз, Rom и Нестор нравится это.
  28. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    3.519
    Симпатии:
    4.594
    Репутация:
    207
    Оффлайн
    Будут цитировать эту ветку. :)
    Комсюк нравится это.
  29. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    У шахмат много общего с музыкой.
    Таких смен тональностей (модуляций) я до этого матча не видел.
    Шедевры! Фантастика! Искусство...
    WinPooh нравится это.
  30. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Вообщем-то, согласен. Все опасные, на первый взгляд, эндшпили там ничейны.
    А если сыграть этот ход на 9 ходов раньше:



    50.Bd5!?....Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5
    Нестор нравится это.
  31. cs111g Начинающий

    • Начинающий
    Рег.:
    15.12.2017
    Сообщения:
    5
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Шикарнейший вариант (похоже, там выиграно).
    Пока удалось нащупать лишь 50... Rc8 51. Qf4 Qg8 52. Bb7 Rce8 53. Qd6 c4 54. a4 c3 55. Bd5 Rd8 56. Qc5 Ke8 57. Qxc3 Qf8 58. Rf4 Re6 59. a5 Qd6 60. Bxe6 dxe6 61. Qh8 Qf8, где также нет гарантии ничьей.
    Про 50. Qf4 можно забыть =)
    Нестор нравится это.
  32. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Тут основной принцип, чем раньше играешь Bd5, тем лучше.:) Поэтому, наверняка, сильнее 54. Bd5
  33. cs111g Начинающий

    • Начинающий
    Рег.:
    15.12.2017
    Сообщения:
    5
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Тогда что-то типа 54... Rd8 55. Rf4 Ke8 56. Qf6 Qf8 57. Rxc4 Re6 58. Bxe6 dxe6 59. Qe5 Qf5 60. Qh8+ Ke7 61. Qg7+ Qf7 62. Qc3 Qf5.
    В общем, сохранить красавца-слона сложно.

    PS: А вы не подскажите, как в оболочке Fritz копировать варианты ходов из нотации?
  34. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    848
    Симпатии:
    774
    Репутация:
    477
    Оффлайн
    Вот что ответил товарищ NeuNeuro в теме Система Чужакина ...:
    - " Нейронная сеть не то что в шахматы играть не умеет, её даже ходу шахматной ладьи не научить.

    Статьи, в которых пишут об успехах ИНС (искусственной нейронной сети) в игре в шахматы или шашки, обычно мелким шрифтом добавляют, что ИНС используется лишь в оценке позиций, которые прежде получены обычными необучаемыми программами.
    Выше писал о том, что человека от обезьяны отличает умение использовать пальцы для расчёта бананов. Так вот - пока не существует ИНС или иной обучаемой автоматической системы, которую можно "по-честному" обучить СЧИТАТЬ. ИНС легко научить "аналоговым" расчётам по типу "много - мало" или "больше-меньше", но цифровой расчёт - нет. Логическое мышление - это будущее ИИ, в настоящем оно практически отсутствует.".
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Отличие AlphaZero (и AlphaGo Zero) от предыдущих версий в том, что она учится с нуля. То есть не использует партии и позиции человеческие и полученные другими программами. Учится на партиях наигранных самой с собой. Именно об этом и говорит слово Zero в названии.
    —- добавлено: 21 дек 2017 —-
    Шахматная AlphaZero знает только правила - есть генератор ходов, есть определение мата/пата и ничейных правил, немного эвристик типа SEE (правда этот момент я не понял, они пишут что SEE используют классические программы, или что используется в AlphaZero), и больше о шахматах она изначально не знает ничего.
    Нестор нравится это.

Поделиться этой страницей