AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Океюшки, парочка подсказок:
    Точно ли причина? Не следствие ли? Тогда следствие чего? Произошедшего до того как?
    Если идея верна, ее невозможно довести до абсурда.
    Даже не буду пытаться доводить. Сэкономлю свое и Ваше время: а что мешало сыграть Nc6 на первом ходу? Ладье "простор", коню воля!
    Т.е. 1... Nc6?! — момент-то это уж действительно первый, первее не бывает! Но напрашивающийся ли?!
    Любитель_ likes this.
  2. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.230
    Likes Received:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    можно бы и лайкнуть, но

    знак разрушил впечатление :)
  3. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    О-о-о!..
    Был у меня тезка-тренер, простой КМС, но порой, в обидке за державу, 9-му чемпиону письменно дебютные советы-рекомендации давал перед матчем с будущим 11-ым.
    Не прислушался 9-ый. А жаль. Проиграл, конечно...
    Так я о чем? — совсем пацаном, помнится, с ним блицевал иногда-порой, постоянно озадачивая белыми новинкой в Рети на... 2-ом (!) ходу. Балаганили при этом — ну просто труба! Эх,.. есть о чем вспомнить, нечего детям рассказать...
    Ну а уж 1. Nf3!! Nc6?! — знаки сами просятся. Статистика у меня СВОЯ!
  4. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.230
    Likes Received:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Какой к чёрту тёзка может быть у человека с именем zeroalphazero?
    Любитель_ and MS like this.
  5. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    11.04.2006
    Message Count:
    2.955
    Likes Received:
    3.315
    Репутация:
    331
    Location:
    Москва
    Оффлайн
    zeroalphazero, есть комментаторы, которые даже к ходу 1. ...Na6 ставят !?, а не ?! ;)
  6. hornet Учаcтник

    • Участник
    Member Since:
    05.11.2016
    Message Count:
    849
    Likes Received:
    776
    Репутация:
    478
    Оффлайн
    Кстати в обсуждаемой на этой странице партии, ходом g5 сток играл на победу (как мне кажется, и как казалось стоку). Если бы в приоритете была безопасность короля, и гармоничная игра всех фигур - ничейку можно было сделать без проблем. Надо привлечь любителей системы Чужакина, попросить проанализировать опасные элементы по ходу партии (правда как положено по всем пунктам, а не там где хочется). Вообще, на это я намекал, упоминая в одном из постов человеческие критерии...:writing:
  7. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Царствие Ему неБесное!
  8. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Подсказка третья.
    Что такое план?
    Затрудняетесь с ответом? — Google Яндекс вам в помощь!
  9. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.230
    Likes Received:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Виорел, перелогиньтесь!
  10. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Он еще молоденок, со мною тягаться слабенок.;)
  11. Baron Учаcтник

    • Участник
    Member Since:
    08.02.2008
    Message Count:
    2.351
    Likes Received:
    237
    Репутация:
    11
    Оффлайн
  12. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Вновь идя навстречу требующим продолжения банкета, по-царски готовым пожертвовать свой проц ради всеобщего блага и остро заинтересованным по истечении выплаты долга по кредиту в даже приобретении компа с видеокартами, хочу подкинуть еще парочку картинок — для на их вкус оценки и сравнения.



  13. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.567
    Likes Received:
    10.939
    Репутация:
    687
    Оффлайн
    Любитель_ likes this.
  14. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    11.04.2006
    Message Count:
    2.955
    Likes Received:
    3.315
    Репутация:
    331
    Location:
    Москва
    Оффлайн
    Ждем матч АльфаЗеро - Либратус ? ;)
  15. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    У меня своя "теория дебютов" для блица.:to_become_senile:
    1. Nf3 c5 2. b4!? cxb4 3. a3!? bxa3 4. e4
    или
    1. Nf3 e6 2. e4 d5 3. e5 c5 4. b4!?
  16. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
  17. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.122
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    ???
    Не понял
    Чёрных же съели

    А, победа по времени. Видимо, у GNU Go при попытке досчитать лесенку до конца доски переполнились какие-то структуры данных :)
    Zayats likes this.
  18. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.492
    Likes Received:
    3.122
    Репутация:
    95
    Location:
    Москва
    Оффлайн
  19. Benas Учаcтник

    • Участник
    Member Since:
    09.05.2017
    Message Count:
    147
    Likes Received:
    27
    Репутация:
    1
    Оффлайн
    Я не знаю но то, что имею я 3 Дану не победить....
  20. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Пророческие строки!
    Пророчество сбылось! => https://www.cfa.harvard.edu/~avanderb/kepler90i.pdf
    http://www.bbc.com/russian/news-42364441
  21. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Скука — двигатель прогресса!
    Теперь, надеюсь, поубавится количество скептиков?
    С сарказмом и иронией относились к рассказу Кирсана Николаевича о встрече с инопланетянами?
    А ведь даже шахматному коню ясно, что это сущая правда!
    Кибернетика многим обязана шахматам. Пришло время возвращать долги! — даже тем, кто некогда вышел из шахматного "Кибернетического клуба", основав нейросетевой.
    Инопланетянам тоже бывает скучно, тоже нравится играть. А у землян — чудесные и мудрые игры!
  22. crem Учаcтник

    • Участник
    Member Since:
    24.11.2016
    Message Count:
    140
    Likes Received:
    203
    Репутация:
    14
    Оффлайн
    Дело не только в железе, а в множестве улучшений алгоритма, существенно ускоряющих обучение. Действительно, общие методы известны уже десятки лет, но без этих улучшений, даже на современном оборудовании гугла обучение бы заняло не часы а годы.
    Даже если сравнить AlphaGo и AlphaZero, то AlphaGo тренировали полтора месяца, а AlphaZero достигла такого же уровня за 8 часов. У AlphaGo по сравнению с предшественниками тоже были существенные улучшения алгоритма (задним числом кажущиеся очевидными).

    Напомню, что за пару часов до того, когда гугл объявил, что AlphaGo обыграл профессионального игрока Go, фейсбук тоже объявил о том, что "мы создали программу, играющую в Go на нейронных сетях, которая играет так же сильно как GnuGo":
    https://www.facebook.com/zuck/videos/vb.4/10102619979032811/
    Фейсбук тоже располагает большими вычислительными мощностями, но одного лишь этого не хватило, чтобы обыграть человека.

    Когда читаешь свежие статьи о machine learning (вообще все, не только от гугла), то они вызывают одну из двух реакций:
    1. Вроде бы это улучшение и так очевидно, зачем об этом писать? (90% статей)
    2. Вот этот совсем простой и общеизвестный метод даёт такие хорошие результаты? Ничего себе! (10% статей).

    Но на самом деле если собрать все эти "очевидные мелочи" вместе, сотнями, то они ускоряют обучение в десятки тысяч раз. И до этих "очевидных мелочей" надо:
    1. Додуматься. Додуматься до нескольких очевидных мелочей просто, а до сотни — не очень.
    2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).
  23. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Дело не только в железе, но и без железа никак.
    Например. MCTS/UCT для нормальной игры требует некоторой производительности. Изначально в ГО оно слабее Альфа-беты, но удвоение скорости дает прибавку больше чем альфа-бета.
    Первые программы на MCTS появились ровно тогда, когда они хоть как-то могли конкурировать с стандартными ГО-программами на доске 9x9.
    Селективный null-move, history - появились тогда, когда производительности железа стало хватать для того чтоб они давали заметную прибавку.

    ИМХО и тут так-же. Шахматы на MCTS+НС появились именно тогда, когда у Гугла появилась возможность запустить обучение на сверхмощностях.
    На GPU и на обучение уйдут годы, и производительности для нормальной силы игры не хватит.
    Железо, на котором обучалась AlphaZero - в сотню тысяч раз мощнее достаточно серьезного компа.

    То есть если бы не Гугл, то это бы сделал кто-нибудь другой, когда появились бы необходимые вычислительные ресурсы.
    —- добавлено: 19 Dec 2017 —-
    Были попытки сделать играющую шахматную программу на MCTS. И были попытки сделать играющую шахматную программу на НС. И то и другое не ново.
    —- добавлено: 19 Dec 2017, опубликовано: 19 Dec 2017 —-
    Если я правильно прочел аннотацию, Фейсбук сделал программу, играющую в силу GnuGo без перебора, только НС. А Alpha играет с перебором.
    Любитель_ and MS like this.
  24. MS Михаил Семионенков

    • Команда форума
    Member Since:
    11.02.2006
    Message Count:
    6.542
    Likes Received:
    3.361
    Репутация:
    175
    Оффлайн
    Готов поверить на слово, поскольку я посмотрел материалы только с одной стороны - Монте-Карло, там шибко интересного не проглядывается. На подробности обучения НС пороху не хватило.
  25. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    15.02.2006
    Message Count:
    6.916
    Likes Received:
    3.986
    Репутация:
    141
    Location:
    Заир
    Онлайн
    Ну я согласен, что это тоже очень сильный ход. В том плане, что дебюты специально подобрали невыгодные для Стокфиша, а чтоб с них не соскочил с помощью генератора случайных чисел - лишили дебютной книжки. Такой первый ход мог бы смешать белым все карты.

    Но всё-таки это вряд ли была последняя возможность развить лошадку. А вот 23-й ход - возможно, действительно последняя.
    zeroalphazero and Нестор like this.
  26. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    По-человечески: 23... b5, зная дальнейшее, выглядит потерей темпа.
    Но если в "план" AlphaZero действительно входило это "дальнейшее" (вскрытие вертикали h, гармонично цельная и быстрая перегруппировка с темповой игрой — переброска ферзя, создание батареи ферзь+слон, освобождение диагонали разменом для безопасного подъема короля-занозы — коммуникации созданы! — нижняя горизонталь и правая вертикаль свободны, тяжелая артиллерия выведена на идеальные позиции, 32. с4 и 33. Bd4 заключительными аккордами), то 23. Qc4 выглядит провокацией.
    Т.е. почему не сразу привести весь план в действие?
    Т.е. что за корректировка плана?!
    —- добавлено: 20 Dec 2017, опубликовано: 20 Dec 2017 —-
    Кстати, в одном из вариантов (см. предложенное выше 23... Kg7!?) при не совсем точной игре черных белые не вскрывают вертикаль, а доводят пешку до h7.

    Как Вам позиция?
  27. Yury_Solomatin Учаcтник

    • Участник
    Member Since:
    25.01.2017
    Message Count:
    865
    Likes Received:
    503
    Репутация:
    24
    Оффлайн
  28. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Member Since:
    31.03.2017
    Message Count:
    3.520
    Likes Received:
    4.595
    Репутация:
    207
    Оффлайн
    Будут цитировать эту ветку. :)
    Комсюк likes this.
  29. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    У шахмат много общего с музыкой.
    Таких смен тональностей (модуляций) я до этого матча не видел.
    Шедевры! Фантастика! Искусство...
    WinPooh likes this.
  30. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Вообщем-то, согласен. Все опасные, на первый взгляд, эндшпили там ничейны.
    А если сыграть этот ход на 9 ходов раньше:



    50.Bd5!?....Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5
    Нестор likes this.
  31. cs111g Начинающий

    • Начинающий
    Member Since:
    15.12.2017
    Message Count:
    5
    Likes Received:
    5
    Репутация:
    1
    Оффлайн
    Шикарнейший вариант (похоже, там выиграно).
    Пока удалось нащупать лишь 50... Rc8 51. Qf4 Qg8 52. Bb7 Rce8 53. Qd6 c4 54. a4 c3 55. Bd5 Rd8 56. Qc5 Ke8 57. Qxc3 Qf8 58. Rf4 Re6 59. a5 Qd6 60. Bxe6 dxe6 61. Qh8 Qf8, где также нет гарантии ничьей.
    Про 50. Qf4 можно забыть =)
    Нестор likes this.
  32. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    12.02.2006
    Message Count:
    2.201
    Likes Received:
    64
    Репутация:
    3
    Оффлайн
    Тут основной принцип, чем раньше играешь Bd5, тем лучше.:) Поэтому, наверняка, сильнее 54. Bd5
  33. cs111g Начинающий

    • Начинающий
    Member Since:
    15.12.2017
    Message Count:
    5
    Likes Received:
    5
    Репутация:
    1
    Оффлайн
    Тогда что-то типа 54... Rd8 55. Rf4 Ke8 56. Qf6 Qf8 57. Rxc4 Re6 58. Bxe6 dxe6 59. Qe5 Qf5 60. Qh8+ Ke7 61. Qg7+ Qf7 62. Qc3 Qf5.
    В общем, сохранить красавца-слона сложно.

    PS: А вы не подскажите, как в оболочке Fritz копировать варианты ходов из нотации?
  34. hornet Учаcтник

    • Участник
    Member Since:
    05.11.2016
    Message Count:
    849
    Likes Received:
    776
    Репутация:
    478
    Оффлайн
    Вот что ответил товарищ NeuNeuro в теме Система Чужакина ...:
    - " Нейронная сеть не то что в шахматы играть не умеет, её даже ходу шахматной ладьи не научить.

    Статьи, в которых пишут об успехах ИНС (искусственной нейронной сети) в игре в шахматы или шашки, обычно мелким шрифтом добавляют, что ИНС используется лишь в оценке позиций, которые прежде получены обычными необучаемыми программами.
    Выше писал о том, что человека от обезьяны отличает умение использовать пальцы для расчёта бананов. Так вот - пока не существует ИНС или иной обучаемой автоматической системы, которую можно "по-честному" обучить СЧИТАТЬ. ИНС легко научить "аналоговым" расчётам по типу "много - мало" или "больше-меньше", но цифровой расчёт - нет. Логическое мышление - это будущее ИИ, в настоящем оно практически отсутствует.".
  35. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    Отличие AlphaZero (и AlphaGo Zero) от предыдущих версий в том, что она учится с нуля. То есть не использует партии и позиции человеческие и полученные другими программами. Учится на партиях наигранных самой с собой. Именно об этом и говорит слово Zero в названии.
    —- добавлено: 21 Dec 2017 —-
    Шахматная AlphaZero знает только правила - есть генератор ходов, есть определение мата/пата и ничейных правил, немного эвристик типа SEE (правда этот момент я не понял, они пишут что SEE используют классические программы, или что используется в AlphaZero), и больше о шахматах она изначально не знает ничего.
    Нестор likes this.

Share This Page