AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Океюшки, парочка подсказок:
    Точно ли причина? Не следствие ли? Тогда следствие чего? Произошедшего до того как?
    Если идея верна, ее невозможно довести до абсурда.
    Даже не буду пытаться доводить. Сэкономлю свое и Ваше время: а что мешало сыграть Nc6 на первом ходу? Ладье "простор", коню воля!
    Т.е. 1... Nc6?! — момент-то это уж действительно первый, первее не бывает! Но напрашивающийся ли?!
     
    Последнее редактирование: 18 дек 2017
    Любитель_ нравится это.
  2. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    можно бы и лайкнуть, но

    знак разрушил впечатление :)
     
    Любитель_ и Нестор нравится это.
  3. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    О-о-о!..
    Был у меня тезка-тренер, простой КМС, но порой, в обидке за державу, 9-му чемпиону письменно дебютные советы-рекомендации давал перед матчем с будущим 11-ым.
    Не прислушался 9-ый. А жаль. Проиграл, конечно...
    Так я о чем? — совсем пацаном, помнится, с ним блицевал иногда-порой, постоянно озадачивая белыми новинкой в Рети на... 2-ом (!) ходу. Балаганили при этом — ну просто труба! Эх,.. есть о чем вспомнить, нечего детям рассказать...
    Ну а уж 1. Nf3!! Nc6?! — знаки сами просятся. Статистика у меня СВОЯ!
     
  4. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Какой к чёрту тёзка может быть у человека с именем zeroalphazero?
     
    Любитель_ и MS нравится это.
  5. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    zeroalphazero, есть комментаторы, которые даже к ходу 1. ...Na6 ставят !?, а не ?! ;)
     
    Любитель_, Camon14 и zeroalphazero нравится это.
  6. hornet
    Оффлайн

    hornet Учаcтник

    Репутация:
    478
    Кстати в обсуждаемой на этой странице партии, ходом g5 сток играл на победу (как мне кажется, и как казалось стоку). Если бы в приоритете была безопасность короля, и гармоничная игра всех фигур - ничейку можно было сделать без проблем. Надо привлечь любителей системы Чужакина, попросить проанализировать опасные элементы по ходу партии (правда как положено по всем пунктам, а не там где хочется). Вообще, на это я намекал, упоминая в одном из постов человеческие критерии...:writing:
     
  7. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Царствие Ему неБесное!
     
    Любитель_, Undying и Комсюк нравится это.
  8. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Подсказка третья.
    Что такое план?
    Затрудняетесь с ответом? — Google Яндекс вам в помощь!
     
  9. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.263
    Виорел, перелогиньтесь!
     
  10. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Он еще молоденок, со мною тягаться слабенок.;)
     
  11. Baron
    Оффлайн

    Baron Учаcтник

    Репутация:
    11
  12. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Вновь идя навстречу требующим продолжения банкета, по-царски готовым пожертвовать свой проц ради всеобщего блага и остро заинтересованным по истечении выплаты долга по кредиту в даже приобретении компа с видеокартами, хочу подкинуть еще парочку картинок — для на их вкус оценки и сравнения.



     
  13. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    687
    Любитель_ нравится это.
  14. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    Ждем матч АльфаЗеро - Либратус ? ;)
     
  15. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    У меня своя "теория дебютов" для блица.:to_become_senile:
    1. Nf3 c5 2. b4!? cxb4 3. a3!? bxa3 4. e4
    или
    1. Nf3 e6 2. e4 d5 3. e5 c5 4. b4!?
     
  16. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
  17. WinPooh
    Онлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    ???
    Не понял
    Чёрных же съели

    А, победа по времени. Видимо, у GNU Go при попытке досчитать лесенку до конца доски переполнились какие-то структуры данных :)
     
    Последнее редактирование: 19 дек 2017
    Zayats нравится это.
  18. WinPooh
    Онлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
  19. Benas
    Оффлайн

    Benas Учаcтник

    Репутация:
    1
    Я не знаю но то, что имею я 3 Дану не победить....
     
  20. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Пророческие строки!
    Пророчество сбылось! => https://www.cfa.harvard.edu/~avanderb/kepler90i.pdf
    http://www.bbc.com/russian/news-42364441
     
    Последнее редактирование: 19 дек 2017
    Любитель_ и Нестор нравится это.
  21. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Скука — двигатель прогресса!
    Теперь, надеюсь, поубавится количество скептиков?
    С сарказмом и иронией относились к рассказу Кирсана Николаевича о встрече с инопланетянами?
    А ведь даже шахматному коню ясно, что это сущая правда!
    Кибернетика многим обязана шахматам. Пришло время возвращать долги! — даже тем, кто некогда вышел из шахматного "Кибернетического клуба", основав нейросетевой.
    Инопланетянам тоже бывает скучно, тоже нравится играть. А у землян — чудесные и мудрые игры!
     
  22. crem
    Оффлайн

    crem Учаcтник

    Репутация:
    14
    Дело не только в железе, а в множестве улучшений алгоритма, существенно ускоряющих обучение. Действительно, общие методы известны уже десятки лет, но без этих улучшений, даже на современном оборудовании гугла обучение бы заняло не часы а годы.
    Даже если сравнить AlphaGo и AlphaZero, то AlphaGo тренировали полтора месяца, а AlphaZero достигла такого же уровня за 8 часов. У AlphaGo по сравнению с предшественниками тоже были существенные улучшения алгоритма (задним числом кажущиеся очевидными).

    Напомню, что за пару часов до того, когда гугл объявил, что AlphaGo обыграл профессионального игрока Go, фейсбук тоже объявил о том, что "мы создали программу, играющую в Go на нейронных сетях, которая играет так же сильно как GnuGo":
    https://www.facebook.com/zuck/videos/vb.4/10102619979032811/
    Фейсбук тоже располагает большими вычислительными мощностями, но одного лишь этого не хватило, чтобы обыграть человека.

    Когда читаешь свежие статьи о machine learning (вообще все, не только от гугла), то они вызывают одну из двух реакций:
    1. Вроде бы это улучшение и так очевидно, зачем об этом писать? (90% статей)
    2. Вот этот совсем простой и общеизвестный метод даёт такие хорошие результаты? Ничего себе! (10% статей).

    Но на самом деле если собрать все эти "очевидные мелочи" вместе, сотнями, то они ускоряют обучение в десятки тысяч раз. И до этих "очевидных мелочей" надо:
    1. Додуматься. Додуматься до нескольких очевидных мелочей просто, а до сотни — не очень.
    2. Решиться попробовать известные методы для задачи, в которой "чутьё" подсказывает, что они не сработают (или быть профессионалом с натренированным "чутьём", и подозревать, что данный метод сработает, хотя окрущающие не верят).
     
    Последнее редактирование: 19 дек 2017
  23. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Дело не только в железе, но и без железа никак.
    Например. MCTS/UCT для нормальной игры требует некоторой производительности. Изначально в ГО оно слабее Альфа-беты, но удвоение скорости дает прибавку больше чем альфа-бета.
    Первые программы на MCTS появились ровно тогда, когда они хоть как-то могли конкурировать с стандартными ГО-программами на доске 9x9.
    Селективный null-move, history - появились тогда, когда производительности железа стало хватать для того чтоб они давали заметную прибавку.

    ИМХО и тут так-же. Шахматы на MCTS+НС появились именно тогда, когда у Гугла появилась возможность запустить обучение на сверхмощностях.
    На GPU и на обучение уйдут годы, и производительности для нормальной силы игры не хватит.
    Железо, на котором обучалась AlphaZero - в сотню тысяч раз мощнее достаточно серьезного компа.

    То есть если бы не Гугл, то это бы сделал кто-нибудь другой, когда появились бы необходимые вычислительные ресурсы.
    —- добавлено: 19 дек 2017 —-
    Были попытки сделать играющую шахматную программу на MCTS. И были попытки сделать играющую шахматную программу на НС. И то и другое не ново.
    —- добавлено: 19 дек 2017, опубликовано: 19 дек 2017 —-
    Если я правильно прочел аннотацию, Фейсбук сделал программу, играющую в силу GnuGo без перебора, только НС. А Alpha играет с перебором.
     
    Любитель_ и MS нравится это.
  24. MS
    Оффлайн

    MS Михаил Семионенков

    Репутация:
    175
    Готов поверить на слово, поскольку я посмотрел материалы только с одной стороны - Монте-Карло, там шибко интересного не проглядывается. На подробности обучения НС пороху не хватило.
     
  25. Мобуту
    Онлайн

    Мобуту спаситель нации баннер

    Репутация:
    141
    Ну я согласен, что это тоже очень сильный ход. В том плане, что дебюты специально подобрали невыгодные для Стокфиша, а чтоб с них не соскочил с помощью генератора случайных чисел - лишили дебютной книжки. Такой первый ход мог бы смешать белым все карты.

    Но всё-таки это вряд ли была последняя возможность развить лошадку. А вот 23-й ход - возможно, действительно последняя.
     
    zeroalphazero и Нестор нравится это.
  26. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    По-человечески: 23... b5, зная дальнейшее, выглядит потерей темпа.
    Но если в "план" AlphaZero действительно входило это "дальнейшее" (вскрытие вертикали h, гармонично цельная и быстрая перегруппировка с темповой игрой — переброска ферзя, создание батареи ферзь+слон, освобождение диагонали разменом для безопасного подъема короля-занозы — коммуникации созданы! — нижняя горизонталь и правая вертикаль свободны, тяжелая артиллерия выведена на идеальные позиции, 32. с4 и 33. Bd4 заключительными аккордами), то 23. Qc4 выглядит провокацией.
    Т.е. почему не сразу привести весь план в действие?
    Т.е. что за корректировка плана?!
    —- добавлено: 20 дек 2017, опубликовано: 20 дек 2017 —-
    Кстати, в одном из вариантов (см. предложенное выше 23... Kg7!?) при не совсем точной игре черных белые не вскрывают вертикаль, а доводят пешку до h7.

    Как Вам позиция?
     
  27. Yury_Solomatin
    Оффлайн

    Yury_Solomatin Учаcтник

    Репутация:
    24
    ШахматыЭтоДиагноз, Rom и Нестор нравится это.
  28. ШахматыЭтоДиагноз
    Оффлайн

    ШахматыЭтоДиагноз Учаcтник

    Репутация:
    207
    Будут цитировать эту ветку. :)
     
    Комсюк нравится это.
  29. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    У шахмат много общего с музыкой.
    Таких смен тональностей (модуляций) я до этого матча не видел.
    Шедевры! Фантастика! Искусство...
     
    WinPooh нравится это.
  30. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Вообщем-то, согласен. Все опасные, на первый взгляд, эндшпили там ничейны.
    А если сыграть этот ход на 9 ходов раньше:



    50.Bd5!?....Основной вариант указали на talkchess.com - 50. Bd5 Qg8 51. Qa4 Rd8 52. Qxa7 Qh8 53. Qa5 Ke8 54. Qc3 Qf8 55. a4 Qxh6 56. Rf3 f5 57. a5
     
    Нестор нравится это.
  31. cs111g
    Оффлайн

    cs111g Начинающий

    Репутация:
    1
    Шикарнейший вариант (похоже, там выиграно).
    Пока удалось нащупать лишь 50... Rc8 51. Qf4 Qg8 52. Bb7 Rce8 53. Qd6 c4 54. a4 c3 55. Bd5 Rd8 56. Qc5 Ke8 57. Qxc3 Qf8 58. Rf4 Re6 59. a5 Qd6 60. Bxe6 dxe6 61. Qh8 Qf8, где также нет гарантии ничьей.
    Про 50. Qf4 можно забыть =)
     
    Нестор нравится это.
  32. Fruit
    Оффлайн

    Fruit Александр баннер

    Репутация:
    3
    Тут основной принцип, чем раньше играешь Bd5, тем лучше.:) Поэтому, наверняка, сильнее 54. Bd5
     
  33. cs111g
    Оффлайн

    cs111g Начинающий

    Репутация:
    1
    Тогда что-то типа 54... Rd8 55. Rf4 Ke8 56. Qf6 Qf8 57. Rxc4 Re6 58. Bxe6 dxe6 59. Qe5 Qf5 60. Qh8+ Ke7 61. Qg7+ Qf7 62. Qc3 Qf5.
    В общем, сохранить красавца-слона сложно.

    PS: А вы не подскажите, как в оболочке Fritz копировать варианты ходов из нотации?
     
  34. hornet
    Оффлайн

    hornet Учаcтник

    Репутация:
    478
    Вот что ответил товарищ NeuNeuro в теме Система Чужакина ...:
    - " Нейронная сеть не то что в шахматы играть не умеет, её даже ходу шахматной ладьи не научить.

    Статьи, в которых пишут об успехах ИНС (искусственной нейронной сети) в игре в шахматы или шашки, обычно мелким шрифтом добавляют, что ИНС используется лишь в оценке позиций, которые прежде получены обычными необучаемыми программами.
    Выше писал о том, что человека от обезьяны отличает умение использовать пальцы для расчёта бананов. Так вот - пока не существует ИНС или иной обучаемой автоматической системы, которую можно "по-честному" обучить СЧИТАТЬ. ИНС легко научить "аналоговым" расчётам по типу "много - мало" или "больше-меньше", но цифровой расчёт - нет. Логическое мышление - это будущее ИИ, в настоящем оно практически отсутствует.".
     
  35. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Отличие AlphaZero (и AlphaGo Zero) от предыдущих версий в том, что она учится с нуля. То есть не использует партии и позиции человеческие и полученные другими программами. Учится на партиях наигранных самой с собой. Именно об этом и говорит слово Zero в названии.
    —- добавлено: 21 дек 2017 —-
    Шахматная AlphaZero знает только правила - есть генератор ходов, есть определение мата/пата и ничейных правил, немного эвристик типа SEE (правда этот момент я не понял, они пишут что SEE используют классические программы, или что используется в AlphaZero), и больше о шахматах она изначально не знает ничего.
     
    Последнее редактирование: 21 дек 2017
    Нестор нравится это.