AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.546
    Симпатии:
    1.265
    Репутация:
    36
    Адрес:
    Киев
    Оффлайн
    Уже обсуждалось. Стокфиш уже несколько лет совершенствуется играя сам с собой. И про этом, если посчитать с терафлопсах, за эти годы их было потрачено меньше, чем AlphaZero за несколько часов.
  2. Valen548 Новичок

    • Новичок
    Рег.:
    09.10.2016
    Сообщения:
    47
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Не спорю, но хотелось бы увидеть оценки терафлопсов Стока и Альфа0.
  3. dom1n1k Учаcтник

    • Участник
    Рег.:
    18.11.2016
    Сообщения:
    187
    Симпатии:
    155
    Репутация:
    3
    Оффлайн
    Эту версию можно было бы обсуждать, если бы не было одного маленького "но" - а именно предшествующей истории с го и парочкой побитых корейцев. Она показывает, что за исключением некоторых нюансов, в целом, всё реально.
    Так что бубнеж про обман обывателей - это просто обычная реакция срывателей покровов.
  4. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.546
    Симпатии:
    1.265
    Репутация:
    36
    Адрес:
    Киев
    Оффлайн
    Ну всё-таки корейцы это люди. Думаю Карлсена или Каспарова AlphaZero тоже кверенно обыграет. Кроме того игры разные. Шахматы лучше подходят для альфа-бета перебора. В го нет приемлемой оценки, поэтому считать надо до конца.
  5. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    [голосом Джигарханяна] Вот это уже теплее :)
    Вопрос первый. Как вы думаете, почему они разрекламировали матч с Седолем, если главное - научные цели?
    Вопрос второй. Как вы думаете, почему, несмотря на названные Вами в первом вопросе аргументы, матч со Стоком они рекламировать НЕ стали?
    :roll:
  6. Valen548 Новичок

    • Новичок
    Рег.:
    09.10.2016
    Сообщения:
    47
    Симпатии:
    5
    Репутация:
    1
    Оффлайн

    В Го компы у людей-топов не выигрывали до Альфа Го.Поэтому в глазах многих это была веха - комп выигрывает в Го у топа-человека.
    В шахматы выигрывали у людей-топов уже 20 лет назад, так что в то, что компы умеют играть в шахматы сомнений немного было.
    Тут есть элемент маркетинга, но все равно сам по себе результат если не краеугольный, то важный и интересный.
  7. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.546
    Симпатии:
    1.265
    Репутация:
    36
    Адрес:
    Киев
    Оффлайн
    Ну... потому что для матча со Стоком, по хорошему, им надо было бы вызвать команду разработчиков. Далее призовой фонд. Далее шесть партий вообще не показательны, ... Да и уверенности большой нет в результате.
  8. dom1n1k Учаcтник

    • Участник
    Рег.:
    18.11.2016
    Сообщения:
    187
    Симпатии:
    155
    Репутация:
    3
    Оффлайн
    Так в этом же и состоит глобальная цель всей работы - уйти от тупого счета в сторону "понимания" позиции (в кавычках, конечно). Никакого счета до конца в го быть не может, потому что доска в (19/8)^2=5.6 раз больше, вариантов ***ец сколько.

    Вам кажется, что вы меня поймали на противоречии? Вам кажется. Отличий достаточно:
    1) Матч с Седолем был намного более историческим событием, поскольку го считалась пока ещё человеческой территорией.
    2) Официального матча со Стокфишем (пока ещё) не было вовсе. Были тестовые партии, это промежуточный рабочий результат.
    3) У AlphaGo не было достойных конкурентов в стенах лаборатории - с кем сравниваться? Не с кем, вот и пришлось выходить "в люди". В шахматах тестироваться есть на чём.
    4) AlphaZero не стали до упора держать в секрете именно потому, что уже была AlphaGo.
    Undying и crem нравится это.
  9. crem Учаcтник

    • Участник
    Рег.:
    24.11.2016
    Сообщения:
    140
    Симпатии:
    203
    Репутация:
    14
    Оффлайн
    Именно потому что у AlphaGo не было конкурентов, гугл взял на работу Fan Hui, тайно сыграл с ним турнир, и потом опубликовал результат в статье.
    https://en.wikipedia.org/wiki/AlphaGo_versus_Fan_Hui

    И лишь спустя полгода был турнир с Ли Седолом (и в течение этого полугода народ тоже ныл о всяких нечестных подтасовках, о том что побоялись играть с сильным соперником и т.д.).

    То же самое происходит и сейчас, только никакого Fan Hui брать на работу в гугл не пришлось, потому что и без того есть достойный соперник (Stockfish). Точно так же тайно сыграли турнир, поделились результатами в статье, и где-нибудь через полгода объявят какой-нибудь яркий турнир, с договорённым регламентом, с настоящей рекламой, с прямым эфиром и комментаторами и т д.
    dom1n1k и Gridnev нравится это.
  10. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
  11. FIBM Учаcтник

    • Участник
    Рег.:
    27.05.2011
    Сообщения:
    395
    Симпатии:
    312
    Репутация:
    7
    Оффлайн
    Понял, вы путаете: вероятность локальных минимумов намного меньше чем вероятность возникновения седла. Но речь о другом: нахождение глобального минимума, и для этой задачи "застревание в локальных минимумах"-главная проблема.
  12. альфазеры Начинающий

    • Начинающий
    Рег.:
    12.12.2017
    Сообщения:
    2
    Симпатии:
    5
    Репутация:
    0
    Оффлайн
    в 1970-х годах в электронных калькуляторах появились первые микропроцессоры, также стало широко известно, что рост мощности микропроцессоров следует закону Мура, который утверждает, что число транзисторов на интегральной микросхеме удваивается каждые 18 месяцев.

    В феврале 1996 года Гарри Каспаров победил шахматный суперкомпьютер Deep Blue. Этот матч выдающийся тем, что первую партию выиграл Deep Blue, автоматически став первым компьютером, победившим чемпиона мира по шахматам в турнирных условиях. Deep Blue вычислял 50 миллиардов позиций каждые три минуты, в то время как Каспаров 10 позиций за это же время. В Deep Blue было 200 процессоров


    2006год — чемпион мира по шахматам, Владимир Крамник, побеждён программой Deep Fritz

    2014год — американский гроссмейстер, Хикару Накамура, проиграл мини-матч программе Stockfish 5 со счётом 1-3 (+0=2-2). Две первые партии человек играл с форой в одну пешку, а две последующие без форы, но с использованием подсказок шахматной программы Rybka 3.

    2050год философы-машины будут рассуждать о зарождении первых микрочипов из песка океанических пляжей силами самой природы без участия в этом какого-либо разума. попутно доказывая невозможность существования высокоорганизованных, разумных белковых форм жизни ссылками на природные условия земли, луны и тому подобное...
    Любитель_ и Challenger Spy нравится это.
  13. Gridnev Старожил

    • Участник
    • Старожил
    Рег.:
    01.06.2012
    Сообщения:
    652
    Симпатии:
    3.632
    Репутация:
    152
    Оффлайн
    Наверное, tiger знает о чем говорит, все зависит от конретной функции. Но в общем FIBM прав - проблема чаще всего именно в локальных минимумах. Для гладких функций работает т.н. метод градиентного спуска, он из седел моментально вырывается, но потом ваш поиск крутится вокруг одной точки - локального минимума. Для преодоления именно этой проблемы существует целый ряд алгоритмов (симулированное охлаждение, прыжки по ямкам и т.д.) Например, в методе ямок с помощью м-да Монте Карло дается толчок, который позволяет выскочить из ловушки локального минимума. Далее ищется следующий локальный минимум методом градиентного спуска. Так были найдены конструкции Леннард-Джонсовских кластеров из 110 атомов (109*3 степеней свободы).
  14. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    3.502
    Симпатии:
    4.570
    Репутация:
    206
    Оффлайн
    Подгонка эксперимента под результаты настораживает потому что все эти самообучающиеся нейросети предназначены для более серьезных задач чем просто фигурки двигать. Посадишь такого недоделанного "профессора" за пульт управления, а он нажмет из любопытства красную кнопку.
  15. Neo94 Учаcтник

    • Участник
    Рег.:
    15.11.2014
    Сообщения:
    434
    Симпатии:
    144
    Репутация:
    -10
    Оффлайн
    Рекламу и шум делают ноющие шахматисты и шахматные специалисты.
    От гугла рекламы наоборот крайне мало.
    N1mTzo и Undying нравится это.
  16. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Там проблема не столько в локальных минимумах, сколько в длинных "ущельях" по которым можно долго-долго спускаться...
  17. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    соглашусь тут с одним оратором, что этот А0 может проиграть какому-то второразряднику, т.к. сеть затачивалась скорее всего под игру с сильным соперником.
    по своему опыту скажу, что иногда играя с 3-2 разрядом удивляешься некоторым нешаблонным решениям, у них мышление еще не шаблонизировано, а их местами слабая игра усыпляет, что можно и фигу зевнуть, была на ютубе одна партия где С.Ю. зевнул фигуру какому-то разряднику, тот еме усыпил слабой игрой.
    так вот, вполне может быть, что игра А0 заточена под совсем другие шаблоны игры и против других более слабых не потянет. поэтому хухул своего черта из табакерки запихали обратно у шкапчик(как говорит нармод) подальше и вряд ли будет доставать.
  18. FIBM Учаcтник

    • Участник
    Рег.:
    27.05.2011
    Сообщения:
    395
    Симпатии:
    312
    Репутация:
    7
    Оффлайн
    А это вы откуда взяли? Монте-Карло же и используют, чтобы лучше находить "глобальные" минимумы. Про проблему "ущельев" (переход из седла в минимум, что ли?) не слышал.
  19. Valen548 Новичок

    • Новичок
    Рег.:
    09.10.2016
    Сообщения:
    47
    Симпатии:
    5
    Репутация:
    1
    Оффлайн
    Удивляться решениям 2-3 разряда можно если сам играешь в силу 2-3 разряда.
    N1mTzo нравится это.
  20. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    еще немного бро, и ты будешь с Владруссом на одной волне, от заговора хухль и майкрософт к заговору мирового сионизьма.:to_become_senile:
    —- добавлено: 12 дек 2017 —-
    тогда уж 4-го.
  21. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    пора принимать закон о защите чувств шахматистов.

    США и ее корпорации уже так зашкварены, что поэтому многие люди уже не верят в лунную программу, это был такой же пиар ход как и АльфаГо, только снятый в Холливуде.
  22. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    я говорю только "шкапчик"... да и то по Егору Прокудину
    К остальному бреду отношения не имею, заявляю официально!
  23. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Не крепость:

    Код:
    info depth 60 seldepth 91 multipv 1 score cp -667 nodes 457771603816 nps 10096364 hashfull 999 tbhits 1189396488 time 45340242 pv f2e2 a2a1 e2f2 a1d1 f2f5 e5d4 e4e5 d1e1 g3g4 e1e5 f5f1 e5e2 g2f3 e2c2 f3e4 c2b2 e4d5 b2b3 d5e4 g7g6 f1d1 b3b4 e4d5 b4b2 d1a1 b2h2 a1a6 d4f6 d5c5 h2h3 c5b5 h3d3 a6a2 d3b3 b5c6 b3c3 c6b5 f6e5 a2a6 g6g7 a6a7 g7f8 a7a6 c3e3 a6h6 f8f7 h6c6 e3e4 b5a6 e4g4 a6b7 g4b4 b7a6 b4d4 c6c8 d4g4 a6b5 f7g6 c8f8 g4g2 b5a5 g2g3 a5b5 g3b3 b5a4 b3c3 f8a8 g6f5 a8a6 c3g3 a6h6 g3g4 a4a3 g4g3 a3b4 g3e3
  24. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    я вчера эту же ветку нашёл на меньшей глубине
    Но всё равно, спасибо за участие :)
    sovaz1997 нравится это.
  25. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Комсюк, да я и не планировал тебя подтягивать, ты еще не дорос. Только это не бред, ты просто не шаришь в нейронных сетях) ты запутался в сетях интернета.
    Представь, что Сток и Альфа это 2 боксера, ростом 2 метра. И вот Альфа натренировалась на себе и Стоке бить в лицо сопернику на уровне 1,8 метра. А потом вдруг Альфе дали соперника 1,5 метра. И вот Альфа бьет на уровне 1,8 метра, а там пустота и все мимо, а этот коротыш стоит и бьет Альфу по яйцам печени и вырубает Альфу. Вот такие пироги.
    Именно потому, что у Альфы не было других соперников кроме себя и Стока возможна такая петрушка. Ну про 2 разряд я может и утрирую (хотя чем черт не шутит) , но то, что Альфу может вырубить какая-то прога с рейтингом около 2500 это вполне реально.
  26. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    Camon14, эта Альфа такая мошенница, что полутораметрового может и с ноги уложить
  27. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Нейросеть конечно же не дает ходов-кандидатов, а дает оценку поданной на вход позиции. Это полный аналог ОФ. А выбор хода производится переборными алгоритмами, но в данном случае это не альфа-бета, а mcts.
    В чем суть mcts? Это наигрывание партий «до конца, до результата» со сбором статистики результата по ходам сыгранным в партии. При наигрывании партий выбор хода производится согласно собранной статистики и оценке позиции после этого хода.
    thenewone, Любитель_, MS и 2 другим нравится это.
  28. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    У меня другая ассоциация...
    Это профессиональный бокс среди лиц с ограниченными возможностями. Только Альфа в инвалидном кресле с моторчиком, а Сток на костылях, один из них дебютный, а второй эндшпильный.
    В равном бою Вяленый дотянулся бы до Зеры, хоть головой бы боднул, хоть костылём моторчик повредил...
    Но промоутеры Альфы добились матча, в котором Сток без костылей
    Чтобы наверняка :diablo:
    Любитель_ и Diamond нравится это.
  29. tiger Новичок

    • Новичок
    Рег.:
    11.02.2006
    Сообщения:
    85
    Симпатии:
    25
    Репутация:
    1
    Оффлайн
    Да, интересно понять как устроена поверхность функции ошибки. Но напрямую это сделать тяжело. Может быть можно начать шевелить шахматы, упрощая по чуть- чуть правила игры. Для каждой новой игры будет своя поверхность. В какой-то момент игра станет совсем простой, и ее поверхность скорее всего не будет иметь седловых точек, то есть будет выпуклой. Найдя глобальный минимум в этом случае мы пойдем обратно по той же дорожке от этой тривиальной игры к шахматам, следя за тем, что происходит с нашим глобальным минимумом по пути. По пути назад будут встречаться и быстро исчезать вырожденные поверхности, например с локальными минимумами, но возможно удастся понять как устроена изначальная поверхность. Чтобы следить как меняется поверхность у нас есть средство в виде траекторий решения простой выпуклой задачи (от разных начальных точек к глобальному минимуму). Весь этот набор траекторий, изначально сходившихся к минимуму будет по пути обратно к шахматам меняться, и позволит что-то понять про изначальную поверхность.
  30. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    прочитал "дебильный":oops:
    З.Ы. мне вот интересно можно ли игру придумать где человек будет сильнее еще лет 50-100 хотя бы. З.З.Ы. догони меня кирпич и т.п. подобное не предлагать.
  31. Сергей Иванников Старожил

    • Участник
    • Старожил
    Рег.:
    04.07.2013
    Сообщения:
    1.286
    Симпатии:
    362
    Репутация:
    41
    Оффлайн
    Очередной попкорн для неокрепших умов - искусственный нейрон, искусственная нейронная сеть . Звучит эффектно - не более. Гугл выполняет указание Трампа - Америка должна шуметь как можно больше, а то ее там на острове совсем позабудут.
    Нейроном может обладать только белковая сеть, увы или к счастью - это другой вопрос. Если кто не верит , может ударить молотком по этой машине и посмотреть, обучится она или нет.
    Машина - это максимум ПРОЦЕССОР, работа которого основана на всем известным свойствах полупроводников. Ну тогда Стокфиш - это тоже нейронная сеть, сколько раз наблюдал как он ''самообучался". Иногда '' не видит'' простых вещей, но когда ткнешь его носом, сразу ''самообучался''.
    Camon14 нравится это.
  32. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Точки. В школе многие играли на листочке в клеточку. Похоже на Го, но не Го. А если познакомиться поближе - так и совсем не Го. И очень сложно. Доска в несколько раз больше стандартного гобана...
    https://playdots.ru/
    Challenger Spy нравится это.
  33. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    https://playdots.ru/aboutgame/
    :lol:
  34. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    http://arimaa.com/arimaa/
    Создавалась как игра, в которую программы долго не смогут достичь силы игры человека.
    Camon14 нравится это.
  35. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн

Поделиться этой страницей