AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Michael-13 Господин

    • Участник
    Рег.:
    18.11.2011
    Сообщения:
    3.066
    Симпатии:
    1.101
    Репутация:
    29
    Оффлайн
  2. Limavr Новичок

    • Новичок
    Рег.:
    28.12.2017
    Сообщения:
    20
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Скажите, почему всюду пишут, что АЗ не проиграл ни одной партии за белых?
    267W 378D 5L (это результаты АЗ за белых) и 51W 580D 19L (это результаты СФ за белых).
  3. Harutyun Начинающий

    • Начинающий
    Рег.:
    06.12.2017
    Сообщения:
    2
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Получается вполне реально турнир между телефонами и людей. При этом создатели телефонов будут заинтересованы финансированием таких турниров.
    —- добавлено: 30 дек 2017, опубликовано: 30 дек 2017 —-
    Получилась создать сайт по адресу alphazero.ru. Посоветуйте какие разделы там открыть.
  4. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.275
    Симпатии:
    2.642
    Репутация:
    91
    Адрес:
    Москва
    Оффлайн
  5. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    986
    Симпатии:
    82
    Репутация:
    0
    Оффлайн
    Хрен с этой го, когда шахматы нам опять покажут.
    Интересно допилят они прогу или совсем завершили, может хоть в качестве анализа дадут тпу дистанционно что бы можно было ходы вводить и получать анализ как на комп сайтах.
  6. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.908
    Симпатии:
    17.414
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Так Винни писал, что они свернулись
  7. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Тут хотя-бы показали все сыгранные партии...
    Undying нравится это.
  8. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    986
    Симпатии:
    82
    Репутация:
    0
    Оффлайн
    жалко, шахматы более популярная игра, да и заработать они могли делая эти тпу и продавая прогу
    но думаю появятся продолжатели с умными мозгами)
  9. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Заработать? Стоимость TPU сейчас в районе $100k, таких штук надо четыре. Думаю, если кто захочет приобрести такую штуку, и у него есть миллион долларов, и он не из РФ, то, я думаю, он может напрямую обращаться в Deep Mind.
  10. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн

    AlphaZero обучался исключительно посредством «самостоятельной игры» с использованием 5000 TPU первого поколения для создания игр и 64 ТПУ второго поколения для обучения нейронных сетей, все параллельно
    © Wiki
  11. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    30.09.2006
    Сообщения:
    3.355
    Симпатии:
    832
    Репутация:
    26
    Адрес:
    Киев
    Оффлайн
    Ну... для игры его обучать уже не надо. Надо просто загрузить уже обученную сеть. Вроде как играет она на четырёх TPU.
  12. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    А где взять эту обученную сеть? И даже если её отдадут, вряд ли она на 4 TPU в нормальных условиях будет сильнее сильнейших движков.
  13. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.310
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Сильнее сильнейших движков, которые сильнее сильнейших людей ... :facepalm2:
  14. roman57 Учаcтник

    • Участник
    Рег.:
    23.09.2017
    Сообщения:
    116
    Симпатии:
    16
    Репутация:
    1
    Оффлайн
    А0 обыграл чемпиона 2016 , а чемпиона 2017 ещё нужно обыграть
  15. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.310
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Так о том и речь, что Дип Майнд это ненужно! Свернули они это направление.
    Неинтересны им дальнейшие спортивные шахматные достижения. А жаль ...
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    Рег.:
    17.07.2011
    Сообщения:
    14.908
    Симпатии:
    17.414
    Репутация:
    1.070
    Нарушения:
    15
    Оффлайн
    Нисколько не жаль!
    Адванс хоть немного поживёт... если Нефёдов не прикупит себе такую "дуру" :)
  17. svoitsl Учаcтник

    • Участник
    Рег.:
    05.01.2018
    Сообщения:
    254
    Симпатии:
    60
    Репутация:
    7
    Оффлайн
    Что то мне кажется, что заняться движком на новом алгоритме вполне мог бы Васик Райлих.
    Свою Рыбку он забросил, к Фрицу наверное душа не лежит, а вот новое направление довольно перспективное для него.
    Как и для его конторы, где он сейчас творит.
    К тому же в деньгах она особо не стеснена....
    Судя по краткому описанию А0- с точки зрения програмиста не очень уж и сложная штука, наработанные (при обучении) данные вполне можно прикупить у гугла.... Ну а дальше - дело техники и бизнеса
  18. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.100
    Симпатии:
    2.769
    Репутация:
    108
    Нарушения:
    9
    Оффлайн
    А где он работает? И чем занимается?
  19. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.310
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Кстати, да! Где Васик в это тяжелое время?
  20. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Работает на ChessBase, создает новые версии Fritz'а (движка).
  21. roman57 Учаcтник

    • Участник
    Рег.:
    23.09.2017
    Сообщения:
    116
    Симпатии:
    16
    Репутация:
    1
    Оффлайн
    Не люблю Фриц , доступная версия только 14 , но она мне завешивает машину при поражении , забавно что когда он ведёт игру , то всё в порядке - шутка программистов наверно ^_^
  22. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    К 14-му Фрицу Васик не имеет отношение.
  23. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Дебютная теория не стоит на месте!
    Определенное влияние матча заметно и по обновленным книгам движков — см., например, новогоднюю Hiarcs14yBook.
    Продолжают толкать, корректируя, теорию вперед и люди:
    [Event "Sitges Sunway op"]
    [Site "Sitges"]
    [Date "2017.12.19"]
    [Round "5"]
    [White "Gascon del Nogal, Jose Rafael"]
    [Black "Kucuksari, Kaan"]
    [Result "1/2-1/2"]
    [ECO "E17"]
    [WhiteElo "2479"]
    [BlackElo "2290"]
    [PlyCount "81"]
    [EventDate "2017.12.15"]
    [EventType "swiss"]
    [EventRounds "9"]
    [EventCountry "ESP"]
    [SourceTitle "Mega2018 Update 10"]
    [Source "Chessbase"]
    [SourceDate "2017.12.28"]
    [SourceVersion "1"]
    [SourceVersionDate "2017.12.28"]
    [SourceQuality "1"]

    1. Nf3 Nf6 2. c4 b6 3. g3 e6 4. Bg2 Bb7 5. d4 Be7 6. O-O O-O 7. d5 exd5 8. Nh4
    c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 Nxc3 14. Qg4 Bf6
    15. bxc3 Bc8 16. Ba3 Bxf5 17. Qxf5 Qc8 18. Qf3 Rd8 19. Rad1 a5 20. Rd6 h6 21.
    Rxf6 gxf6 22. Qxf6 Re8 23. Qxh6 Qe6 24. Qh4 Ra7 25. c4 f6 26. Bb2 Rh7 27. Qxf6
    Qxf6 28. Bxf6 Re2 29. a4 Rc2 30. Be4 Rxc4 31. Bxh7+ Kxh7 32. Bd8 Rb4 33. Rd1
    Kg6 34. Rd6+ Kf5 35. h4 Ke5 36. Rg6 Rxa4 37. h5 Nd7 38. h6 Nf8 39. Rf6 Nh7 40.
    Rf7 Rd4 41. Bc7+ 1/2-1/2
  24. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Ага, и малювальникам дать приказ: зимой и летом — одним цветом!
    Осталось @z выбрать правильный для этой темы ответ:
    • елка;
    • заяц;
    • доллар/деньги;
    • негр;
    • крокодил;
    • небо;
    • солнце;
    • машина.
  25. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Надо ли добавлять?
    Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
    Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
    P.S. Мехмат'овцы вряд ли ответят...
  26. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.500
    Симпатии:
    2.221
    Репутация:
    51
    Оффлайн
    У меня ощущение, что эта нейросеть пытается нам что-то сказать, но пока получается не очень.
    zeroalphazero, Комсюк и Camon14 нравится это.
  27. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    Рег.:
    28.05.2012
    Сообщения:
    17.678
    Симпатии:
    10.023
    Репутация:
    648
    Нарушения:
    9
    Оффлайн
    Обучите ее грамоте.
  28. Алексанлр Учаcтник

    • Участник
    Рег.:
    16.03.2014
    Сообщения:
    192
    Симпатии:
    216
    Репутация:
    27
    Оффлайн

  29. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Рег.:
    31.03.2017
    Сообщения:
    2.040
    Симпатии:
    2.585
    Репутация:
    135
    Оффлайн
    Она пытается сказать: "Или вы меня считаете за миробля, или вы сами миробли".
    zeroalphazero нравится это.
  30. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    Все очень просто? Сказки — обман?;)
  31. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    629
    Симпатии:
    261
    Репутация:
    27
    Оффлайн
    Вести с полей:

    glinscott commented 5 hours ago

    Have made quite a bit more progress on this, I've got it to the stage I was able to generate good self-play games, and then run the training script to generate a new network. The new network was then 100 ELO stronger than the random mover (after only 160 games!). So, hopefully not too many bugs introduced in the port over :).

    Great work on the OpenCL validation @gcp, I ported that over, and it saved me big-time when I had made a mistake in the OpenCL batch-norm implementation.

    Also, interestingly the CPU implementation with a 5x64 network for chess is competitive with GPUs, except for very beefy new GPUs. That's great for generating training data though! No GPU required :).

    I have noticed that the scaling isn't quite linear per core like I would expect, but haven't dug too deeply into it yet.
    https://github.com/gcp/leela-zero/issues/369
    https://github.com/glinscott/leela-chess
    N1mTzo и nn нравится это.
  32. nn Старожил

    • Участник
    • Старожил
    Рег.:
    25.03.2007
    Сообщения:
    1.100
    Симпатии:
    2.769
    Репутация:
    108
    Нарушения:
    9
    Оффлайн
    Добавлю ссылку
    —- добавлено: 10 янв 2018 —-
    В го учится с нуля чрезвычайно медленно. Leela-Zero еще наверно месяца полтора-два нужно чтобы дойти до уровня полученного от supervised learning
    Наверно, для шахмат тоже не скоро на нормальной уровень выйдет.
    Rom нравится это.
  33. Rom Учаcтник

    • Участник
    Рег.:
    12.02.2012
    Сообщения:
    629
    Симпатии:
    261
    Репутация:
    27
    Оффлайн
    Сетка supervised learning примерно в 5 раз больше чем текущая (6х128 против 5х64). А текущая нейросеть потому и стала обучаться медленнее, что подходит к пределу для своей размерности. Так что текущая сеть может быть никогда и не обгонит сеть supervised learning. Она предназначена только для отработки методов тренировки. Сейчас ещё разок понизят learning rate, доведут текущую сеть до предела и перейдут к тренировке сети нормальной размерности.

    Сейчас главный вопрос - можно ли качественно натренировать новую нейросеть на партиях сыгранных предыдущей нейросетью. Поскольку наигрывание партий как раз наиболее ресурсоёмкий процесс, то прояснение этого вопроса может многое решить. Если получится, то можно будет не начинать тренировку новой нейросети с нуля, а постепенно увеличивать её размерность.
    nn нравится это.
  34. zeroalphazero Учаcтник

    • Участник
    Рег.:
    14.12.2017
    Сообщения:
    133
    Симпатии:
    69
    Репутация:
    4
    Оффлайн
    "Спокойствие, только спокойствие!"
    Вы уж там не переусердствуйте, please, со всякого рода ЕЁ размерностями, ok?:dash:
  35. N1mTzo Учаcтник

    • Участник
    Рег.:
    16.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Кстати, вот тут Интел представила (для широкой публики, так-то анонс был в прошлом году) на CES штуковину под названием Intel Loihi. По виду как обычный проц в исполнении LGA115x (140Вт tdp), то есть это уже гораздо ближе к простому человеку, чем колоссальные нейросети за млн. долларов, доступные только компаниям уровня Гугл.

Поделиться этой страницей