AlphaZero. Нейронная сеть играет в шахматы

Discussion in 'Машинное отделение' started by grizly, 6 Dec 2017.

  1. Michael-13 Господин

    • Участник
    • Старожил
    Member Since:
    18.11.2011
    Message Count:
    3.068
    Likes Received:
    1.098
    Репутация:
    29
    Оффлайн
  2. Limavr Зарегистрирован

    Member Since:
    29.12.2017
    Message Count:
    24
    Likes Received:
    5
    Репутация:
    0
    Оффлайн
    Скажите, почему всюду пишут, что АЗ не проиграл ни одной партии за белых?
    267W 378D 5L (это результаты АЗ за белых) и 51W 580D 19L (это результаты СФ за белых).
  3. Harutyun Начинающий

    • Начинающий
    Member Since:
    07.12.2017
    Message Count:
    2
    Likes Received:
    0
    Репутация:
    0
    Оффлайн
    Получается вполне реально турнир между телефонами и людей. При этом создатели телефонов будут заинтересованы финансированием таких турниров.
    —- добавлено: 30 Dec 2017, опубликовано: 30 Dec 2017 —-
    Получилась создать сайт по адресу alphazero.ru. Посоветуйте какие разделы там открыть.
  4. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.494
    Likes Received:
    3.126
    Репутация:
    95
    Location:
    Москва
    Оффлайн
  5. просроченый_кмс Старожил

    • Участник
    • Старожил
    Member Since:
    15.02.2010
    Message Count:
    1.112
    Likes Received:
    167
    Репутация:
    6
    Оффлайн
    Хрен с этой го, когда шахматы нам опять покажут.
    Интересно допилят они прогу или совсем завершили, может хоть в качестве анализа дадут тпу дистанционно что бы можно было ходы вводить и получать анализ как на комп сайтах.
  6. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.270
    Нарушения:
    27
    Оффлайн
    Так Винни писал, что они свернулись
  7. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Тут хотя-бы показали все сыгранные партии...
    Undying likes this.
  8. просроченый_кмс Старожил

    • Участник
    • Старожил
    Member Since:
    15.02.2010
    Message Count:
    1.112
    Likes Received:
    167
    Репутация:
    6
    Оффлайн
    жалко, шахматы более популярная игра, да и заработать они могли делая эти тпу и продавая прогу
    но думаю появятся продолжатели с умными мозгами)
  9. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Заработать? Стоимость TPU сейчас в районе $100k, таких штук надо четыре. Думаю, если кто захочет приобрести такую штуку, и у него есть миллион долларов, и он не из РФ, то, я думаю, он может напрямую обращаться в Deep Mind.
  10. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн

    AlphaZero обучался исключительно посредством «самостоятельной игры» с использованием 5000 TPU первого поколения для создания игр и 64 ТПУ второго поколения для обучения нейронных сетей, все параллельно
    © Wiki
  11. Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.547
    Likes Received:
    1.299
    Репутация:
    37
    Location:
    Киев
    Оффлайн
    Ну... для игры его обучать уже не надо. Надо просто загрузить уже обученную сеть. Вроде как играет она на четырёх TPU.
  12. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    02.05.2006
    Message Count:
    6.811
    Likes Received:
    96
    Репутация:
    3
    Location:
    Санкт-Петербург
    Оффлайн
    А где взять эту обученную сеть? И даже если её отдадут, вряд ли она на 4 TPU в нормальных условиях будет сильнее сильнейших движков.
  13. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    11.04.2006
    Message Count:
    2.955
    Likes Received:
    3.315
    Репутация:
    331
    Location:
    Москва
    Оффлайн
    Сильнее сильнейших движков, которые сильнее сильнейших людей ... :facepalm2:
  14. roman57 Учаcтник

    • Участник
    Member Since:
    23.09.2017
    Message Count:
    116
    Likes Received:
    16
    Репутация:
    1
    Оффлайн
    А0 обыграл чемпиона 2016 , а чемпиона 2017 ещё нужно обыграть
  15. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    11.04.2006
    Message Count:
    2.955
    Likes Received:
    3.315
    Репутация:
    331
    Location:
    Москва
    Оффлайн
    Так о том и речь, что Дип Майнд это ненужно! Свернули они это направление.
    Неинтересны им дальнейшие спортивные шахматные достижения. А жаль ...
  16. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.250
    Likes Received:
    23.518
    Репутация:
    1.270
    Нарушения:
    27
    Оффлайн
    Нисколько не жаль!
    Адванс хоть немного поживёт... если Нефёдов не прикупит себе такую "дуру" :)
  17. svoitsl Учаcтник

    • Участник
    Member Since:
    06.01.2018
    Message Count:
    374
    Likes Received:
    91
    Репутация:
    7
    Оффлайн
    Что то мне кажется, что заняться движком на новом алгоритме вполне мог бы Васик Райлих.
    Свою Рыбку он забросил, к Фрицу наверное душа не лежит, а вот новое направление довольно перспективное для него.
    Как и для его конторы, где он сейчас творит.
    К тому же в деньгах она особо не стеснена....
    Судя по краткому описанию А0- с точки зрения програмиста не очень уж и сложная штука, наработанные (при обучении) данные вполне можно прикупить у гугла.... Ну а дальше - дело техники и бизнеса
  18. nn Старожил

    • Участник
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Оффлайн
    А где он работает? И чем занимается?
  19. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    11.04.2006
    Message Count:
    2.955
    Likes Received:
    3.315
    Репутация:
    331
    Location:
    Москва
    Оффлайн
    Кстати, да! Где Васик в это тяжелое время?
  20. N1mTzo Учаcтник

    • Участник
    Member Since:
    17.04.2008
    Message Count:
    318
    Likes Received:
    30
    Репутация:
    1
    Оффлайн
    Работает на ChessBase, создает новые версии Fritz'а (движка).
  21. roman57 Учаcтник

    • Участник
    Member Since:
    23.09.2017
    Message Count:
    116
    Likes Received:
    16
    Репутация:
    1
    Оффлайн
    Не люблю Фриц , доступная версия только 14 , но она мне завешивает машину при поражении , забавно что когда он ведёт игру , то всё в порядке - шутка программистов наверно ^_^
  22. N1mTzo Учаcтник

    • Участник
    Member Since:
    17.04.2008
    Message Count:
    318
    Likes Received:
    30
    Репутация:
    1
    Оффлайн
    К 14-му Фрицу Васик не имеет отношение.
  23. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Дебютная теория не стоит на месте!
    Определенное влияние матча заметно и по обновленным книгам движков — см., например, новогоднюю Hiarcs14yBook.
    Продолжают толкать, корректируя, теорию вперед и люди:
    [Event "Sitges Sunway op"]
    [Site "Sitges"]
    [Date "2017.12.19"]
    [Round "5"]
    [White "Gascon del Nogal, Jose Rafael"]
    [Black "Kucuksari, Kaan"]
    [Result "1/2-1/2"]
    [ECO "E17"]
    [WhiteElo "2479"]
    [BlackElo "2290"]
    [PlyCount "81"]
    [EventDate "2017.12.15"]
    [EventType "swiss"]
    [EventRounds "9"]
    [EventCountry "ESP"]
    [SourceTitle "Mega2018 Update 10"]
    [Source "Chessbase"]
    [SourceDate "2017.12.28"]
    [SourceVersion "1"]
    [SourceVersionDate "2017.12.28"]
    [SourceQuality "1"]

    1. Nf3 Nf6 2. c4 b6 3. g3 e6 4. Bg2 Bb7 5. d4 Be7 6. O-O O-O 7. d5 exd5 8. Nh4
    c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 Nxc3 14. Qg4 Bf6
    15. bxc3 Bc8 16. Ba3 Bxf5 17. Qxf5 Qc8 18. Qf3 Rd8 19. Rad1 a5 20. Rd6 h6 21.
    Rxf6 gxf6 22. Qxf6 Re8 23. Qxh6 Qe6 24. Qh4 Ra7 25. c4 f6 26. Bb2 Rh7 27. Qxf6
    Qxf6 28. Bxf6 Re2 29. a4 Rc2 30. Be4 Rxc4 31. Bxh7+ Kxh7 32. Bd8 Rb4 33. Rd1
    Kg6 34. Rd6+ Kf5 35. h4 Ke5 36. Rg6 Rxa4 37. h5 Nd7 38. h6 Nf8 39. Rf6 Nh7 40.
    Rf7 Rd4 41. Bc7+ 1/2-1/2
  24. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Ага, и малювальникам дать приказ: зимой и летом — одним цветом!
    Осталось @z выбрать правильный для этой темы ответ:
    • елка;
    • заяц;
    • доллар/деньги;
    • негр;
    • крокодил;
    • небо;
    • солнце;
    • машина.
  25. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Надо ли добавлять?
    Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
    Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
    P.S. Мехмат'овцы вряд ли ответят...
  26. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    10.05.2006
    Message Count:
    3.626
    Likes Received:
    2.535
    Репутация:
    52
    Оффлайн
    У меня ощущение, что эта нейросеть пытается нам что-то сказать, но пока получается не очень.
  27. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Старожил
    Member Since:
    28.05.2012
    Message Count:
    18.575
    Likes Received:
    10.945
    Репутация:
    688
    Оффлайн
    Обучите ее грамоте.
  28. Алексанлр Учаcтник

    • Участник
    Member Since:
    16.03.2014
    Message Count:
    192
    Likes Received:
    216
    Репутация:
    27
    Оффлайн

  29. ШахматыЭтоДиагноз Учаcтник

    • Участник
    Member Since:
    31.03.2017
    Message Count:
    3.555
    Likes Received:
    4.644
    Репутация:
    210
    Оффлайн
    Она пытается сказать: "Или вы меня считаете за миробля, или вы сами миробли".
    zeroalphazero likes this.
  30. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    Все очень просто? Сказки — обман?;)
  31. Rom Старожил

    • Участник
    • Старожил
    Member Since:
    12.02.2012
    Message Count:
    645
    Likes Received:
    276
    Репутация:
    28
    Оффлайн
    Вести с полей:

    glinscott commented 5 hours ago

    Have made quite a bit more progress on this, I've got it to the stage I was able to generate good self-play games, and then run the training script to generate a new network. The new network was then 100 ELO stronger than the random mover (after only 160 games!). So, hopefully not too many bugs introduced in the port over :).

    Great work on the OpenCL validation @gcp, I ported that over, and it saved me big-time when I had made a mistake in the OpenCL batch-norm implementation.

    Also, interestingly the CPU implementation with a 5x64 network for chess is competitive with GPUs, except for very beefy new GPUs. That's great for generating training data though! No GPU required :).

    I have noticed that the scaling isn't quite linear per core like I would expect, but haven't dug too deeply into it yet.
    https://github.com/gcp/leela-zero/issues/369
    https://github.com/glinscott/leela-chess
    N1mTzo and nn like this.
  32. nn Старожил

    • Участник
    • Старожил
    Member Since:
    25.03.2007
    Message Count:
    1.459
    Likes Received:
    3.109
    Репутация:
    124
    Оффлайн
    Добавлю ссылку
    —- добавлено: 10 Jan 2018 —-
    В го учится с нуля чрезвычайно медленно. Leela-Zero еще наверно месяца полтора-два нужно чтобы дойти до уровня полученного от supervised learning
    Наверно, для шахмат тоже не скоро на нормальной уровень выйдет.
    Rom likes this.
  33. Rom Старожил

    • Участник
    • Старожил
    Member Since:
    12.02.2012
    Message Count:
    645
    Likes Received:
    276
    Репутация:
    28
    Оффлайн
    Сетка supervised learning примерно в 5 раз больше чем текущая (6х128 против 5х64). А текущая нейросеть потому и стала обучаться медленнее, что подходит к пределу для своей размерности. Так что текущая сеть может быть никогда и не обгонит сеть supervised learning. Она предназначена только для отработки методов тренировки. Сейчас ещё разок понизят learning rate, доведут текущую сеть до предела и перейдут к тренировке сети нормальной размерности.

    Сейчас главный вопрос - можно ли качественно натренировать новую нейросеть на партиях сыгранных предыдущей нейросетью. Поскольку наигрывание партий как раз наиболее ресурсоёмкий процесс, то прояснение этого вопроса может многое решить. Если получится, то можно будет не начинать тренировку новой нейросети с нуля, а постепенно увеличивать её размерность.
    nn likes this.
  34. zeroalphazero Учаcтник

    • Участник
    Member Since:
    14.12.2017
    Message Count:
    133
    Likes Received:
    69
    Репутация:
    4
    Оффлайн
    "Спокойствие, только спокойствие!"
    Вы уж там не переусердствуйте, please, со всякого рода ЕЁ размерностями, ok?:dash:
  35. N1mTzo Учаcтник

    • Участник
    Member Since:
    17.04.2008
    Message Count:
    318
    Likes Received:
    30
    Репутация:
    1
    Оффлайн
    Кстати, вот тут Интел представила (для широкой публики, так-то анонс был в прошлом году) на CES штуковину под названием Intel Loihi. По виду как обычный проц в исполнении LGA115x (140Вт tdp), то есть это уже гораздо ближе к простому человеку, чем колоссальные нейросети за млн. долларов, доступные только компаниям уровня Гугл.

Share This Page