AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Michael-13
    Оффлайн

    Michael-13 Господин

    Репутация:
    29
  2. Limavr
    Оффлайн

    Limavr Зарегистрирован

    Репутация:
    0
    Скажите, почему всюду пишут, что АЗ не проиграл ни одной партии за белых?
    267W 378D 5L (это результаты АЗ за белых) и 51W 580D 19L (это результаты СФ за белых).
     
    Последнее редактирование: 29 дек 2017
  3. Harutyun
    Оффлайн

    Harutyun Начинающий

    Репутация:
    0
    Получается вполне реально турнир между телефонами и людей. При этом создатели телефонов будут заинтересованы финансированием таких турниров.
    —- добавлено: 30 дек 2017, опубликовано: 30 дек 2017 —-
    Получилась создать сайт по адресу alphazero.ru. Посоветуйте какие разделы там открыть.
     
  4. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
  5. просроченый_кмс
    Оффлайн

    просроченый_кмс Старожил

    Репутация:
    6
    Хрен с этой го, когда шахматы нам опять покажут.
    Интересно допилят они прогу или совсем завершили, может хоть в качестве анализа дадут тпу дистанционно что бы можно было ходы вводить и получать анализ как на комп сайтах.
     
  6. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.281
    Так Винни писал, что они свернулись
     
  7. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Тут хотя-бы показали все сыгранные партии...
     
    Undying нравится это.
  8. просроченый_кмс
    Оффлайн

    просроченый_кмс Старожил

    Репутация:
    6
    жалко, шахматы более популярная игра, да и заработать они могли делая эти тпу и продавая прогу
    но думаю появятся продолжатели с умными мозгами)
     
  9. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Заработать? Стоимость TPU сейчас в районе $100k, таких штук надо четыре. Думаю, если кто захочет приобрести такую штуку, и у него есть миллион долларов, и он не из РФ, то, я думаю, он может напрямую обращаться в Deep Mind.
     
  10. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3

    AlphaZero обучался исключительно посредством «самостоятельной игры» с использованием 5000 TPU первого поколения для создания игр и 64 ТПУ второго поколения для обучения нейронных сетей, все параллельно
    © Wiki
     
  11. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Ну... для игры его обучать уже не надо. Надо просто загрузить уже обученную сеть. Вроде как играет она на четырёх TPU.
     
  12. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    А где взять эту обученную сеть? И даже если её отдадут, вряд ли она на 4 TPU в нормальных условиях будет сильнее сильнейших движков.
     
  13. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    Сильнее сильнейших движков, которые сильнее сильнейших людей ... :facepalm2:
     
  14. roman57
    Оффлайн

    roman57 Учаcтник

    Репутация:
    1
    А0 обыграл чемпиона 2016 , а чемпиона 2017 ещё нужно обыграть
     
  15. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    Так о том и речь, что Дип Майнд это ненужно! Свернули они это направление.
    Неинтересны им дальнейшие спортивные шахматные достижения. А жаль ...
     
    Последнее редактирование: 6 янв 2018
  16. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.281
    Нисколько не жаль!
    Адванс хоть немного поживёт... если Нефёдов не прикупит себе такую "дуру" :)
     
  17. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    Что то мне кажется, что заняться движком на новом алгоритме вполне мог бы Васик Райлих.
    Свою Рыбку он забросил, к Фрицу наверное душа не лежит, а вот новое направление довольно перспективное для него.
    Как и для его конторы, где он сейчас творит.
    К тому же в деньгах она особо не стеснена....
    Судя по краткому описанию А0- с точки зрения програмиста не очень уж и сложная штука, наработанные (при обучении) данные вполне можно прикупить у гугла.... Ну а дальше - дело техники и бизнеса
     
  18. nn
    Оффлайн

    nn Старожил

    Репутация:
    124
    А где он работает? И чем занимается?
     
  19. Нестор
    Оффлайн

    Нестор консультант_ специалист по черной магии баннер

    Репутация:
    331
    Кстати, да! Где Васик в это тяжелое время?
     
  20. N1mTzo
    Оффлайн

    N1mTzo Учаcтник

    Репутация:
    1
    Работает на ChessBase, создает новые версии Fritz'а (движка).
     
  21. roman57
    Оффлайн

    roman57 Учаcтник

    Репутация:
    1
    Не люблю Фриц , доступная версия только 14 , но она мне завешивает машину при поражении , забавно что когда он ведёт игру , то всё в порядке - шутка программистов наверно ^_^
     
  22. N1mTzo
    Оффлайн

    N1mTzo Учаcтник

    Репутация:
    1
    К 14-му Фрицу Васик не имеет отношение.
     
  23. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Дебютная теория не стоит на месте!
    Определенное влияние матча заметно и по обновленным книгам движков — см., например, новогоднюю Hiarcs14yBook.
    Продолжают толкать, корректируя, теорию вперед и люди:
    [Event "Sitges Sunway op"]
    [Site "Sitges"]
    [Date "2017.12.19"]
    [Round "5"]
    [White "Gascon del Nogal, Jose Rafael"]
    [Black "Kucuksari, Kaan"]
    [Result "1/2-1/2"]
    [ECO "E17"]
    [WhiteElo "2479"]
    [BlackElo "2290"]
    [PlyCount "81"]
    [EventDate "2017.12.15"]
    [EventType "swiss"]
    [EventRounds "9"]
    [EventCountry "ESP"]
    [SourceTitle "Mega2018 Update 10"]
    [Source "Chessbase"]
    [SourceDate "2017.12.28"]
    [SourceVersion "1"]
    [SourceVersionDate "2017.12.28"]
    [SourceQuality "1"]

    1. Nf3 Nf6 2. c4 b6 3. g3 e6 4. Bg2 Bb7 5. d4 Be7 6. O-O O-O 7. d5 exd5 8. Nh4
    c6 9. cxd5 Nxd5 10. Nf5 Nc7 11. e4 d5 12. exd5 Nxd5 13. Nc3 Nxc3 14. Qg4 Bf6
    15. bxc3 Bc8 16. Ba3 Bxf5 17. Qxf5 Qc8 18. Qf3 Rd8 19. Rad1 a5 20. Rd6 h6 21.
    Rxf6 gxf6 22. Qxf6 Re8 23. Qxh6 Qe6 24. Qh4 Ra7 25. c4 f6 26. Bb2 Rh7 27. Qxf6
    Qxf6 28. Bxf6 Re2 29. a4 Rc2 30. Be4 Rxc4 31. Bxh7+ Kxh7 32. Bd8 Rb4 33. Rd1
    Kg6 34. Rd6+ Kf5 35. h4 Ke5 36. Rg6 Rxa4 37. h5 Nd7 38. h6 Nf8 39. Rf6 Nh7 40.
    Rf7 Rd4 41. Bc7+ 1/2-1/2
     
  24. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Ага, и малювальникам дать приказ: зимой и летом — одним цветом!
    Осталось @z выбрать правильный для этой темы ответ:
    • елка;
    • заяц;
    • доллар/деньги;
    • негр;
    • крокодил;
    • небо;
    • солнце;
    • машина.
     
    Последнее редактирование: 9 янв 2018
  25. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Надо ли добавлять?
    Подошли, допустим, к "краю" трех-четырех(?)-мерной Вселенной. Увидели (якобы) тень Бога.
    Иди знай — то ли это действительно Его тень, то ли это всего лишь какая-то голографическая проекция пяти-шести(?!)-мерной?
    P.S. Мехмат'овцы вряд ли ответят...
     
    Последнее редактирование: 9 янв 2018
  26. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    У меня ощущение, что эта нейросеть пытается нам что-то сказать, но пока получается не очень.
     
    zeroalphazero, Комсюк и Camon14 нравится это.
  27. Camon14
    Оффлайн

    Camon14 Хранитель традиций баннер

    Репутация:
    689
    Обучите ее грамоте.
     
  28. Алексанлр
    Оффлайн

    Алексанлр Учаcтник

    Репутация:
    27

     
  29. ШахматыЭтоДиагноз
    Оффлайн

    ШахматыЭтоДиагноз Учаcтник

    Репутация:
    210
    Она пытается сказать: "Или вы меня считаете за миробля, или вы сами миробли".
     
    zeroalphazero нравится это.
  30. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    Все очень просто? Сказки — обман?;)
     
    Последнее редактирование: 10 янв 2018
  31. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Вести с полей:

    glinscott commented 5 hours ago

    Have made quite a bit more progress on this, I've got it to the stage I was able to generate good self-play games, and then run the training script to generate a new network. The new network was then 100 ELO stronger than the random mover (after only 160 games!). So, hopefully not too many bugs introduced in the port over :).

    Great work on the OpenCL validation @gcp, I ported that over, and it saved me big-time when I had made a mistake in the OpenCL batch-norm implementation.

    Also, interestingly the CPU implementation with a 5x64 network for chess is competitive with GPUs, except for very beefy new GPUs. That's great for generating training data though! No GPU required :).

    I have noticed that the scaling isn't quite linear per core like I would expect, but haven't dug too deeply into it yet.
    https://github.com/gcp/leela-zero/issues/369
    https://github.com/glinscott/leela-chess
     
    N1mTzo и nn нравится это.
  32. nn
    Оффлайн

    nn Старожил

    Репутация:
    124
    Добавлю ссылку
    —- добавлено: 10 янв 2018 —-
    В го учится с нуля чрезвычайно медленно. Leela-Zero еще наверно месяца полтора-два нужно чтобы дойти до уровня полученного от supervised learning
    Наверно, для шахмат тоже не скоро на нормальной уровень выйдет.
     
    Rom нравится это.
  33. Rom
    Оффлайн

    Rom Старожил

    Репутация:
    28
    Сетка supervised learning примерно в 5 раз больше чем текущая (6х128 против 5х64). А текущая нейросеть потому и стала обучаться медленнее, что подходит к пределу для своей размерности. Так что текущая сеть может быть никогда и не обгонит сеть supervised learning. Она предназначена только для отработки методов тренировки. Сейчас ещё разок понизят learning rate, доведут текущую сеть до предела и перейдут к тренировке сети нормальной размерности.

    Сейчас главный вопрос - можно ли качественно натренировать новую нейросеть на партиях сыгранных предыдущей нейросетью. Поскольку наигрывание партий как раз наиболее ресурсоёмкий процесс, то прояснение этого вопроса может многое решить. Если получится, то можно будет не начинать тренировку новой нейросети с нуля, а постепенно увеличивать её размерность.
     
    Последнее редактирование: 10 янв 2018
    nn нравится это.
  34. zeroalphazero
    Оффлайн

    zeroalphazero Учаcтник

    Репутация:
    4
    "Спокойствие, только спокойствие!"
    Вы уж там не переусердствуйте, please, со всякого рода ЕЁ размерностями, ok?:dash:
     
  35. N1mTzo
    Оффлайн

    N1mTzo Учаcтник

    Репутация:
    1
    Кстати, вот тут Интел представила (для широкой публики, так-то анонс был в прошлом году) на CES штуковину под названием Intel Loihi. По виду как обычный проц в исполнении LGA115x (140Вт tdp), то есть это уже гораздо ближе к простому человеку, чем колоссальные нейросети за млн. долларов, доступные только компаниям уровня Гугл.