AlphaZero. Нейронная сеть играет в шахматы

Тема в разделе "Машинное отделение", создана пользователем grizly, 6 дек 2017.

  1. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    думаю цепочка сильнейших ходов давно показана.
    http://chesspro.ru/chessonline/app2/12073 есть еще 14.ж3, но там тоже рыба.
    —- добавлено: 10 дек 2017 —-
    как вы можете убедиться у белых лишний слон :), но ничья
  2. Нестор консультант_ специалист по черной магии

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    11.04.2006
    Сообщения:
    2.955
    Симпатии:
    3.315
    Репутация:
    331
    Адрес:
    Москва
    Оффлайн
    Вообще, от "перспектив" дух захватывает!
    Точно такую же "процедуру обучения" Альфы можно проделать во всех актуальных дебютных табиях!
    В контратаке Маршалла, например, или в Челябинском варианте, в Волжском гамбите и прочая.
    Только надо ли это делать в принципе? Это большой вопрос ...
  3. Gridnev Старожил

    • Участник
    • Старожил
    Рег.:
    01.06.2012
    Сообщения:
    652
    Симпатии:
    3.632
    Репутация:
    152
    Оффлайн
    Все равно потрясает, если отвлечься от чисто шахматно-движковой точки зрения. Ведь по сути начинка стокфиша - худо бедно, но эссенция шахматной мысли, развививавшейся столетиями и выраженное в функции оценки позиции. Начиная со "стоимости фигур", борьбы за центр, кончая современным позиционным пониманием игры. Это результат человеческой шахматной мысли - многих людей за долгое время. И тут приходит ИИ и ему просто объявили правила. За несколько часов он, поиграв сам с собой (!), оказался способен создавать эстетические шахматные шедевры, находить современнейшие дебютные линии и бить мощный движок пусть и слегка кастрированный. Все развитие шахматной мысли и истории сжалось в несколько машинных часов. В этом смысле прошлая история с Го еще не была такой сенсацией, машина училась на человеческих партиях.
  4. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Веса в оценочной функции уже давно настраиваются с нуля. Как минимум, со времен первой Рыбки, а может и раньше. Никакие чисто шахматные знания при этом не используются, все веса результат миллионов тестовых партий между собой, прям как у NN.
    Gridnev нравится это.
  5. N1mTzo Учаcтник

    • Участник
    Рег.:
    17.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Осталось найти пару млрд американских не рублей для покупки DeepMind со всеми потрохами (она ведь уже явно больше стоит тех 650млн$. что за нее давали неск. лет назад) у Гугла, да еще придется как-то договариваться насчет того, чтобы пользоваться мощностями Гугла для обучения этого ИИ-монстра.
    В челябинском у черных не хуже, но и не лучше ес-но. Это стало ясно еще во времена Рыбки3.
  6. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    N1mTzo, в том-то и дело что похуже. Поэтому элита предпочитает 1...е5
  7. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Если сравниваются две одинаковые версии, то скорость влияет очень сильно. Они же фактически смотрят одни и те же варианты, но один из соперников - чуть дальше.
  8. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Нам мистрали не продают, а не то что Дип Майнд или АльфаЗеро.
    N1mTzo нравится это.
  9. like Начинающий

    • Начинающий
    Рег.:
    09.12.2017
    Сообщения:
    4
    Симпатии:
    3
    Репутация:
    0
    Оффлайн
    Начать надо просто с железа, тем более какой-то альфовский софт выкладывался:
    Или собрать машину на многих видеокартах NVidia последнего поколения. У Tesla GV100 тензорная мощность 112TFLOPS
    https://images.nvidia.com/content/t...tesla-volta-v100-datasheet-letter-fnl-web.pdf
    Какой-то опыт собирания таких машин был накоплен при майнинге биткоинов, когда еще не было специализированных процессоров.
    На Яндекс-маркете 1 предложение за $10 тыс. :( Можно подождать массовой версии.
    Или купить мощность у Гугла
    https://cloud.google.com/tpu/
    Или попроситься в нее бесплатно - научным группам они дают доступ к 1000 TPU (4000 ядер), то есть 180 PFLOPS (см. статью по ссылке выше)
    Или подождать пока кто-то (NVidia, AMD) выпустят TPU в свободную продажу
  10. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Gridnev, недавно ссылку выкладывали https://habrahabr.ru/post/343590/, самая последняя прога в го, обыгрывает ту что играла с Седолем со счётом 100 0 и ещё одну после 89 11, начиная обучаться с нуля, так что до шахмат уже испытали.

    Может мы и медленные, но кроме шахмат у нас есть ещё куча задач, главная из которых жизнь)
    И огромная нейросеть с кучей органов чувств, только разрешение глаза 140 мегапикселов.
  11. nh2008 Старожил

    • Участник
    • Старожил
    Рег.:
    01.12.2013
    Сообщения:
    3.961
    Симпатии:
    5.378
    Репутация:
    379
    Адрес:
    Украина
    Оффлайн
    Пока это вызывает эмоции, но со временем станет обыденностью. Уж не рассцвет это перед увяданием? Как бы такие достижения не уничтожили интерес людей к шахматам.
    Gridnev и Нестор нравится это.
  12. Gridnev Старожил

    • Участник
    • Старожил
    Рег.:
    01.06.2012
    Сообщения:
    652
    Симпатии:
    3.632
    Репутация:
    152
    Оффлайн
    Я не специалист, но мне понятно, что веса устанавливает комп на эвристической основе, оптимизируя силу игры, как иначе. Речь о струтуре функции, как рассчитать позицию, какие факторы учитывать. Сдвоенные пешки, безопасность короля, контроль над центром, подсчет материала. У каждого фактора есть свой вес, он подгоняется. Я же написал "худо-бедно". Но структура функции выражает накопленное человеческое понимание.
  13. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Что бы не делал человек, но комп это будет делать лучше, человеку останется только быть пассивным наблюдателем с попкорном на диване как Великий Нехочуха. Может это и есть рай коммунизма?
  14. N1mTzo Учаcтник

    • Участник
    Рег.:
    17.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Ну в чисто человеческих шахматах после 1...е5 играть на ничью гораздо проще, т.к. есть Русская и Берлин, которые проще запомнить, чем зубрить километровые дорожки челябы, которые утыкаются в 7-фигурные таблицы. А после 1.е4 с5 2.Kf3 Kc6 уже давно белые не лезут в челябинский, а играют 3.СB5.
  15. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    17.07.2011
    Сообщения:
    19.230
    Симпатии:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    В адванс лезут и даже выигрывают
    Ни в какие таблицы не упираются

    Kalvados, N1mTzo, Camon14 и ещё 1-му нравится это.
  16. N1mTzo Учаcтник

    • Участник
    Рег.:
    17.04.2008
    Сообщения:
    318
    Симпатии:
    30
    Репутация:
    1
    Оффлайн
    Camon14, Поглядите финал WC29 на iccf (самый свежий из тех, где доступны партии), там Neto отсушил черными несколько партий в челябе без проблем, а одну еще и выиграл (после 3.Cb5). В принципе, из более ранних финалов WC я в свое время много анализировал партий из челябы, там даже где черные умудрялись проиграть в итоге, в анализе всегда находились соскоки на ничью. ЗЫ сам тоже поигрывал челябу на iccf, других площадках переписочных, во фристайлах разных, там железобетон за черных.
  17. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    N1mTzo, я сам 2 года играл в адванс, есть варианты где у черных все держится на соплях, например тут они без пешки в некоторых ветках с трудом делают ничью
    1.e4 c5 2.Nf3 Nc6 3.d4 cxd4 4.Nxd4 Nf6 5.Nc3 e5 6.Ndb5 d6 7.Bg5 a6 8.Na3 b5 9.
    Bxf6 gxf6 10.Nd5 f5 11.Bd3 Be6 12.O-O Bxd5 13.exd5 Ne7 14.Nxb5 Bg7 15.Nc3 *
    другое дело, что и белыми и черными такие позиции белковым шахматистам играть непросто.
    Так что нет, не убедили, челябинский не так хорош как 1...е5 или найдорф.
  18. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Я тоже не большой специалист, но практически уверен, что сами признаки определить значительно проще, чем их веса. Без всяких внешних знаний, просто играя сам с собой.
    Часто программистам наоборот приходится выкидывать какое-нибудь "накопленное шахматное знание", потому что оно замедляет оценочную функцию и без его учета программа играет сильнее. Например в Фрице, когда он еще был Великой Прогой, был штраф за запертую фигуру. А потом он обрыбился и штраф исчез. Хотя не нужно быть гроссмейстером, чтобы понимать, что запертый слон, например, это плохо. Но проверка занимает столько времени, что скорость расчета вариантов слишком сильно падает. А AZ это не волнует, у него оценкой занимается TPU. И, кстати, несколько партий он выиграл за счет игры против плохой фигуры соперника (слон на b7, ферзь на h8).
    sovaz1997 и Gridnev нравится это.
  19. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Я думаю, если заменить оценочную функцию Stockfish на качественную нейросетевую, при этом оставив поиск как есть, можно получить качественный прирост. Да, глубина уменьшиться, но качество поиска улучшиться (алгоритм отсечений основан на оценки позиции, как-никак).
  20. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Сколько вариантов в секунду будет выдавать такой Сток на процессоре? Меньше тысячи? Это как взять мозг мыши и пересадить его муравью. Мышь может и умнее, но муравью от этого мало толку.
  21. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Jadn, может, и меньше тысячи, но при этом отсечения будут работать качественнее и оценивание позиции будет на совсем другом уровне. Процессоры развиваются и я думаю, что в будущем нейросети будут хорошо работать на них, т. к. это направление очень актуально. Сначала, думаю, можно сделать это в виде опции.
  22. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Много содержательного от программиста SuperZerror (из обсуждения на канале):
    SuperZerror
    Дело в том, что само обучение нейросети, - это есть построение дерева вариантов со статистически выверенными весами. У многих, кто занимался программированием движков (в том числе и у меня) давно в голове сидела идея применить карты кохонена и метод Монте-Карло для автоматической классфикации позиций. В данном случае у разработчика нашлось и время, средства и железо, чтобы реализовать этот проект. К примеру, у меня на моем ноутбуке уходит 2 суток, чтобы проиграть 1000 значимых партий для самообучения. А у разработчиков Альфа-Зеро по их словам ушло около 4 часов для проигрывания 300 ТЫСЯЧ партий. С такими возможностями можно позволить себе кучу экспериментов, на которые у меня, к примеру, ушла бы половина жизни. Конечно, интересно было бы узнать, каков размер нейросети получился в итоге. Это принципиально. Не углубляясь скажу, что возможна ситуация, когда данная программа затачивалась против игры стокфиш, но вдрызг проиграет какому-нибудь середнечку Booot. Есть много нюансов, на которые может ответить только разработчик. Еще хотелось бы отметить, что мои эксперименты говорят, что заточенная дебютная база при игре стокфиша против самого себя выигрывает у последнего даже с более разгромным счетом.
    Василий Пеев
    последний Ваш комментарий, о том, что Стокфиш без дебютной библиотеки проиграет самому себе с более разгромным счетом, это личный эксперимент? так это в корне все меняет...
    SuperZerror
    Василий Пеев, то что стокфиш с базой выиграет у стокфиша без базы почти всегда - это подтверждено очень много раз и не только мной. Самый яркий пример, - это ботоводы. Попробуйте сыграть с лучшими представителями ботов в ВК ))) у Вас и у них может быть одинаковая прога, но вы ВСЕГДА проиграете. Не верите? Люди годами оттачивают базу данных игр, и некоторые дебютные варианты рассчитаны до 25 хода (50 полуходов). Я знаю, потому что сам участвовал в этих битвах два года назад. Причем, размер этой базы оказывается не такой уж и большой, так как число значимых ответвлений в каждой позиции оказывается достаточно малым
    Max Pa
    Говорится, что альфа играл сам с собой, поэтому затачиваться под игру со стокфишом он не мог.
    SuperZerror
    Max Pa, да, я знаю, что официально движок Альфа-Зеро играл сам с собой, но Вы же понимаете, что проверить никто не сможет ))) Сомнения в том, что почему именно Стокфиш, а не Комодо, в котором самая лучшая оценочная функция? Почему не Гудини, в котором, вероятно, самая большая глубина поиска? Почему Стокфиш, который на последнем чемпионате мира по движкам не вышел в финал? При этом, как утверждается, пересобрать Альфа-Зеро можно за 4 часа. )))) Нет, безусловно, разработчики проделали отличную работу, и им удалось победить стокфиш. Но логичней было бы сыграть в турнире, а не играть матч. Мне представляется, что истина где-то посредине. Мне представляется, что в начале алгоритм Альфа-Зеро обучался по дебютным базам, потом до миттельшпиля играл сам с собой, выставляя оценки ходу так на 25 стокфишем. А уже после этого начального варианта, когда его уровень был где-то 2400, играл сам с собой. Таким образом изначальные паттерны могли быть настроены на стокфиш так или иначе. И эта стадия самая долгая, поэтому пересобрать за 4 часа движок невозможно. Но это мое мнение, я не навязываю.
    SuperZerror
    Я привык скептически относится к рекламе. А это конечно же реклама. И повод есть, ведь стокфиш - это не коммерческий продукт. Никто не будет предъявлять за потерю прибыли. А провели бы подобный матч между Гудини и Альфа-Зеро, то у разработчиков сразу же бы возникли неудобные вопросы по поводу честности проведения матча. Тут и мощности компов, и открытость матча. )))) Но еще раз - не настаиваю )))
    SuperZerror
    ....Переделать стокфиш под нейросетевые технологии не так уж сложно. Сложность в другом - результата люди не получали от такой переделки. И вот, разработчики от гугл утверждают, что получился результат. За 4 часа. Что ж.. интересно, но вероятно. Но игра самим с собой.. за ТАКОЕ ВРЕМЯ? Мой опыт построения таких алгоритмов говорит о том, что сложнее всего сделать сильную программу играя самим с собой. Ты неизбежно попадаешь на локальные минимумы, из которых почти невозможно вытащить самообучалку. Тут разнообразие важно. Эволюционные алгоритмы тому вообще 100% пример. А тут сама с собой... хм.. ну хорошо, сделали, так сделали. Посмотрим, когда покажут код.. или весь процесс обучения, или решат задачу посложнее шахмат, которую никто не решил еще.. А пока.. 1Gb кэша для противника при 64 потоках звучит издевательски
    SuperZerror
    Max Pa, создать конкуренцию Альфа-Зеро? А как? Его же мне домой не дадут ))) А вот создать убийцу стокфиша любому по силам. Во-первых, берете за основу AsmFish (что дает прирост в скорости процентов на 20% в моем случае), подрубаете туда расширенную базу, которая затачивалась на играх по переписке за последние лет 5 со всего мира, подрубаете ко всему этому эндшпильные таблицы, загружаете заранее правильный кэш... и этого уже достаточно для того, чтобы прибавилось от 100 до 400 эло в зависимости от контроля времени. И самое главное, что все это будет весить возможно даже меньше, чем движок АльфаЗеро. Как-то так...
    SuperZerror
    Max Pa, о весе АльфаЗиро мне не известно, откуда такая уверенность, что нейросеть мала? .. А в предыдущем вопросе - можете отобрать у меня эндшпильные таблицы, черт с ними, почти ни чего не дают ))) Вообще читая бумажку от разработчиков мне показалось ))), что в нейросеть они запихали не только оценку, но также и генератор легальных ходов. То есть нейросеть вообще программа сама в себе (исключение правда составила сама процедура обучения ходам, но иначе никак). Так вот, ключевой вопрос - сколько же весит нейросеть. Это вопрос не праздный. Программа провела 44 миллиона игр сама с собой. Это много, если нейросеть мала. И этого мало, если нейросеть велика. В первом случае она обучена. Во втором случае просто запомнила варианты. Утрирую конечно, но смысл ясен. Где можно посмотртеть на размер сети? А нигде.
    SuperZerror
    Max Pa, два года назад, когда я участвовал в битвах шахматных программ, у меня движок стокфиш + обычная "запоминалка" на 2 мегабайта уделывает любой стокфиш 9 из 10. Можешь назвать эту запоминалку дебютной базой. Можешь самоорганизующейся картой кохонена. А можешь нейросетью. И то, и другое, и третье будет верно. Устроить точно такое же в АльфаЗеро - не стоит ни чего.
    SuperZerror
    Max Pa, где-то в бумажке от гугля явно написано, что они используют оценку позиции на нейросетях + поиск в глубину. Те же яйца, только в профиль. А зашить запоминалку размером 2 мб в нейросеть - это как бы само собой может получится ))) что за детский сад? О чем спор вообще? Ну выиграли стокфиш, ок... этот стокфиш в переписке выигрывает любой перворазрядник, имея базу в руках. Он ее тоже делал самообучением в конце концов. Только вот ни один не выиграет турнир в одинаковых условиях. Будет все прозрачно, будет на что смотреть.
    Camon14, Fruit, AK442 и ещё 1-му нравится это.
  23. Мобуту спаситель нации

    • Заслуженный
    • Ветеран
    • Старожил
    Рег.:
    15.02.2006
    Сообщения:
    6.916
    Симпатии:
    3.969
    Репутация:
    141
    Адрес:
    Заир
    Оффлайн
    Научность - это возможность для всех и каждого самостоятельно убедиться в том, что говорит автор. Проверить его, подтвердить или опровергнуть. Ни с какими коммерческими тайнами и прочими секретами научность в её исконном смысле несовместима. В данном случае код как минимум должен быть отдан независимым людям на экспертизу, ну или не надо иначе изображать из себя учёных.

    А статья в журнале ни о чём не говорит. Такого рода статьи часто бывают рекламой, замаскированной под науку. Рецензия часто оказывается вообще формальностью, сводится к правке запятых и на серьёзный фильтр не тянет.
    —- добавлено: 10 дек 2017, опубликовано: 10 дек 2017 —-
    Выложили рекламную, хвастливую и непроверяемую статью на архив, специально чтобы СМИ подняли шумиху. Так будет точнее.
    thenewone, Комсюк, Kalvados и ещё 1-му нравится это.
  24. dom1n1k Учаcтник

    • Участник
    Рег.:
    18.11.2016
    Сообщения:
    187
    Симпатии:
    155
    Репутация:
    3
    Оффлайн
    Очевидно же - по причине открытости и бесплатности. Он есть у абсолютно любого желающего, кто захочет покопаться в партиях - чем и занимаются люди в данной ветке. У скольки процентов непрофессиональных шахматистов есть купленные Комодо и Гудини?
  25. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Он взорвет лихорадочный день
    И сиянием обескуражит.
    Элвис новые песни споет -
    А то как же.
  26. tiger Новичок

    • Новичок
    Рег.:
    11.02.2006
    Сообщения:
    85
    Симпатии:
    25
    Репутация:
    1
    Оффлайн
    Статья на arxiv совершенно не соответсвует никаким даже самым низким научным стандартам. Единственное объяснение, что большие компании пытаются сидеть на двух стульях: скрывать детали от конкурентов, и делать вид, что все это серьезная наука. В этом смысле, например, финансовый сектор честнее, хотя бы не публикуют пародии на научные статьи.
  27. Michael-13 Господин

    • Участник
    • Старожил
    Рег.:
    18.11.2011
    Сообщения:
    3.068
    Симпатии:
    1.098
    Репутация:
    29
    Оффлайн
    https://ru.wikipedia.org/wiki/ArXiv.org
    arXiv.org (произносится [архи́в]) — крупнейший бесплатный архив электронных публикаций научных статей и их препринтов по физике, математике, астрономии, информатике и биологии.
    Статьи, выкладываемые авторами в архив, не проходят процедуру научного рецензирования (и в связи с этим, строго говоря, не считаются научными публикациями).
    В настоящее время архив спонсируется и обслуживается Корнеллским университетом США, частью чьей библиотеки и считается.
    Kalvados нравится это.
  28. Undying Учаcтник

    • Участник
    Рег.:
    31.08.2016
    Сообщения:
    1.316
    Симпатии:
    566
    Репутация:
    15
    Оффлайн
    Какая там эссенция шахматной мысли. Стокфиш это просто калькулятор с тупым перебором ходов. Уровень понимания шахмат там третий разряд в лучшем случае. Уже второразрядник + компьютер играет значительно лучше чем просто компьютер.
  29. tiger Новичок

    • Новичок
    Рег.:
    11.02.2006
    Сообщения:
    85
    Симпатии:
    25
    Репутация:
    1
    Оффлайн
    Все-таки вероятность локального минимума у функции большого числа переменных близка к нулю. Проблема не минимумах, а в том что почти гарантировано попадание на локально почти плоскую часть. Алгоритмы поиска минимума часто не могут уйти вниз с плоских частей, хотя статистически (с очень большой вероятностью) это можно сделать по нескольким направлениям.
  30. hornet Учаcтник

    • Участник
    Рег.:
    05.11.2016
    Сообщения:
    844
    Симпатии:
    770
    Репутация:
    468
    Оффлайн
    Что за х-ня ребята? У меня ни сток на глубине 50, ни асмфиш на глубине 52 не показывают проигрыш (за черных) в позиции...:scratch: рисунок_2.jpg
    Launder и Camon14 нравится это.
  31. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Кстати, автор Texel проводил эксперименты с Giraffe. Сперва он пересадил к нему оценочную функцию от Texel-я. Прога начала считать на 3 полухода дальше, но сильнее играть не стала.... Затем он создал версию Текселя, которая использует ОФ Жирафа. Получилось нечто на 250-300 пунктов более слабое.
    Однако, он отметил, что, если бы было возможно сделать ОФ жирафа такой же быстрой, как и ОФ Текселя, то эта версия играла бы примерно на 100-120 эло сильнее, чем обычная версия Текселя.

    И, между прочим, некоторые специфичные позиции этот гибрид оценивает даже лучше Стокфиша. Например вот эту:
    8/5p1p/4p2k/N7/3Pn3/4PpPP/1r3P2/5RK1 b - - 0 37



    С.Ю. писал:
    ... Реальная оценка - белые имеют серьезные проблемы. Примерно, на глазок - 0.6 +/- 0.2 То есть ближе к пешке в пользу черных, чем к равенству! И это несмотря на лишнюю пешку белых на доске.

    Stockfish 8 64 BMI2(1CPU):

    1...f6 2.Nc4 Rc2 3.Nb6 Kg5 4.Nd7 h5 5.Nf8 Kf5 6.g4+ hxg4 7.hxg4+ Kxg4 8.Nxe6 Rc8 9.Nf4 Rg8 10.Rd1 Kf5+ 11.Kf1 Rh8 12.Kg1 Rh1+ 13.Kxh1 Nxf2+ 14.Kg1 Nxd1 15.Nd5 Ke4 16.Nxf6+ Kxe3 17.Ng4+
    = (-0.08) глубина: 49/70 00:13:30 1377098kN
    1...f6 2.Nc4 Rc2 3.Nb6 Kg5 4.Nd7 h5 5.Nf8 Kf5 6.g4+ hxg4 7.hxg4+ Kxg4 8.Nxe6 Rc8 9.Nf4 Rg8 10.Rd1 Kf5+ 11.Kf1 Rh8 12.Kg1 Rh1+ 13.Kxh1 Nxf2+ 14.Kg1 Nxd1 15.Nd5 Ke4 16.Nxf6+ Kxe3 17.Ng4+
    = (-0.08) глубина: 50/70 00:16:29 1694243kN
    1...f6 2.Nc4 Rc2 3.Nb6 Kg5 4.Nd7 h5 5.Nf8 Kf5 6.g4+ hxg4 7.hxg4+ Kxg4 8.Nxe6 Rc8 9.Nf4 Rg8 10.Rd1 Kf5+ 11.Kf1 Rh8 12.Kg1 Rh1+ 13.Kxh1 Nxf2+ 14.Kg1 Nxd1 15.Nd5 Ke4 16.Nxf6+ Kxe3 17.Ng4+
    = (-0.08) глубина: 51/70 00:19:14 1984398kN
    1...f6 2.Nc4 Rc2 3.Nb6 Kg5 4.Nd7 h5 5.Nf8 Kf5 6.g4+ hxg4 7.hxg4+ Kxg4 8.Nxe6 Rc8 9.Nf4 Rg8 10.Rd1 Kf5+ 11.Kf1 Rh8 12.Kg1 Rh1+ 13.Kxh1 Nxf2+ 14.Kg1 Nxd1 15.Nd5 Ke4 16.Nxf6+ Kxe3 17.Ng4+
    = (-0.08) глубина: 52/73 00:24:34 2529898kN

    Texel + ОФ Giraffe (1CPU):

    1...f6 2.Nc6 Ng5 3.Kh2 Kh5 4.Nd8 Rd2 5.Nc6 Ne4 6.Kg1 Kg5 7.Nd8 e5 8.Ne6+ Kf5 9.Ng7+ Kg6 10.Ne6 Kf7 11.Nc5 Nxc5 12.dxc5 Rc2 13.Ra1 Rxc5 14.Kh2 Kg6 15.g4 h5 16.Kg3 e4 17.Kf4
    = (-0.04) глубина: 26 00:08:58 80615kN
    1...f6 2.h4 Rc2 3.Nb7 Kg6 4.Nd8 Kf5 5.h5 Ng5 6.Kh2 Kg4 7.h6 Ra2
    = (-0.19) глубина: 26 00:11:33 101861kN
    1...f6 2.Nc6 Kg6 3.Nd8 Rb6 4.Rc1 h5 5.Rc2 Rb1+ 6.Kh2 Rf1 7.Nxe6 Nxf2 8.Nf4+ Kf5
    і (-0.41) глубина: 26 00:14:54 129507kN
    nn и sovaz1997 нравится это.
  32. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    А есть версия Texel с ОФ от Giraffe в открытом доступе? Интересно протестировать на некоторых типах позиций.
  33. Fruit Александр

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    12.02.2006
    Сообщения:
    2.201
    Симпатии:
    64
    Репутация:
    3
    Оффлайн
    Texel + ОФ Giraffe:
    https://www.dropbox.com/sh/v16dye7ww33x7oe/AAAXmGY0phMkB7XlR-vaOxasa/test?dl=0&preview=texelGi.7z

    Giraffe + ОФ Texel:
    https://www.dropbox.com/sh/v16dye7ww33x7oe/AAAXmGY0phMkB7XlR-vaOxasa/test?dl=0&preview=giraffe_te.7z

    Кстати, автор Giraffe - Matthew Lai от 26.01.16 писал на форуме Talkchess.com:
    I am now an employee of Google DeepMind, and I felt that Giraffe is a bit too close for comfort to what I do at work. (Я теперь сотрудник Google DeepMind, и я чувствовал, что Жираф слишком близок к тому, что я делаю на работе.):)
    nn и sovaz1997 нравится это.
  34. sovaz1997 Учаcтник

    • Участник
    Рег.:
    30.08.2016
    Сообщения:
    649
    Симпатии:
    120
    Репутация:
    3
    Оффлайн
    Stockfish начинает тоже понимать, что все хорошо у черных, но очень поздно:
    8/5p1p/4p2k/N7/3Pn3/4PpPP/1r3P2/5RK1 b - - 0 37

    Код:
    info depth 53 seldepth 88 multipv 1 score cp 72 lowerbound nodes 10078969817 nps 8004684 hashfull 833 tbhits 0 time 1259134 pv f7f6
  35. Challenger Spy Технический специалист

    • Команда форума
    Рег.:
    29.01.2011
    Сообщения:
    5.280
    Симпатии:
    2.838
    Репутация:
    226
    Оффлайн
    Авторы движков в команде? Нет-нет, наговоры все это. Сказали же - нейросеть сама обучилась с нуля за 4 часа, в нее ввели только правила.
    Fruit и Camon14 нравится это.

Поделиться этой страницей