Матчи людей с программами. Фора как способ выжить

Тема в разделе "Машинное отделение", создана пользователем Rom, 20 авг 2014.

  1. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    В эти выходные ожидается очередной интересный матч между человеком и машиной. В отличие от предыдущих матчей, он будет проводится без материальной форы и на классическом контроле времени. То есть так, как многие просили.

    Играть будут Комодо 10 и гроссмейстер Сергей Эренбург (США, рейтинг ФИДЕ 2591). Чтобы немного уравнять шансы, программа будет запускаться на одном ядре дешевого ноутбука, с жестко ограниченным контролем времени. Ей будет выделено 3 минуты на партию, с добавлением 1 секунды на ход. Эндшпильной базы не будет. Дебютная книга ограничена тремя ходами. У человека, в свою очередь, будет 90 мин на партию + 30 сек на ход.

    Матч состоится 25 и 26 июня. Две партии в день. Начало партий в 19 и 24 часа по Москве. Трансляции, как обычно, на Chess.com и, возможно, на сайте Комодо.

    Подробности здесь:
    http://talkchess.com/forum/viewtopic.php?topic_view=threads&p=675616&t=60503
    Camon14 нравится это.
  2. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
    Гросс обречен. Я играю на смартфоне с программой Магнус Карлсен, там силища неимоверная на последнем уровне, прога где-то и тратит на ход 1-2 секунды.
    Rom нравится это.
  3. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    Согласен. По моим прикидкам уровень программы будет не ниже 3000. Что предполагает счет 3,5 : 0,5. Плюс-минус 0,5.
  4. Vladruss НедоКМС, победитель второразрядников.

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    30.12.2009
    Сообщения:
    16.477
    Симпатии:
    8.522
    Репутация:
    530
    Нарушения:
    31
    Оффлайн
    А программка на Андроиде?
  5. Camon14 Хранитель традиций

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Рег.:
    28.05.2012
    Сообщения:
    18.567
    Симпатии:
    10.939
    Репутация:
    687
    Нарушения:
    31
    Оффлайн
  6. EvgeniyZh Учаcтник

    • Участник
    Рег.:
    07.02.2014
    Сообщения:
    487
    Симпатии:
    112
    Репутация:
    15
    Адрес:
    Ришон ле Цион, Израиль
    Оффлайн
    Да ну, только контроль и мощность это уже ЭЛО 400 не меньше, плюс эндшпильные таблицы и дебютные книги (на таком контроле важно) и белый цвет человеку что-то, да даст.
    Я думаю в таких условия комп будет чуть сильнее топовых людей - точнее, сильнее в миттельшпиле и слабее в эндшпиле и дебюте. Топовый гросс имел бы шансы на равный счёт ИМХО, а здесь 2.5-1.5 +-0.5 мне кажется.
    —- добавлено: 24 июн 2016 —-
    Ларри Кауфман:
  7. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    У человека форы вполне может хватить для выигрыша с минимальным счетом. Программа должна постоянно получать хуже по дебюту (достаточно часто значительно хуже), вопрос лишь в том, сумеет ли человек (конкретный этот шахматист) это использовать.
  8. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    EvgeniyZh, я решил отталкиваться от собственных тестов. Все-таки, конкретно для меня, это логичнее. Общая оценка складывалась так:

    1. Согласно моим тестам (кратко здесь) Гудини 4 на минуте играет примерно на уровне 2850 эло. Собственно, это опорная цифра от которой и будем плясать.

    2. +40 пунктов эло к 2850, поскольку на моем компьютере скорость Комодо 9.3 на 25% меньше, чем на машине заявленной на матч.

    3. +100 эло, поскольку Комодо 10 сильнее Гудини 4. Оценка специально взята несколько консервативная, так как я производил только тесты Стокфиша от 20 мая против Гудини 4 (+162 эло, 600 партий на контролях 1'+1" и 2'+1", 1 ядро).

    4. +240 эло, поскольку машине выделено времени 3'+1" т.е. примерно в 4 раза больше чем у меня в п.1. Четыре раза - это двойное удвоение, а каждое удвоение на таких контролях дает примерно 120-150 эло (опять же на основе тестов против недавнего Стокфиша, а потому снова берем оценку по нижнему пределу).

    5. -40 эло, за черный цвет. Исходя из стандартного распределения очков 55/45.

    6. -30 эло, вследствие отсутствия у машины эндшпильных баз. Оценка на основе тестов Andreas Strangmuller.

    7. -100 эло, вследствие ограниченной дебютной книги. По моим тестам разница около 80 эло, но поскольку у меня было выставлено ограничение в 4 хода, а не в 3, как в предстоящем матче, то опять же берем более консервативную для компьютера оценку.


    Итого, уровень компьютера:
    2850+40+100+240-40-30-100 = 3060 эло

    Конечно, в матче маловато партий. Если строго следовать правилам мат. статистики, то возможен практически любой разумный счет.


    Теперь, возможные (но не обязательные) неучтенные факторы:

    1. Человеческий рейтинг по-видимому поплотнее компьютерного. В соотношении 5:4 или 4:3. То есть, разница в 1000 эло между компьютерами, соответствует разнице примерно в 800 эло между равными им людьми. Это разница между парами человек-человек и компьютер-компьютер. Но какая же будет разница между парой человек-компьютер? Вот это вопрос. Пожалуй самый серьезный вопрос. При негативном варианте компьютеру можно срезать где-то ещё пунктов 100. Тогда его уровень будет 2950 и у человека появляются некоторые шансы.

    2. Программа запущенная на одном ядре компьютера почти не вариативна во всех стадиях партии. Потому, кстати, и нужна дебютная книга. В принципе, Сергей может заранее наиграть готовые схемы, а в перерыве между второй и третьей партиями их доработать.

    3. У Сергея не будет возможности оценить что-то за время соперника. У Комодо, правда, тоже не будет такой возможности.

    4. Может быть человек умеет лучше пользоваться своими дебютными знаниями, чем машина с полной дебютной книгой. Даже если он заранее не готовил какие-то конкретные варианты. Таких данных у меня нет, но допустим что такое возможно...

    5. Некое часто упоминаемое "понимание" позиции человеком, которое позволит ему расставиться или же вывернутся в некоторых позициях, что сократит разницу в пунктах эло. Опять же нет данных, но все же я не могу утверждать на 100 процентов, что такой фактор не сработает.
  9. EvgeniyZh Учаcтник

    • Участник
    Рег.:
    07.02.2014
    Сообщения:
    487
    Симпатии:
    112
    Репутация:
    15
    Адрес:
    Ришон ле Цион, Израиль
    Оффлайн
    По хорошему надо взять комодо 10 против противника у которого стандартный CCRL'овский контроль, и дать ему пропорционально меньше чем 3'+1" (если выдаете 5440 кнпс в начальной, значит контроль 45"+0.25"). По вашей оценке он получит 3230 Эло, это нереально. Потери от перехода от стандартного CCRL контроля к 3'+1" на слабом ноуте явно больше чем 140 Эло.
  10. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Очень интересно будет...
  11. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    А можно несколько более развернутый ответ? В частности, не понятно откуда взялась цифра 3230 эло. Под "противником" подразумевается человек или некая программа из списка CCRL? Стандартный контроль это 40/40 или 40/4?
  12. EvgeniyZh Учаcтник

    • Участник
    Рег.:
    07.02.2014
    Сообщения:
    487
    Симпатии:
    112
    Репутация:
    15
    Адрес:
    Ришон ле Цион, Израиль
    Оффлайн
    3230=2850+240+100+40.
    Стандартный контроль это 40/40, 40/4 это блиц. Противник - программа из CCRL.
  13. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    А, понятно... Спасибо. Но я хочу отметить, что моё базовое число (2850 эло) никак не привязано к рейтингу CCRL. Рейтинг CCRL живет по своим законам. Например несколько лет назад его создатели принудительно срезали всем движкам по 100 пунктов. Поэтому 140 Эло (я так понимаю получено из 3367-3230) может превратиться и в 240 и даже в большее число.
  14. EvgeniyZh Учаcтник

    • Участник
    Рег.:
    07.02.2014
    Сообщения:
    487
    Симпатии:
    112
    Репутация:
    15
    Адрес:
    Ришон ле Цион, Израиль
    Оффлайн
    А к какому рейтингу оно привязано?
  15. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    Я хотел привязать его к рейтингу ФИДЕ. Насколько получится, конечно. Посмотрел результаты матчей разных программ против людей в первой половине "нулевых". Они тогда часто играли друг с другом. Переход через 2800 эло у машин пришелся где-то на 2002-2003 год. Чтобы отталкиваться от конкретных данных я решил принять за 2800 уровень соперника (программы и машины) Крамника в Бахрейне. Он тогда играл против Fritz 7/8. У меня есть эта программа, она немного слабее Fritz 8. Машина того матча примерно соответствует одному ядру моего компьютера.

    Кстати, нашел у Andreas Strangmuller хорошие тесты по учетверению времени. И как раз по Комодо. Теперь можно уточнить расчет. Учетверение времени даст примерно 211 эло, а не 240 как у меня. Таким образом получается 2850+40+100+210-40-30-100 = 3030 эло.
  16. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
  17. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
  18. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Что то началом и не пахнет.
    А есть где смотреть с анализом, без видео просто диаграмма?
  19. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    просроченый_кмс нравится это.
  20. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Спс, зарегался там, через твич видео на английском без анализов как то не очень.
    Правда и там реклама справа что то загораживает, но лучше чем интернет трафик зря гонять.

    з.ы. Я бы на месте проги после разменов ферзей пошёл кб4, с учётом игры на победу слон против коня, а не разноцвет как щас, даже если и можно выдумать там динамику типа слс4 кс2 лас1 кб4 лд7, хотя возможно это было опасно за чёрных.

    Всё таки проги молодцы, играешь играешь с ними а потом оказывается на всякую тактику можно попасть и ограничены поля для фигур. лд6 какой крутой многоплановый ход, и по линии д и по е и по ф неприятности возможны.
    Rom нравится это.
  21. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    ле3, какая мощь...
    Какая боль, какая боль, Аргентина Ямайка 5 0
    Думаю гросс проиграет все партии, как котёнка.
  22. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    Да, внушает...
  23. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    В первой партии победил компьютер. Счет матча Комодо 10 - Эренбург 1:0

  24. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    После 14 е5 я понял началось, первый мощный ход, проги так играют когда ты пассивно и неправильно расставил фигуры и очень умело ударяют в нужную точку.
  25. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Блин вот сайт непонятный, дайте трансляцию ходов без видео прошлая ссылка на первую партию только.
  26. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Я думаю прожка дожмёт, пешки пока не двигает т.к. 50 ходов и так можно походить туда сюда, потом двинет опять попытается с разных сторон, где то человек ошибётся, даже равные с ними непросто держать.

    Лд4 всё цугундер)
  27. TopicStarter Overlay

    Rom Старожил

    • Участник
    • Старожил
    Рег.:
    12.02.2012
    Сообщения:
    645
    Симпатии:
    276
    Репутация:
    28
    Оффлайн
    Во второй партии снова победил компьютер. Счет матча Комодо 10 - Эренбург 2:0

    Текст партии по видеотрансляции, так что не обессудьте.

    просроченый_кмс нравится это.
  28. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Как то очередной гросс играет пассивно академично, после слж4 фд3 типа сдвоения не допустим, да пойди просто ле1 лд1 и наплюй на слона, (если он съест на ф3 то укрепит центр, а слон на ж3 укрепит короля белых, да и со слонами легче играть) потом 11 ка4, 11 а3 самое логичное, что за очередной академичный ход ка4, не допустим а4 которое не страшно зато сдал весь центр.
    Ну а дальше комп получил минимальное преимущество и размотал белых.

    Комодо специально выбирают каких то беззубых гроссов. и те контроли и гандикапы где они уверены в своей проге, интриги бы побольше, нужен гросс сильнее, за 2700 тут.

    В первой партии тоже завёл себя в тупик, зачем играть ке4 что ему там делать самое логичное развитие слж5, а дальше не смог пристроить слона пришлось делать плохой ход ж3 получил е5 а дальше уже началась динамика стихия программ.
  29. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    В конкретно выбранной игровой стратегии на матч (околоничьи с человеческой точки зрения, без трудных решений для себя и тем более для программы) гросс совершенно не использует фору никак, и упрощает "жизнь" только программе. Дожить до ничейных эндшпилей "без пешки или понимания эндшпиля" не хватает ни концетрации, ни техники (тут уровня игры).
    Накамура, как ни странно, "лез"в сложную игру и с честью выходил из сложных позиций. А единственный проигрыш "огреб" опять же в относительно спокойной технической позиции. Такой вот парадокс. Хотя парадокса нет-на интуиции отсекать ненужные сложности проще для человека, чем в технгических на голом счете сопротивляться монстру.
  30. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Накамуру трудно назвать беззубым.
    Причина-то в другом, её Генна Сосонко в компании с Хармсом на днях сформулировал...
    http://chess-news.ru/node/21700

    Совсем что-то товарищ за конепасностью не следит... И за пунктом f2, в обеих партиях вокруг него всё крутилось.
    Вообще, если ты Эренбург, то живи в СССР в середине XX века и пиши книжки, а не в шахматы играй :)
  31. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Ну там фора была, я имею ввиду надо гандикап приблизить к более равной игре, пусть у проги будет 100 200 эло преимущества а не как тут 400.

    Непонятна пассивность, неужели они не видели другие матчи, да зажги ты и то интересней будет, ну зачем такие ходы как фд3, что там было страшного в размене, они не понимают что пусть структура не портится но у программы большая сила в динамике и теряя так темпы ничего не выйдет хорошего.
  32. WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.491
    Симпатии:
    3.118
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Не совсем понятно - а зачем? В чём конечная цель такого эксперимента?
    Мы все знаем, что нормальный компьютер играет сильнее человека, а очень-очень маломощный - слабее человека. Что дают эти матчи?
    Вот в Го, я понимаю, можно задаться вопросом - на сколько камней новая версия АльфаГо будет играть сильнее топ-про? (есть мнение, что на четыре).
    А в шахматах фора как-то плохо квантуется. Пешка - слишком грубая величина для измерения... А тут и от материальной форы отказались.
  33. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    Цель достаточно ясна и уже озвучивалась Кауфманом неоднократно. Если совсем коротко и грубо сформулировать-то в чем превосходство человека над прогой в шахматах, и в каких позициях/структурах. Идет подстройка в экспериментах и проверка новых эвристик и алгоритмов поиска..
    У Кауфмана в некотором роде "Ботвииниковская" цель-научить прогу "думать как человек/гроссмейстер"...
    Только Эренбург в этом матче пока не использует фору и не предоставляет существенного материала для анализа -играет структуры и стратегию игры. где он заведомо хуже -имхо.
  34. просроченый_кмс Старожил

    • Участник
    • Старожил
    Рег.:
    15.02.2010
    Сообщения:
    1.112
    Симпатии:
    167
    Репутация:
    6
    Оффлайн
    Даа, крутой скетч, шахматисты сложили лапки и померли) но думаю 2700 всё таки боевее будут.
    —- добавлено: 26 июн 2016 —-
    А меня знаете что больше всего поражает, казалось бы проги всё понимают ничего не зевают, но лезут в такие умопомрачительные позиции где сами запутываются. Вероятно у них в настройках нет сушить, а лезут в позиции где на их глубине что то есть перспективное но до конца непонятное, а человек стремится к более понятным позициям, поэтому мы ничего даже понять не можем.

    И ещё тут на форуме кажется видел, турнир программ, одна использовала обычный процессор, другая то ли 2 или 4 тысячи, и там возник такой эндшпиль где более мощная прога просчитала какую то нереальную глубину, где можно пролезть, вот это был космос, там вроде пешки почти запертые и слоны были.
  35. XAJIK 22

    • Участник
    Рег.:
    05.05.2010
    Сообщения:
    1.308
    Симпатии:
    415
    Репутация:
    34
    Оффлайн
    Зевают все. Только прога зевнет 1 раз на (из глубины), а человек зевнет 9 раз (и даже на мелководье). И фора как раз увеличивает количество "зевков" у программы. Но конкретно этот гросс в конкретном матче не хочет заставлять прогу ошибаться...- не создает условий и позиций для этого, упрощая игру -что грубая ошибка при такой форе.

Поделиться этой страницей