Компьютерный чемпионат Чесс.Ком

Тема в разделе "Машинное отделение", создана пользователем Mustitz, 6 сен 2018.

  1. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Можно наблюдать тут:
    https://www.chess.com/computer-chess-championship

    Пока таблица такая:
    Screenshot from 2018-09-06 16-55-12.png

    в целом много движков, совершенно разных по силе. Первые пять (включая Lc0) пока что идут без поражений.
     
    WinPooh нравится это.
  2. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Жаль что Deus'а нет. Играет не очень сильно, зато очень весело.

    У Лилы удивительные результаты. Сплошные ничьи с лидерами, под ноль вынесенные середняки и снова сплошные ничьи с аутсайдерами. Никому не проигрывает, но и пробивной силы не хватает. Особенно черными - всего 2 победы. Этакий компьютерный Леко получился.
     
  3. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Там с эндшпилем по-прежнему проблемы. На доске вечный шах - она бегает королём от ферзя и десятки ходов подряд рисует себе плюс три...
     
  4. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Справедливости ради стоит отметить, что из четвёрки лидеров тоже пока друг у друга никто не выиграл.
     
  5. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Leela всё же проиграла Ethereal, вместо атаки в сицилианке перейдя в худший эндшпиль, где альфа-бета показала своё превосходство. А я так надеялся, что чёрные пробьют на b3 :)
    Впрочем, четвёртое место пока держит крепко. Думаю, общий результат по итогам финала такой же и будет, плюс-минус одна позиция.
     
    Mustitz нравится это.
  6. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Дык, запостили бы PGN в студию :)
     
  7. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    [Event "CCCC 1: Rapid Rumble (15|5) Stage 1"]
    [Site "Chess.com"]
    [Date "2018.09.10"]
    [Round "?"]
    [White "Ethereal 10.88"]
    [Black "Lc0 17.11089"]
    [Result "1-0"]
    [WhiteElo "3283"]
    [BlackElo "3326"]
    [WhiteType "program"]
    [BlackType "program"]
    [ECO "B90"]
    [Opening "Sicilian"]
    [Variation "Najdorf, Byrne (English) attack"]
    [TimeControl "900+5"]
    [Time "01:24:38"]
    [Termination "normal"]
    [PlyCount "173"]

    1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Nc3 a6 6. Be3 e5 7. Nb3 Be6 8. f4
    exf4 9. Bxf4 Nc6 10. a3 Be7 11. Qd2 Nh5 12. Be3 Nf6 13. O-O-O O-O 14. Kb1 b5 15.
    Nd4 Nxd4 16. Bxd4 Rb8 17. Be2 Nd7 18. Rhf1 Bg5 19. Qd3 Qe7 20. Bf2 b4 21. axb4
    Rxb4 22. Qxd6 Rfb8 23. b3 Qd8 24. Nd5 Rxe4 25. Rfe1 Bf5 26. Kb2 Rc8 27. Bd3 Rxe1
    28. Bxe1 Bg4 29. Ra1 Nc5 30. Qxd8+ Rxd8 31. Bc4 Be6 32. Rd1 Rd7 33. Bb4 Ne4 34.
    Kb1 Bd8 35. Rd4 Nf2 36. Bc5 Ng4 37. Nb4 Rxd4 38. Bxd4 Bxc4 39. bxc4 Bf6 40. Bg1
    Ne5 41. c5 a5 42. c6 Bd8 43. Bd4 Bc7 44. Bxe5 Bxe5 45. Na6 Bxh2 46. c7 Bxc7 47.
    Nxc7 f5 48. Ne6 Kf7 49. Nd8+ Kf6 50. Nb7 a4 51. Nc5 g5 52. Nxa4 h5 53. Nc5 h4
    54. Kc1 g4 55. Nd3 h3 56. gxh3 gxh3 57. c3 h2 58. Nf2 Ke5 59. Kd2 Kd5 60. Kd3
    Ke5 61. Ke3 Kd5 62. Nh1 Kc4 63. Kd2 Kd5 64. Kd3 f4 65. c4+ Kc5 66. Kc3 Kd6 67.
    Kd4 Kd7 68. c5 Kd8 69. c6 Kc8 70. Kc5 Kc7 71. Kb5 f3 72. Kc5 f2 73. Nxf2 Kc8 74.
    Kb6 Kd8 75. c7+ Kd7 76. Kb7 Ke6 77. c8=Q+ Ke5 78. Qh3 Kf4 79. Qxh2+ Kf3 80. Qh3+
    Kxf2 81. Kb6 Ke2 82. Kc5 Kf2 83. Kd4 Kg1 84. Kd3 Kf2 85. Qg4 Kf1 86. Ke3 Ke1 87.
    Qg1# 1-0

    В виде тега почему-то не желает работать.
     
    Mustitz нравится это.
  8. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37

     
    WinPooh нравится это.
  9. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Сейчас у Лилы была прекрасная возможность размочить сухой счёт без поражений у Комодо. В какой-то момент оба движка показывали оценку плюс шесть или семь в пользу белых. Но - увы - разноцвет с почти двумя лишними пешками не выигрался...
    Похоже, этот супер-интеллектуальный поиск категорически не подходит для эндшпиля. Какие-то фундаментальные причины мешают, а не просто недостаток мощности.
     
  10. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Зато 400 ходов почти наиграли лол

     
  11. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А такой разноцвет в принципе выигрывается? Как только блокада по белым полям получится сразу битая ничья будет. А как блокады можно избежать?

    ps
    А вообще есть подозрение, что для эндшпилей нейронка Лилы просто плохо натренирована. Обучение Лилы довольно короткое, просто не успевает она достаточное количество эндшпилей наиграть.
     
    Последнее редактирование: 13 сен 2018
  12. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Ну, раз Лила показывает в нём "плюс 7", значит, откуда-то это число берётся? И берётся оно из статистики игр против самой себя.
    В то, что за 8 миллионов игр не встретилось несколько десятков или сотен тысяч эндшпилей с разноцветом, мне как-то не очень верится.
    Нам говорят, что нейронная сеть сильна в поиске высокоуровневых концепций и обобщений. Вот как раз пример такой концепции: блокада по полям одного цвета при слоне противника на полях другого цвета. Ну и где?
     
    Последнее редактирование: 13 сен 2018
  13. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Вы какие-то магические свойства нейронным сетям приписываете. Гроссмейстер глядя на сложный разноцвет насколько точно может определить его ничейность? Не особо точно. А у человека нейронка малость побольше размером чем у Лилы.

    Чтобы разговор стал предметным для начала надо разобраться - Лила плохо играет в эндшпилях или только оценку не всегда правильную показывает. Причем проигрывает она в эндшпилях крайне редко. То есть по крайней мере в худших эндшпилях играет очень сильно.

    ps
    И еще такой вопрос. Насколько оценкам, которые показывает chess.com, можно верить. Например, партия №423 Гудини-Лила завершившаяся повторением ходов. Если верить chess.com, то в заключительной позиции Лила показывала мат в 10 ходов, а Гудини в 69 ходов. Но это же явно бред.
     
  14. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Мне кажется, она плохо играет не в эндшпилях как таковых, а на этапе перехода из миттельшпиля в эндшпиль. Когда надо выбрать: продолжать борьбу с неясными шансами, или попасть в бито-ничейное окончание. И вот тут-то свою роль играет оценка.
     
    Undying нравится это.
  15. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Снова фиаско в сицилианке:

     
  16. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Непонятно, что chess.com вместо оценок показывает. Если оценкам верить, то всю партию и Лила и Файр считали, что у черных лучше, включая момент когда им ставят мат. :)

    А по партии непонятно почему не 42 ... f3. Что за странный ход Лd2. После f3 по человечески выглядит выигранно за черных, у белых не видно угроз вообще.
     
    Последнее редактирование: 14 сен 2018
  17. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Я в прямом эфире смотрел, вроде всё там нормально с оценками было. Начиная с какого-то момента Файр показывал +99.0, а Лила - что-то около +7. Я так понимаю, оценка всегда показывается за сторону белых.
     
  18. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Mustitz нравится это.
  19. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А в записи почему-то начиная с 30 хода все оценки в пользу черных. Чем там интересно программисты занимаются, что так накосячить умудряются.
     
  20. pavelgttfj8
    Оффлайн

    pavelgttfj8 Учаcтник

    Репутация:
    3
    Бедный Texel зевнул мат в 527 ходов cccc.jpg
     
  21. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    После f3 проигрывают быстро черные. Не допер я, что после шаха на g6, король на h4 не спасается, т.к. после f3 появился шах с e4 и дальше пешки съедаются.
     
  22. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Все-таки с наигрышем в эндшпилях у Лилы проблемы. Или в обучении какие-то ошибки. Сейчас с Педоном Лила считала окончание ладья и крайняя пешка против слона абсолютно выигранным. Уж такую-то элементарщину нейронная сеть без проблем должна понимать.

    ps
    Похоже с патом у Лилы какая-то ошибка. С Педоном на 91 ходу Лила показывает оценку -17, а в варианте, который приводит, стоит пат на доске.
     
  23. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Пат это оценка по минимаксу. А у Лилы в качестве оценки используется статистика доигрываний.
     
  24. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Пат на доске это не оценка. Это результат. Поэтому вне зависимости, что Лила использует в качестве оценки, ошибка в коде явная.
     
    WinPooh нравится это.
  25. Mustitz
    Оффлайн

    Mustitz баннер

    Репутация:
    37
    Ок, пат это минимаксный результат. Особеность MCTS в том, что он больше полагается на статистику доигрываний. Т. е. вполне вероятна ситуация, когда MTCS может выбрать худший ход с точки зрения минимаксной оценки только потому, что опровергающий вариант появился в самом конце и не набрал нужную статистику. С точки зрения алгоритма, оценка в 70% побед и в принципиальном варианте и мат нам в конце вполне допустима.

    Или тут, допустим статистика доигрываний 90% в нашу пользу, это означает, что из 100 доигрываний 80 побед и 20 ничейных результатов. Ну и велика вероятность, что если выбирать в каждом узле ходы, которые чаще всего попадали в симуляцию, то мы прийдём в итоге ничейную симуляцию. Вот 90% побед в переводе на пешки и получается +17.
     
  26. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Вечных шахов не понимает. С этим надо что-то делать, это очень серьёзная фора альфа-бета движкам в эндшпиле. Так Стокфиш не обойти.
     
  27. Осипов Юрий
    Оффлайн

    Осипов Юрий Учаcтник

    Репутация:
    11
    А есть движки, понимающие вечный шах? Если с повтором позиций, то да. Но вечный шах без повторов... Непонятно, как это сделать.
     
  28. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    По крайней мере, если не чистый вечный шах, а вечное преследование, то традиционные движки достаточно быстро выходят на оценку 0.00. А у Лилы много раз видел, как она бегает по всей доске королём от ферзя, при этом может показывать оценку +3 или +7...
    Впрочем, сейчас мне в очередной раз скажут, что оценка, выводимая MCTS-движком, не имеет никакого отношения к оценке позиции :)
     
  29. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Может быть, как то учитывать прогресс оценки с глубиной? Если на глубине 5 у нас +7, и на глубине 10 тоже +7, и на глубине 15 - то же самое, то возможно, что-то пошло не так, ситуация не улучшается.
     
  30. Комсюк
    Оффлайн

    Комсюк народный модератор баннер

    Репутация:
    1.273
    в Стокфише пытаются сделать подобное, как я понял...
    Движковцы пусть прояснят, но там сейчас оценка связана с прошлыми цифрами
     
  31. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    В принципе нейронка сама по себе должна достаточно неплохо определять вероятность вечного преследования. Это же закономерность и довольно простая. И если Лила в принципе вечного преследования не видит и всегда рисует себе большой плюс, то это тоже сильно на неправильное обучение похоже.
     
    WinPooh нравится это.
  32. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95

     
  33. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    Может быть сама нейронка, имея на входе только текущую позицию, тут и не способна разобраться. Но ей надо помочь тогда. Например, добавить вход, который будет принимать количество шахов подряд.

    И еще интересно. В го насколько помню нейронка на вход получала не только текущую позицию, но и сколько-то последних ходов. А Лила только текущую позицию смотрит или предшествующие ходы тоже учитывает? По идее предшествующие ходы распознавание вечного шаха сильно облегчат.
     
  34. Undying
    Оффлайн

    Undying Учаcтник

    Репутация:
    15
    А как теперь посмотреть партии первого этапа?
     
  35. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Как минимум, сколько-то предыдущих ходов надо помнить, чтобы не нарваться на троекратное.