Компьютерный чемпионат Чесс.Ком

Discussion in 'Машинное отделение' started by Mustitz, 6 Sep 2018.

  1. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Можно наблюдать тут:
    https://www.chess.com/computer-chess-championship

    Пока таблица такая:
    Screenshot from 2018-09-06 16-55-12.png

    в целом много движков, совершенно разных по силе. Первые пять (включая Lc0) пока что идут без поражений.
    WinPooh likes this.
  2. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Жаль что Deus'а нет. Играет не очень сильно, зато очень весело.

    У Лилы удивительные результаты. Сплошные ничьи с лидерами, под ноль вынесенные середняки и снова сплошные ничьи с аутсайдерами. Никому не проигрывает, но и пробивной силы не хватает. Особенно черными - всего 2 победы. Этакий компьютерный Леко получился.
  3. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Там с эндшпилем по-прежнему проблемы. На доске вечный шах - она бегает королём от ферзя и десятки ходов подряд рисует себе плюс три...
  4. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Справедливости ради стоит отметить, что из четвёрки лидеров тоже пока друг у друга никто не выиграл.
  5. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Leela всё же проиграла Ethereal, вместо атаки в сицилианке перейдя в худший эндшпиль, где альфа-бета показала своё превосходство. А я так надеялся, что чёрные пробьют на b3 :)
    Впрочем, четвёртое место пока держит крепко. Думаю, общий результат по итогам финала такой же и будет, плюс-минус одна позиция.
    Mustitz likes this.
  6. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Дык, запостили бы PGN в студию :)
  7. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    [Event "CCCC 1: Rapid Rumble (15|5) Stage 1"]
    [Site "Chess.com"]
    [Date "2018.09.10"]
    [Round "?"]
    [White "Ethereal 10.88"]
    [Black "Lc0 17.11089"]
    [Result "1-0"]
    [WhiteElo "3283"]
    [BlackElo "3326"]
    [WhiteType "program"]
    [BlackType "program"]
    [ECO "B90"]
    [Opening "Sicilian"]
    [Variation "Najdorf, Byrne (English) attack"]
    [TimeControl "900+5"]
    [Time "01:24:38"]
    [Termination "normal"]
    [PlyCount "173"]

    1. e4 c5 2. Nf3 d6 3. d4 cxd4 4. Nxd4 Nf6 5. Nc3 a6 6. Be3 e5 7. Nb3 Be6 8. f4
    exf4 9. Bxf4 Nc6 10. a3 Be7 11. Qd2 Nh5 12. Be3 Nf6 13. O-O-O O-O 14. Kb1 b5 15.
    Nd4 Nxd4 16. Bxd4 Rb8 17. Be2 Nd7 18. Rhf1 Bg5 19. Qd3 Qe7 20. Bf2 b4 21. axb4
    Rxb4 22. Qxd6 Rfb8 23. b3 Qd8 24. Nd5 Rxe4 25. Rfe1 Bf5 26. Kb2 Rc8 27. Bd3 Rxe1
    28. Bxe1 Bg4 29. Ra1 Nc5 30. Qxd8+ Rxd8 31. Bc4 Be6 32. Rd1 Rd7 33. Bb4 Ne4 34.
    Kb1 Bd8 35. Rd4 Nf2 36. Bc5 Ng4 37. Nb4 Rxd4 38. Bxd4 Bxc4 39. bxc4 Bf6 40. Bg1
    Ne5 41. c5 a5 42. c6 Bd8 43. Bd4 Bc7 44. Bxe5 Bxe5 45. Na6 Bxh2 46. c7 Bxc7 47.
    Nxc7 f5 48. Ne6 Kf7 49. Nd8+ Kf6 50. Nb7 a4 51. Nc5 g5 52. Nxa4 h5 53. Nc5 h4
    54. Kc1 g4 55. Nd3 h3 56. gxh3 gxh3 57. c3 h2 58. Nf2 Ke5 59. Kd2 Kd5 60. Kd3
    Ke5 61. Ke3 Kd5 62. Nh1 Kc4 63. Kd2 Kd5 64. Kd3 f4 65. c4+ Kc5 66. Kc3 Kd6 67.
    Kd4 Kd7 68. c5 Kd8 69. c6 Kc8 70. Kc5 Kc7 71. Kb5 f3 72. Kc5 f2 73. Nxf2 Kc8 74.
    Kb6 Kd8 75. c7+ Kd7 76. Kb7 Ke6 77. c8=Q+ Ke5 78. Qh3 Kf4 79. Qxh2+ Kf3 80. Qh3+
    Kxf2 81. Kb6 Ke2 82. Kc5 Kf2 83. Kd4 Kg1 84. Kd3 Kf2 85. Qg4 Kf1 86. Ke3 Ke1 87.
    Qg1# 1-0

    В виде тега почему-то не желает работать.
    Mustitz likes this.
  8. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн

    WinPooh likes this.
  9. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Сейчас у Лилы была прекрасная возможность размочить сухой счёт без поражений у Комодо. В какой-то момент оба движка показывали оценку плюс шесть или семь в пользу белых. Но - увы - разноцвет с почти двумя лишними пешками не выигрался...
    Похоже, этот супер-интеллектуальный поиск категорически не подходит для эндшпиля. Какие-то фундаментальные причины мешают, а не просто недостаток мощности.
  10. pavelgttfj8 Учаcтник

    • Участник
    Member Since:
    07.12.2017
    Message Count:
    290
    Likes Received:
    90
    Репутация:
    3
    Оффлайн
    Зато 400 ходов почти наиграли лол

  11. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А такой разноцвет в принципе выигрывается? Как только блокада по белым полям получится сразу битая ничья будет. А как блокады можно избежать?

    ps
    А вообще есть подозрение, что для эндшпилей нейронка Лилы просто плохо натренирована. Обучение Лилы довольно короткое, просто не успевает она достаточное количество эндшпилей наиграть.
  12. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Ну, раз Лила показывает в нём "плюс 7", значит, откуда-то это число берётся? И берётся оно из статистики игр против самой себя.
    В то, что за 8 миллионов игр не встретилось несколько десятков или сотен тысяч эндшпилей с разноцветом, мне как-то не очень верится.
    Нам говорят, что нейронная сеть сильна в поиске высокоуровневых концепций и обобщений. Вот как раз пример такой концепции: блокада по полям одного цвета при слоне противника на полях другого цвета. Ну и где?
  13. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Вы какие-то магические свойства нейронным сетям приписываете. Гроссмейстер глядя на сложный разноцвет насколько точно может определить его ничейность? Не особо точно. А у человека нейронка малость побольше размером чем у Лилы.

    Чтобы разговор стал предметным для начала надо разобраться - Лила плохо играет в эндшпилях или только оценку не всегда правильную показывает. Причем проигрывает она в эндшпилях крайне редко. То есть по крайней мере в худших эндшпилях играет очень сильно.

    ps
    И еще такой вопрос. Насколько оценкам, которые показывает chess.com, можно верить. Например, партия №423 Гудини-Лила завершившаяся повторением ходов. Если верить chess.com, то в заключительной позиции Лила показывала мат в 10 ходов, а Гудини в 69 ходов. Но это же явно бред.
  14. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Мне кажется, она плохо играет не в эндшпилях как таковых, а на этапе перехода из миттельшпиля в эндшпиль. Когда надо выбрать: продолжать борьбу с неясными шансами, или попасть в бито-ничейное окончание. И вот тут-то свою роль играет оценка.
    Undying likes this.
  15. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Снова фиаско в сицилианке:

  16. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Непонятно, что chess.com вместо оценок показывает. Если оценкам верить, то всю партию и Лила и Файр считали, что у черных лучше, включая момент когда им ставят мат. :)

    А по партии непонятно почему не 42 ... f3. Что за странный ход Лd2. После f3 по человечески выглядит выигранно за черных, у белых не видно угроз вообще.
  17. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Я в прямом эфире смотрел, вроде всё там нормально с оценками было. Начиная с какого-то момента Файр показывал +99.0, а Лила - что-то около +7. Я так понимаю, оценка всегда показывается за сторону белых.
  18. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Mustitz likes this.
  19. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А в записи почему-то начиная с 30 хода все оценки в пользу черных. Чем там интересно программисты занимаются, что так накосячить умудряются.
  20. pavelgttfj8 Учаcтник

    • Участник
    Member Since:
    07.12.2017
    Message Count:
    290
    Likes Received:
    90
    Репутация:
    3
    Оффлайн
    Бедный Texel зевнул мат в 527 ходов cccc.jpg
  21. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    После f3 проигрывают быстро черные. Не допер я, что после шаха на g6, король на h4 не спасается, т.к. после f3 появился шах с e4 и дальше пешки съедаются.
  22. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Все-таки с наигрышем в эндшпилях у Лилы проблемы. Или в обучении какие-то ошибки. Сейчас с Педоном Лила считала окончание ладья и крайняя пешка против слона абсолютно выигранным. Уж такую-то элементарщину нейронная сеть без проблем должна понимать.

    ps
    Похоже с патом у Лилы какая-то ошибка. С Педоном на 91 ходу Лила показывает оценку -17, а в варианте, который приводит, стоит пат на доске.
  23. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Пат это оценка по минимаксу. А у Лилы в качестве оценки используется статистика доигрываний.
  24. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Пат на доске это не оценка. Это результат. Поэтому вне зависимости, что Лила использует в качестве оценки, ошибка в коде явная.
    WinPooh likes this.
  25. TopicStarter Overlay

    Mustitz Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Member Since:
    30.09.2006
    Message Count:
    3.546
    Likes Received:
    1.265
    Репутация:
    36
    Location:
    Киев
    Оффлайн
    Ок, пат это минимаксный результат. Особеность MCTS в том, что он больше полагается на статистику доигрываний. Т. е. вполне вероятна ситуация, когда MTCS может выбрать худший ход с точки зрения минимаксной оценки только потому, что опровергающий вариант появился в самом конце и не набрал нужную статистику. С точки зрения алгоритма, оценка в 70% побед и в принципиальном варианте и мат нам в конце вполне допустима.

    Или тут, допустим статистика доигрываний 90% в нашу пользу, это означает, что из 100 доигрываний 80 побед и 20 ничейных результатов. Ну и велика вероятность, что если выбирать в каждом узле ходы, которые чаще всего попадали в симуляцию, то мы прийдём в итоге ничейную симуляцию. Вот 90% побед в переводе на пешки и получается +17.
  26. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Вечных шахов не понимает. С этим надо что-то делать, это очень серьёзная фора альфа-бета движкам в эндшпиле. Так Стокфиш не обойти.
  27. Осипов Юрий Учаcтник

    • Участник
    Member Since:
    18.06.2007
    Message Count:
    399
    Likes Received:
    475
    Репутация:
    11
    Location:
    Правда
    Оффлайн
    А есть движки, понимающие вечный шах? Если с повтором позиций, то да. Но вечный шах без повторов... Непонятно, как это сделать.
  28. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    По крайней мере, если не чистый вечный шах, а вечное преследование, то традиционные движки достаточно быстро выходят на оценку 0.00. А у Лилы много раз видел, как она бегает по всей доске королём от ферзя, при этом может показывать оценку +3 или +7...
    Впрочем, сейчас мне в очередной раз скажут, что оценка, выводимая MCTS-движком, не имеет никакого отношения к оценке позиции :)
  29. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Может быть, как то учитывать прогресс оценки с глубиной? Если на глубине 5 у нас +7, и на глубине 10 тоже +7, и на глубине 15 - то же самое, то возможно, что-то пошло не так, ситуация не улучшается.
  30. Комсюк народный модератор

    • Заслуженный
    • Ветеран
    • Заблокирован
    • Старожил
    Member Since:
    17.07.2011
    Message Count:
    19.230
    Likes Received:
    23.509
    Репутация:
    1.263
    Нарушения:
    31
    Оффлайн
    в Стокфише пытаются сделать подобное, как я понял...
    Движковцы пусть прояснят, но там сейчас оценка связана с прошлыми цифрами
  31. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    В принципе нейронка сама по себе должна достаточно неплохо определять вероятность вечного преследования. Это же закономерность и довольно простая. И если Лила в принципе вечного преследования не видит и всегда рисует себе большой плюс, то это тоже сильно на неправильное обучение похоже.
    WinPooh likes this.
  32. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн

  33. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    Может быть сама нейронка, имея на входе только текущую позицию, тут и не способна разобраться. Но ей надо помочь тогда. Например, добавить вход, который будет принимать количество шахов подряд.

    И еще интересно. В го насколько помню нейронка на вход получала не только текущую позицию, но и сколько-то последних ходов. А Лила только текущую позицию смотрит или предшествующие ходы тоже учитывает? По идее предшествующие ходы распознавание вечного шаха сильно облегчат.
  34. Undying Учаcтник

    • Участник
    Member Since:
    31.08.2016
    Message Count:
    1.316
    Likes Received:
    566
    Репутация:
    15
    Оффлайн
    А как теперь посмотреть партии первого этапа?
  35. WinPooh В.М.

    • Команда форума
    Member Since:
    13.02.2006
    Message Count:
    9.491
    Likes Received:
    3.118
    Репутация:
    95
    Location:
    Москва
    Оффлайн
    Как минимум, сколько-то предыдущих ходов надо помнить, чтобы не нарваться на троекратное.

Share This Page