К вопросу о машинных переводах

Тема в разделе "Машинное отделение", создана пользователем WinPooh, 2 фев 2007.

  1. TopicStarter Overlay

    WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.490
    Симпатии:
    3.103
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    При чтении соседней ветки вспомнил становящееся уже классическим:

    http://levin.rinet.ru/VA/1997/07.htm

    Похоже, что за прошедшие десять лет шахматные движки усилились гораздо больше, чем системы машинного перевода...
  2. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    Это неиссякаемый источник

    Я вот Прагмой не так давно Faq к Рыбке 2.2н2 перевёл. Получилось весьма даже познавательно! :))

  3. ProstoTak Ветеран

    • Ветеран
    Рег.:
    12.02.2006
    Сообщения:
    5.479
    Симпатии:
    123
    Репутация:
    1
    Оффлайн
    Эх, есть у меня одна идея по принципам написания переводчиков, да вот самому всё некогда вплотную заняться, а вам не скажу потому, что сопрёт кто нибудь :)
  4. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    Просто с английского на русский наверное ещё не скоро программы "научатся" нормально переводить. А вот с украинского - без проблем. Да и с белорусского тоже . Странно, не правда ли? Вроде бы такие непохожие языки! :)
  5. Vlad_Imir Новичок

    • Новичок
    Рег.:
    12.11.2006
    Сообщения:
    77
    Симпатии:
    284
    Репутация:
    20
    Адрес:
    Россия
    Оффлайн
    Машинный перевод так же бесконечно далек от приемлемого уровня как и в начаде 60-х, когда многим казалось, что в ближайшее время будет создано что-то приличное. Суть в том, что знание грамматики совершенно недостаточно (пусть хоть у нас словарь в дополнении на 1000000 слов). Здесь нужно заложить (как пока не знают) знания общего характера, культуры.
    Приведу пример (хотя можно было множество). Пользовался как-то мелками китайскими, против тараканов, многие, наверное, знают. Так вот китайцы написали инструкцию - с точки зрения грамматики совершенно правильную: "Мажьте мелом там, где таракан живет и действует". Что ж требовать от программ?
  6. vlad239 Учаcтник

    • Участник
    Рег.:
    20.12.2006
    Сообщения:
    268
    Симпатии:
    0
    Репутация:
    0
    Оффлайн
    Мне вспоминается вот этот хрестоматийный текст:

    ———————
    Перевод куска текстовика к хелпу Win95 без основного словаря переводчиком Poliglossum с медицинским, коммерческим и юридическим словарем.

    ================= Гуртовщики мыши =================

    Microsoft компания получает много откликов после появления Окон 95. Мы выявили, что мното пользователей встретили проблему мыши. В этом документе Служба Технического Упора Microsoft компании сводит вместе всю полезную информацию о возможных проблемах с мышами и гуртовщиками мыши и забота-стреляние.

    Если вы только что закрепили себе Окна 95,. вы можете увидеть, что ваша мышь плохо себя ведeт. Курсор может не двигаться или движение мыши может проявлять странные следы на поверхности стола, окнах и обоях. Мышь может неадекватно реагировать на щелчок по почкам. Но не спешите! Это могут быть физические проблемы, а не клоп Окон 95.

    Почистите вашу мышь. Отсоедините еe поводок от компьютера, вытащите гениталий и промойте его и ролики внутренностей спиртом. Снова зашейте мышь. Проверьте на переломы поводка. Подсоедините мышь к компьютеру. Приглядитесь к вашей прокладке (подушке) - она не должна быть источником мусора и пыли в гениталии и роликах. Поверхность прокладки не должна стеснять движения мыши.

    Может вам стоит купить новую мышь. Мы настоятельно рекомендуем Microsoft мышь. Она эргономично спроектирована, особо сделана под Окна 95 и имеет третью почку в виде колеса, которые могут завивать окна. Совокупление Microsoft мыши и Окон 95 делает вашу повседневную работу легко приятной.

    Испытайте всe это. Если проблемы остались - ваш гуртовщик мыши плохо стоит под Окнами 95. Его придeтся убрать.

    Вам нужен новый гуртовщик мыши. Если вы пользователь Microsoft мыши посетите Microsoft Слугу Паутины, где в особом подвале вы сможете опустить-загрузить самого текущего гуртовщика Microsoft мыши. Если прозводитель вашей мыши другой, узнайте о еe гуртовщике. Все основные производители мыши уже имеют гуртовщиков мыши для Окон 95.

    Перед тем как вы будете закреплять гуртовщика мыши, сделайте заднюю-верхнюю копию ваших досье. Почистить ваш винчестер имеет смысл. У вас должен быть старт-верх диск от Окон 95.

    После того, как вы закрепили нового гуртовщика, скорее всего ваши проблемы решены. Если они остались, напишите в Службу Технического Упора Microsoft, и вашим случаем займ?тся Особый Отдел.

    Для эффективной помощи технического упора, наш инженер должен знать торговую марку вашей мыши, тип (в-портовая мышь, периодеческая мышь, автобусная мышь, Полицейский Участок /2 мышь, без поводка мышь, гениталий на гусеничном ходу и т.п.), версию гуртовщика, производителя компьютера (матери-доски), положение портов и рубильников на матери-доске (и расклад карт), а также содержимое досье Авто-#####.bat, config.sys и Сапог-полено.txt.

    Кроме того, несколько полезных советов.

    1) Не закрепляйте себе Окна 95 в то же самое место, где у вас закреплены Окна 3.икс, вы не сможете хорошо делать кое-что привычное.

    2) Если вы новичок под Окнами 95, привыкните к новым возможностям мыши. Щeлкните по левой почке - выделите пункт, ударьте по правой почке - меню всплывeт, быстро ударьте два раза по левой почке - запустите повестку в суд.

    3) Отработайте быстрый двойной удар по почкам мыши с помощью специального тренажeра на пульте управления Окнами 95.

    4) Специалисты Microsoft компании после большого числа опытов выявили, что наиболее эффективной командой из-под Окон 95 является "Послать на...", которая доступна в любом времени и месте при ударе по правой почке мыши. Если вы только что закрепили себе Окна 95, вы сумеете послать только на А (В) и в специальное место "Мой портфель". Но по мере того как вы будете закреплять себе новые программы для Окон 95, вы начн?те посылать на всe более сложные и интересные места и объекты.

    Особую эффективность команда "Послать на..." приобретeт при передаче посланий через Е-почту и общение с вашими коллегами и друзьями в местной сети-работе. Попробуйте мощь команды "Послать на...", и вы быстро убедитесь, что без не? трудно существовать под Окнами 95.

    Пишите нам и помните, что Microsoft компания всегда думает о том, как вас лучше сделать.
    ———————

    Влад.

    P.S. Хотя некоторые обороты - наверняка подделки.
  7. Amati Администратор

    • Команда форума
    Рег.:
    11.02.2006
    Сообщения:
    3.816
    Симпатии:
    4
    Репутация:
    0
    Оффлайн
    Боже мой! Как я хохотал!!! Каким-то образом раньше этот текст мне не встретился... Влад, спасибо за полчаса дикого, здорового смеха! :D
  8. immortal223 Вячеслав

    • Участник
    Рег.:
    22.02.2006
    Сообщения:
    2.412
    Симпатии:
    15
    Репутация:
    0
    Оффлайн
    — от Pragma это по-моему вообще шедевр! :)

    А это похоже на чей-то стёб, уж больно красиво вписывается!!!
  9. NS Нефёдов Сергей

    • Заслуженный
    • Ветеран
    Рег.:
    02.05.2006
    Сообщения:
    6.811
    Симпатии:
    96
    Репутация:
    3
    Адрес:
    Санкт-Петербург
    Оффлайн
    Неа, скорей всего не стеб. Я в своё время перевел Документацию к Descent - это было намного круче :)
  10. Муркенштейн Гастролёр

    • Участник
    Рег.:
    20.02.2006
    Сообщения:
    1.794
    Симпатии:
    15
    Репутация:
    2
    Адрес:
    Nowhere
    Оффлайн
    Тут же вспомнилась пара примеров машинного перевода с русского на украинский:

    Источник питания - Джерело харчування
    Бесконечное множество - Нескiнченна безлiч

    Помню, как однажды в университете препод вычитывал такие "пёрлы" из рефератов студентов - вся группа смеялась.
  11. Zayats Без определенного статуса

    • Ветеран
    • Старожил
    Рег.:
    09.01.2007
    Сообщения:
    2.440
    Симпатии:
    1.644
    Репутация:
    154
    Оффлайн
    Прошла спонтанная проверка переводчика google. Изначальной целью эксперимента было исследование адекватности перевода деепричастного оборота – делалось восстановление фразы "Бразды пушистые взрывая, летит кибитка удалая" по схеме русский —> иностранный язык —> русский. Хотя лексика немного устарела, синтаксис предельно прост: подлежащее, сказуемое, дополнительное действие с актантом.

    Итак, начинаются странности. Глагол летит сочтен не несущим самостоятельного смысла. Деепричастие с прямым дополнением превратилось в возвратный глагол, который не может быть переходным. Заметим, что глагол сидит из второй фразы также стал возвратным. Попробуем язык другой группы.

    Пропало не только основное действие, но и дополнительное. Утешает, что вместо машины (или колесницы во французском варианте) в полет отправилась повозка. Сидящий на перекладине помощник не должен пугать, у греков совсем загадочное "тренер сидит на радиусе". Любопытно, что почти во всех переводах фигурируют пушистые поводья, только индусы отвергли эту семантическую несуразность и предложили пьяные поводья. Еще проверка хинди порадовала тулупом, который превратился в пергаментный халат.

    Здесь действие по какой-то причине отнесено в прошлое, снова появилась возвратная форма глагола. Умиляет рекомендация из последней строки.
    Kalvados, Иа и Комсюк нравится это.
  12. Jadn Заслуженный

    • Заслуженный
    • Участник
    • Старожил
    Рег.:
    10.05.2006
    Сообщения:
    3.626
    Симпатии:
    2.535
    Репутация:
    52
    Оффлайн
    Насколько я знаю, Гугл все переводит через английский. Т.е. в реальности это русский=>английский=>немецкий=>английский=>русский.

    С английским в целом неплохо уже получается. Виден прогресс за последние годы, вероятно связанный с нейросетями.

    Гугл:
    Взрываются пушистые поводья, Летит наглый обоз. Кучер сидит на балке. В дубленке, в красном кушаке.
    Яндекс:
    Вожжи пушистые развеваются, летят повозки дерзкие. Водитель сидит на скамейке. В тулупе, в красном кушаке.

    То, что бразды это борозды, а не вожжи, без представления всей ситуации понять невозможно.
  13. Zayats Без определенного статуса

    • Ветеран
    • Старожил
    Рег.:
    09.01.2007
    Сообщения:
    2.440
    Симпатии:
    1.644
    Репутация:
    154
    Оффлайн
    Однако как тогда эсперанто возвращает деепричастие (Взрывая пушистые поводья, смелая повозка летит), его же английский должен был по дороге "убить"?

    P.S. Вот еще информация для тех, кто предпочитает пользоваться онлайн-переводчиками в деловой или частной переписках.
    Синдхи: Летят мухи, фургоны Дарвина.
    Белорусский: Руль - пушистый взрыв, летающий будда щедрый.
    Kalvados нравится это.
  14. Asperger в 5-ом Диагностическом руководстве отсутствует

    • Заблокирован
    Рег.:
    13.11.2020
    Сообщения:
    1.170
    Симпатии:
    1.851
    Репутация:
    48
    Нарушения:
    62
    Оффлайн
    Как считать текст с любой картинки?

    wentille нравится это.
  15. TopicStarter Overlay

    WinPooh В.М.

    • Команда форума
    Рег.:
    13.02.2006
    Сообщения:
    9.490
    Симпатии:
    3.103
    Репутация:
    95
    Адрес:
    Москва
    Оффлайн
    Прошло ещё несколько лет. Проверяем ChatGPT 3.5.
    Через китайский язык:

    Пушистые конские поводья взметнулись взрывом, колесница быстро промчалась; кучер сидел на меховой шубе и красном поясе.
    Kalvados и Zayats нравится это.
  16. I0p3a Учаcтник

    • Участник
    Рег.:
    14.08.2016
    Сообщения:
    2.178
    Симпатии:
    3.947
    Репутация:
    319
    Оффлайн
    Сравнение переводчиков
    Сейчас, в эру интернета, для нас – русских людей в массе своей не владеющих иностранным, в частности английским языком, нет проблемы, когда возникает необходимость перевода забугорного текста на «великий и могучий» язык. Есть куча он- и оф-лайн переводчиков. Но, наверное, самые популярные переводчики - от Гугла (https://translate.google.ru/), Яндекса (https://translate.yandex.ru) и Промта (https://www.translate.ru). Вот и решил для себя проверить насколько точны и идентичны переводы этих монстров.
    Возможно и еще кому-нибудь будут полезны результаты этого мини исследования.:oops:

    Алгоритм проверки.
    1. Беру текст на русском.
    2. Перевожу выбранным переводчиком на английский.
    3. Переведенный текст тем же переводчиком перевожу на русский.
    4. Для сравнения исходного текста и переведенного с английского на русский использую сайт https://textcompare.ru/
    5. Получаю параметр - Расстояние Левенштейна, (или редакционное расстояние, — метрика схождения между двумя строковыми последовательностями. Чем больше расстояние, тем более различны строки. Для двух одинаковых последовательностей расстояние равно нулю.)
    Данные и результаты проверки будут приведены в таблицах и диаграммах.
    1. Исходник технического текста для теста (в смысле тЭста, а не кулинарного теста):rtfm:
    WinRAR
    Платформы: Windows, Android.
    Самый популярный архиватор, которым пользуются миллионы людей по всему миру.
    WinRAR поддерживает все форматы файлов, включая малораспространённые, и позволяет как упаковывать, так и извлекать их.
    Встроенные алгоритмы распознают тип контента и автоматически выбирают наиболее эффективное сжатие.
    Можно разделять архивы на части для удобной передачи, а также надёжно защищать их с помощью 256‑битного шифрования и электронной подписи.
    Технически WinRAR является платным ПО с 40‑дневным пробным периодом, но разработчики позволяют бесплатно использовать приложение по окончании ознакомительного срока.
    Кроме окна с предложением покупки лицензии, которое появляется при каждом запуске и закрывается в один клик, незарегистрированная версия ничем не отличается от основной.
    Скачать с официального сайта →
    1.0.jpg
    1.1.jpg
    И для наглядности
    1.2.jpg
    Вывод.:eek:
    В принципе, всем переводчикам при переводе технического текста, можно доверять, но Яндексу – больше.:)

    Это еще, как вы понимаете, не все. :popcorn:
  17. I0p3a Учаcтник

    • Участник
    Рег.:
    14.08.2016
    Сообщения:
    2.178
    Симпатии:
    3.947
    Репутация:
    319
    Оффлайн
    Продолжаю.
    2. Исходник стихотворного текста для теста (тЭста!)

    Белеет парус одинокой
    В тумане моря голубом!..
    Что ищет он в стране далекой?
    Что кинул он в краю родном?..

    Играют волны — ветер свищет,
    И мачта гнется и скрыпит…
    Увы! он счастия не ищет
    И не от счастия бежит!

    Под ним струя светлей лазури,
    Над ним луч солнца золотой…
    А он, мятежный, просит бури,
    Как будто в бурях есть покой!​
    2.0.jpg
    2.1.jpg

    И для наглядности
    2.2.jpg
    Вывод.:crazy:
    Да. При переводе стихотворного текста лучше пользоваться Гуглом.:heart:

    Это, ещё, пока не все. :cool:
  18. I0p3a Учаcтник

    • Участник
    Рег.:
    14.08.2016
    Сообщения:
    2.178
    Симпатии:
    3.947
    Репутация:
    319
    Оффлайн
    3. Исходник прозы для теста

    ПОНЕДЕЛЬНИК НАЧИНАЕТСЯ В СУББОТУ

    Мы въехали в город. Потянулись старинные крепкие заборы, мощные срубы из гигантских почерневших брёвен, с неширокими окнами, с резными наличниками, с деревянными петушками на крышах. Попалось несколько грязных кирпичных строений с железными дверями, вид которых вынес у меня из памяти полузнакомое слово «лабаз». Улица была прямая и широкая и называлась проспектом Мира. Впереди, ближе к центру, виднелись двухэтажные шлакоблочные дома с открытыми сквериками.

    – Следующий переулок направо, – сказал горбоносый.

    Я включил указатель поворота, притормозил и свернул направо. Дорога здесь заросла травой, но у какой-то калитки стоял, приткнувшись, новенький «Запорожец». Номера домов висели над воротами, и цифры были едва заметны на ржавой жести вывесок. Переулок назывался изящно: «Ул. Лукоморье». Он был неширок и зажат между тяжёлых старинных заборов, поставленных, наверное, ещё в те времена, когда здесь шастали шведские и норвежские пираты.​
    3.0.jpg
    3.1.jpg
    И для наглядности
    3.2.jpg

    Вывод.:writing:
    При переводе прозы ужасные результаты у Промта, а Гугл – молодец.O_o

    И последняя таблица
    4.0.jpg
    ВЫВОД.:beer:

    Это примитивное исследовании переводчиков показало, что с техническим текстом более качественно справляется Яндекс, а во всех остальных случаях Гугл.:hi:

    Dixi:bye:
  19. svoitsl Учаcтник

    • Участник
    Рег.:
    06.01.2018
    Сообщения:
    374
    Симпатии:
    91
    Репутация:
    7
    Оффлайн
    то ли я не понял, то ли первая картинка с расстояниями не та

Поделиться этой страницей