К вопросу о машинных переводах

Тема в разделе "Машинное отделение", создана пользователем WinPooh, 2 фев 2007.

  1. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    При чтении соседней ветки вспомнил становящееся уже классическим:

    http://levin.rinet.ru/VA/1997/07.htm

    Похоже, что за прошедшие десять лет шахматные движки усилились гораздо больше, чем системы машинного перевода...
     
  2. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Это неиссякаемый источник

    Я вот Прагмой не так давно Faq к Рыбке 2.2н2 перевёл. Получилось весьма даже познавательно! :))

     
  3. ProstoTak
    Оффлайн

    ProstoTak Старожил

    Репутация:
    1
    Эх, есть у меня одна идея по принципам написания переводчиков, да вот самому всё некогда вплотную заняться, а вам не скажу потому, что сопрёт кто нибудь :)
     
  4. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    Просто с английского на русский наверное ещё не скоро программы "научатся" нормально переводить. А вот с украинского - без проблем. Да и с белорусского тоже . Странно, не правда ли? Вроде бы такие непохожие языки! :)
     
  5. Vlad_Imir
    Оффлайн

    Vlad_Imir Новичок

    Репутация:
    20
    Машинный перевод так же бесконечно далек от приемлемого уровня как и в начаде 60-х, когда многим казалось, что в ближайшее время будет создано что-то приличное. Суть в том, что знание грамматики совершенно недостаточно (пусть хоть у нас словарь в дополнении на 1000000 слов). Здесь нужно заложить (как пока не знают) знания общего характера, культуры.
    Приведу пример (хотя можно было множество). Пользовался как-то мелками китайскими, против тараканов, многие, наверное, знают. Так вот китайцы написали инструкцию - с точки зрения грамматики совершенно правильную: "Мажьте мелом там, где таракан живет и действует". Что ж требовать от программ?
     
  6. vlad239
    Оффлайн

    vlad239 Учаcтник

    Репутация:
    0
    Мне вспоминается вот этот хрестоматийный текст:

    ———————
    Перевод куска текстовика к хелпу Win95 без основного словаря переводчиком Poliglossum с медицинским, коммерческим и юридическим словарем.

    ================= Гуртовщики мыши =================

    Microsoft компания получает много откликов после появления Окон 95. Мы выявили, что мното пользователей встретили проблему мыши. В этом документе Служба Технического Упора Microsoft компании сводит вместе всю полезную информацию о возможных проблемах с мышами и гуртовщиками мыши и забота-стреляние.

    Если вы только что закрепили себе Окна 95,. вы можете увидеть, что ваша мышь плохо себя ведeт. Курсор может не двигаться или движение мыши может проявлять странные следы на поверхности стола, окнах и обоях. Мышь может неадекватно реагировать на щелчок по почкам. Но не спешите! Это могут быть физические проблемы, а не клоп Окон 95.

    Почистите вашу мышь. Отсоедините еe поводок от компьютера, вытащите гениталий и промойте его и ролики внутренностей спиртом. Снова зашейте мышь. Проверьте на переломы поводка. Подсоедините мышь к компьютеру. Приглядитесь к вашей прокладке (подушке) - она не должна быть источником мусора и пыли в гениталии и роликах. Поверхность прокладки не должна стеснять движения мыши.

    Может вам стоит купить новую мышь. Мы настоятельно рекомендуем Microsoft мышь. Она эргономично спроектирована, особо сделана под Окна 95 и имеет третью почку в виде колеса, которые могут завивать окна. Совокупление Microsoft мыши и Окон 95 делает вашу повседневную работу легко приятной.

    Испытайте всe это. Если проблемы остались - ваш гуртовщик мыши плохо стоит под Окнами 95. Его придeтся убрать.

    Вам нужен новый гуртовщик мыши. Если вы пользователь Microsoft мыши посетите Microsoft Слугу Паутины, где в особом подвале вы сможете опустить-загрузить самого текущего гуртовщика Microsoft мыши. Если прозводитель вашей мыши другой, узнайте о еe гуртовщике. Все основные производители мыши уже имеют гуртовщиков мыши для Окон 95.

    Перед тем как вы будете закреплять гуртовщика мыши, сделайте заднюю-верхнюю копию ваших досье. Почистить ваш винчестер имеет смысл. У вас должен быть старт-верх диск от Окон 95.

    После того, как вы закрепили нового гуртовщика, скорее всего ваши проблемы решены. Если они остались, напишите в Службу Технического Упора Microsoft, и вашим случаем займ?тся Особый Отдел.

    Для эффективной помощи технического упора, наш инженер должен знать торговую марку вашей мыши, тип (в-портовая мышь, периодеческая мышь, автобусная мышь, Полицейский Участок /2 мышь, без поводка мышь, гениталий на гусеничном ходу и т.п.), версию гуртовщика, производителя компьютера (матери-доски), положение портов и рубильников на матери-доске (и расклад карт), а также содержимое досье Авто-#####.bat, config.sys и Сапог-полено.txt.

    Кроме того, несколько полезных советов.

    1) Не закрепляйте себе Окна 95 в то же самое место, где у вас закреплены Окна 3.икс, вы не сможете хорошо делать кое-что привычное.

    2) Если вы новичок под Окнами 95, привыкните к новым возможностям мыши. Щeлкните по левой почке - выделите пункт, ударьте по правой почке - меню всплывeт, быстро ударьте два раза по левой почке - запустите повестку в суд.

    3) Отработайте быстрый двойной удар по почкам мыши с помощью специального тренажeра на пульте управления Окнами 95.

    4) Специалисты Microsoft компании после большого числа опытов выявили, что наиболее эффективной командой из-под Окон 95 является "Послать на...", которая доступна в любом времени и месте при ударе по правой почке мыши. Если вы только что закрепили себе Окна 95, вы сумеете послать только на А (В) и в специальное место "Мой портфель". Но по мере того как вы будете закреплять себе новые программы для Окон 95, вы начн?те посылать на всe более сложные и интересные места и объекты.

    Особую эффективность команда "Послать на..." приобретeт при передаче посланий через Е-почту и общение с вашими коллегами и друзьями в местной сети-работе. Попробуйте мощь команды "Послать на...", и вы быстро убедитесь, что без не? трудно существовать под Окнами 95.

    Пишите нам и помните, что Microsoft компания всегда думает о том, как вас лучше сделать.
    ———————

    Влад.

    P.S. Хотя некоторые обороты - наверняка подделки.
     
  7. Amati
    Оффлайн

    Amati Команда форума Команда форума

    Репутация:
    0
    Боже мой! Как я хохотал!!! Каким-то образом раньше этот текст мне не встретился... Влад, спасибо за полчаса дикого, здорового смеха! :D
     
  8. immortal223
    Оффлайн

    immortal223 Вячеслав

    Репутация:
    0
    — от Pragma это по-моему вообще шедевр! :)

    А это похоже на чей-то стёб, уж больно красиво вписывается!!!
     
  9. NS
    Оффлайн

    NS Нефёдов Сергей баннер

    Репутация:
    3
    Неа, скорей всего не стеб. Я в своё время перевел Документацию к Descent - это было намного круче :)
     
  10. Муркенштейн
    Оффлайн

    Муркенштейн Гастролёр

    Репутация:
    2
    Тут же вспомнилась пара примеров машинного перевода с русского на украинский:

    Источник питания - Джерело харчування
    Бесконечное множество - Нескiнченна безлiч

    Помню, как однажды в университете препод вычитывал такие "пёрлы" из рефератов студентов - вся группа смеялась.
     
  11. Zayats
    Оффлайн

    Zayats Без определенного статуса

    Репутация:
    156
    Прошла спонтанная проверка переводчика google. Изначальной целью эксперимента было исследование адекватности перевода деепричастного оборота – делалось восстановление фразы "Бразды пушистые взрывая, летит кибитка удалая" по схеме русский —> иностранный язык —> русский. Хотя лексика немного устарела, синтаксис предельно прост: подлежащее, сказуемое, дополнительное действие с актантом.

    Итак, начинаются странности. Глагол летит сочтен не несущим самостоятельного смысла. Деепричастие с прямым дополнением превратилось в возвратный глагол, который не может быть переходным. Заметим, что глагол сидит из второй фразы также стал возвратным. Попробуем язык другой группы.

    Пропало не только основное действие, но и дополнительное. Утешает, что вместо машины (или колесницы во французском варианте) в полет отправилась повозка. Сидящий на перекладине помощник не должен пугать, у греков совсем загадочное "тренер сидит на радиусе". Любопытно, что почти во всех переводах фигурируют пушистые поводья, только индусы отвергли эту семантическую несуразность и предложили пьяные поводья. Еще проверка хинди порадовала тулупом, который превратился в пергаментный халат.

    Здесь действие по какой-то причине отнесено в прошлое, снова появилась возвратная форма глагола. Умиляет рекомендация из последней строки.
     
    Последнее редактирование: 7 сен 2020
    Kalvados, Иа и Комсюк нравится это.
  12. Jadn
    Оффлайн

    Jadn баннер

    Репутация:
    52
    Насколько я знаю, Гугл все переводит через английский. Т.е. в реальности это русский=>английский=>немецкий=>английский=>русский.

    С английским в целом неплохо уже получается. Виден прогресс за последние годы, вероятно связанный с нейросетями.

    Гугл:
    Взрываются пушистые поводья, Летит наглый обоз. Кучер сидит на балке. В дубленке, в красном кушаке.
    Яндекс:
    Вожжи пушистые развеваются, летят повозки дерзкие. Водитель сидит на скамейке. В тулупе, в красном кушаке.

    То, что бразды это борозды, а не вожжи, без представления всей ситуации понять невозможно.
     
  13. Zayats
    Оффлайн

    Zayats Без определенного статуса

    Репутация:
    156
    Однако как тогда эсперанто возвращает деепричастие (Взрывая пушистые поводья, смелая повозка летит), его же английский должен был по дороге "убить"?

    P.S. Вот еще информация для тех, кто предпочитает пользоваться онлайн-переводчиками в деловой или частной переписках.
    Синдхи: Летят мухи, фургоны Дарвина.
    Белорусский: Руль - пушистый взрыв, летающий будда щедрый.
     
    Последнее редактирование: 7 сен 2020
    Kalvados нравится это.
  14. Asperger
    Оффлайн

    Asperger в 5-ом Диагностическом руководстве отсутствует

    Репутация:
    48
    Как считать текст с любой картинки?

     
    wentille нравится это.
  15. WinPooh
    Оффлайн

    WinPooh В.М. Команда форума

    Репутация:
    95
    Прошло ещё несколько лет. Проверяем ChatGPT 3.5.
    Через китайский язык:

    Пушистые конские поводья взметнулись взрывом, колесница быстро промчалась; кучер сидел на меховой шубе и красном поясе.
     
    Kalvados и Zayats нравится это.
  16. I0p3a
    Оффлайн

    I0p3a Учаcтник

    Репутация:
    326
    Сравнение переводчиков
    Сейчас, в эру интернета, для нас – русских людей в массе своей не владеющих иностранным, в частности английским языком, нет проблемы, когда возникает необходимость перевода забугорного текста на «великий и могучий» язык. Есть куча он- и оф-лайн переводчиков. Но, наверное, самые популярные переводчики - от Гугла (https://translate.google.ru/), Яндекса (https://translate.yandex.ru) и Промта (https://www.translate.ru). Вот и решил для себя проверить насколько точны и идентичны переводы этих монстров.
    Возможно и еще кому-нибудь будут полезны результаты этого мини исследования.:oops:

    Алгоритм проверки.
    1. Беру текст на русском.
    2. Перевожу выбранным переводчиком на английский.
    3. Переведенный текст тем же переводчиком перевожу на русский.
    4. Для сравнения исходного текста и переведенного с английского на русский использую сайт https://textcompare.ru/
    5. Получаю параметр - Расстояние Левенштейна, (или редакционное расстояние, — метрика схождения между двумя строковыми последовательностями. Чем больше расстояние, тем более различны строки. Для двух одинаковых последовательностей расстояние равно нулю.)
    Данные и результаты проверки будут приведены в таблицах и диаграммах.
    1. Исходник технического текста для теста (в смысле тЭста, а не кулинарного теста):rtfm:
    WinRAR
    Платформы: Windows, Android.
    Самый популярный архиватор, которым пользуются миллионы людей по всему миру.
    WinRAR поддерживает все форматы файлов, включая малораспространённые, и позволяет как упаковывать, так и извлекать их.
    Встроенные алгоритмы распознают тип контента и автоматически выбирают наиболее эффективное сжатие.
    Можно разделять архивы на части для удобной передачи, а также надёжно защищать их с помощью 256‑битного шифрования и электронной подписи.
    Технически WinRAR является платным ПО с 40‑дневным пробным периодом, но разработчики позволяют бесплатно использовать приложение по окончании ознакомительного срока.
    Кроме окна с предложением покупки лицензии, которое появляется при каждом запуске и закрывается в один клик, незарегистрированная версия ничем не отличается от основной.
    Скачать с официального сайта →
    1.0.jpg
    1.1.jpg
    И для наглядности
    1.2.jpg
    Вывод.:eek:
    В принципе, всем переводчикам при переводе технического текста, можно доверять, но Яндексу – больше.:)

    Это еще, как вы понимаете, не все. :popcorn:
     
  17. I0p3a
    Оффлайн

    I0p3a Учаcтник

    Репутация:
    326
    Продолжаю.
    2. Исходник стихотворного текста для теста (тЭста!)

    Белеет парус одинокой
    В тумане моря голубом!..
    Что ищет он в стране далекой?
    Что кинул он в краю родном?..

    Играют волны — ветер свищет,
    И мачта гнется и скрыпит…
    Увы! он счастия не ищет
    И не от счастия бежит!

    Под ним струя светлей лазури,
    Над ним луч солнца золотой…
    А он, мятежный, просит бури,
    Как будто в бурях есть покой!​
    2.0.jpg
    2.1.jpg

    И для наглядности
    2.2.jpg
    Вывод.:crazy:
    Да. При переводе стихотворного текста лучше пользоваться Гуглом.:heart:

    Это, ещё, пока не все. :cool:
     
  18. I0p3a
    Оффлайн

    I0p3a Учаcтник

    Репутация:
    326
    3. Исходник прозы для теста

    ПОНЕДЕЛЬНИК НАЧИНАЕТСЯ В СУББОТУ

    Мы въехали в город. Потянулись старинные крепкие заборы, мощные срубы из гигантских почерневших брёвен, с неширокими окнами, с резными наличниками, с деревянными петушками на крышах. Попалось несколько грязных кирпичных строений с железными дверями, вид которых вынес у меня из памяти полузнакомое слово «лабаз». Улица была прямая и широкая и называлась проспектом Мира. Впереди, ближе к центру, виднелись двухэтажные шлакоблочные дома с открытыми сквериками.

    – Следующий переулок направо, – сказал горбоносый.

    Я включил указатель поворота, притормозил и свернул направо. Дорога здесь заросла травой, но у какой-то калитки стоял, приткнувшись, новенький «Запорожец». Номера домов висели над воротами, и цифры были едва заметны на ржавой жести вывесок. Переулок назывался изящно: «Ул. Лукоморье». Он был неширок и зажат между тяжёлых старинных заборов, поставленных, наверное, ещё в те времена, когда здесь шастали шведские и норвежские пираты.​
    3.0.jpg
    3.1.jpg
    И для наглядности
    3.2.jpg

    Вывод.:writing:
    При переводе прозы ужасные результаты у Промта, а Гугл – молодец.O_o

    И последняя таблица
    4.0.jpg
    ВЫВОД.:beer:

    Это примитивное исследовании переводчиков показало, что с техническим текстом более качественно справляется Яндекс, а во всех остальных случаях Гугл.:hi:

    Dixi:bye:
     
  19. svoitsl
    Оффлайн

    svoitsl Учаcтник

    Репутация:
    7
    то ли я не понял, то ли первая картинка с расстояниями не та