Справочник от Автор24
Найди эксперта для помощи в учебе
Найти эксперта
+2

Системы машинного перевода

Замечание 1

Системы машинного перевода — это системы, которые предназначены для перевода текстов (письменных, а иногда и в устном формате) с одних естественных языков на другие с помощью специальной компьютерной программы.

Введение

Следует заметить, что за последние десятилетия технологии машинного перевода, а также искусственного интеллекта, в целом, осуществили громаднейший шаг вперед. Уже мало кого можно удивить словосочетанием «нейронная сеть» или «самообучающаяся система». Тем не менее так было далеко не всегда, поскольку в течение долгого времени ученые предпринимали попытки создания механизма перевода с одного естественного (это обстоятельство является важным условием в определении машинного перевода) языка на другой, но эти попытки оказывались безуспешными.

Начало было положено в тридцатые годы прошлого века, когда советский ученый П. П. Смирнов-Троянский смог представить Академии наук СССР созданную им «машину для подбора и печатания слов при переводе с одного языка на другой». Машина представляла собой стол, перед которым располагался фотоаппарат, который был синхронизирован с печатной машинкой. На поверхности стола располагалось «глоссарное поле», то есть, свободно передвигающаяся пластина с нанесенными на нее словами на трех и более языках.

Оператор выполнял фотографирование карточки, соответствующей определенному слову, а на печатной машинке должен был набрать его морфологическую информацию, то есть, часть речи, число, падеж и так далее. Лента печатной машинки и пленка камеры должны были выходить одновременно. Так получалась совокупность кадров со словами и их морфологией.

А далее лингвисты должны были превратить совокупность фотографий в связный литературный текст. То есть, для того чтобы переводить тексты, и оператору, и лингвистам достаточно было владеть только своим родным языком.

«Системы машинного перевода» 👇
Помощь эксперта по теме работы
Найти эксперта
Решение задач от ИИ за 2 минуты
Решить задачу
Найди решение своей задачи среди 1 000 000 ответов
Найти

Системы машинного перевода

Системы машинного перевода подразделяются на следующие категории:

  1. Категория систем, выполненных на базе грамматических правил RBMT (Rule-Based Machine Translation).
  2. Категория статистических систем SMT (Statistical Machine Translation).
  3. Категория гибридных систем, сочетающих в себе преимущества первых двух групп.
  4. Уже существует еще один, сравнительно новый вид машинного перевода, а именно, нейронный.

Системы RBMT способны анализировать текст и выполнять его перевод на основе встроенных словарей и совокупности грамматических правил для выбранной языковой пары. ПРОМТ и Systran могут считаться наиболее известными примерами систем RBMT. Качественный уровень перевода таких систем оставляет желать лучшего, но они и по сегодняшний день все еще применяются. К примеру, во всем известных переводах названий товаров на Aliexpress.

К числу достоинств систем RBMT следует отнести морфологическую точность (слова при переводе не путаются), повторяемость (наличие всегда одинакового результата перевода) и возможность настройки системы под выбранную предметную область (возможность обучить специальным терминам).

В системах SMT используется принцип статистического анализа, что означает загрузку в систему огромных объемов текстов на исходном языке и их переводов, выполненных специалистами. Программа способна анализировать статистику межъязыковых соответствий, синтаксических конструкций и тому подобное, а далее может опираться на нее при подборе вариантов перевода. Такие процедуры по сути представляют собой самообучение.

В этом плане уже уместно отметить наличие возможности нейронного машинного перевода NMT (Neural Machine Translation), так как самообучение считается характерным, прежде всего, для перевода на основе нейронных сетей. Этот вид перевода берет свое начало еще с середины девяностых годов прошлого века, а сегодня считается главным типом машинного перевода.

Нейронная сеть является математической моделью, построенной по принципу сетей нервных клеток живых организмов. Наличие возможности обучения может считаться одним из основных достоинств нейронных сетей в сравнении с традиционными алгоритмами перевода. Нейронную систему способен обучить и человек, путем корректировок итоговых результатов перевода. Именно по такому принципу и работают онлайн-переводчики Яндекс и Google. Благодаря наличию самообучения качественный уровень перевода у них возрастает после каждого нового переведенного текста.

В середине двухтысячных годов широкую известность получило «глубинное обучение» (Deep learning). Главным его отличием от стандартных нейронных сетей является тот факт, что его сети обучаются обнаруживать набор характерных свойств объектов, не вдаваясь в мелкие подробности их происхождения. Таким образом, при данном типе перевода независимо друг от друга функционирует следующая пара механизмов:

  1. В начале одна нейронная сеть выполняет кодирование текста на базе каких-либо характеристик.
  2. Далее вторая нейронная сеть осуществляет декодирование их в текст переводного языка.

Здесь уместно вспомнить известный принцип, что следует переводить смыслы, а не слова.

За последние годы нейронные сети сумели превзойти все, что было изобретено в сфере перевода за последние двадцать лет. Они даже сумели освоить согласование родов и падежей в различных языках. Помимо этого, впервые стал возможен прямой перевод между языками, у которых не было раньше ни одного общего словаря. До этого методы статистического перевода практически всегда должны были работать через английский язык. Для нейронного перевода это уже не требуется.

В 2016-ом году Google запустил систему нейронного перевода девяти языков между собой, а в 2017-ом году в неее был добавлен и русский язык. Специалисты Google разработали собственную систему, которая получила название Google Neural Machine Translation (GNMT). Система GNMT способна улучшить качество перевода, используя метод машинного перевода на базе примеров EBMT(Example-based machine translation). Это означает, что система обучается на основе аналогии, используя базу примеров переводов, выполненных людьми.

Воспользуйся нейросетью от Автор24
Не понимаешь, как писать работу?
Попробовать ИИ
Дата написания статьи: 22.09.2022
Найди решение своей задачи среди 1 000 000 ответов
Крупнейшая русскоязычная библиотека студенческих решенных задач
Все самое важное и интересное в Telegram

Все сервисы Справочника в твоем телефоне! Просто напиши Боту, что ты ищешь и он быстро найдет нужную статью, лекцию или пособие для тебя!

Перейти в Telegram Bot