Особенности постредактирования текста при машинном переводе
За несколько десятилетий своего развития машинный перевод прошел довольно долгий путь от простых разработок до мощного инструмента, позволяющего максимально быстро переводить большие объемы текста.
Под постредактированием понимается редакторская обработка человеком текста, переведенного с помощью средств машинного перевода. Машинный перевод в значительной степени облегчает работу переводчиков. Однако, несмотря на очевидные преимущества машинного перевода, в его результате присутствует немало ошибок. Например, предложение «The facility, attached to a police station, had a capacity of about 60 detainees, workers at the scene said» после осуществления машинного перевода имеет вид «По словам сотрудников, в здании, принадлежащем полицейскому участку, содержится около 60 заключенных», хотя в идеальном варианте должен выглядеть, как «По словам сотрудников, в здании, закрепленном за полицейским участком, можно содержать около 60 заключенных». Из данного примера можно увидеть, что разница между переводами незначительная, однако в некоторых ситуациях такие незначительные ошибки приводят к непониманию текста в целом.
Машинный перевод, в том числе и современный нейронный машинный перевод, нуждается в обработке. Таким образом, постредактирование значительно отличается от обычного редактирования, поскольку предполагает исправление текста, как результата работы компьютерной программы.
Основные задачи постредактирования
Постредактирование призвано решить несколько важных задач. К ним относятся:
- максимальное использование машинного перевода;
- внесение изменений только в случаях острой необходимости;
- по возможности избежание добавлений в исходный текст и удалений из него;
- улучшение результата машинного перевода с применением минимального количества времени и минимальных усилий.
Уровень качества постредакторской работы оговаривается индивидуально между заказчиком и исполнителем, исходя из потребностей заказчика. В зависимости от сложности работы могут выделяться:
- полное постредактирование;
- частичное постредактирование;
- легкое постредактирование.
Этапы постредактирования
В работе постредактора можно выделить несколько этапов:
- Подготовка редактируемого текста. В первую очередь, необходимо проанализировать оригинал переведенного текста, а затем проанализировать результат машинного перевода. данный этап является важным, поскольку именно на данном этапе редактор может определить и выявить очевидные ошибки машинного перевода.
- Определение части хорошего качества в машинном переводе. На данном этапе постредактор выделяет части, которые не требуют исправлений, или требуют их в меньшей степени, для того, чтобы в дальнейшем опираться на данную часть текста, как основу всего перевода.
- Правильное воспроизведение смысла текста. В процессе работы на данном этапе большее внимание уделяется заключенному в тексте смыслу. Таким образом, работая над исправлениями, постредактору важно не пропускать ошибки, а также не применять большое количество исправлений. В противном случае, работа постредактора будет неэффективной.
- Финальная проверка грамматики и терминологии. На данном этапе постредактору необходимо еще раз проверить текст уже на наличие грамматических ошибок или ошибок в переводе терминов.
Эффективность работы постредактора
Для того, чтобы процесс постредактирования был более эффективным, необходима выработка определенных общих требований, нацеленных на разные уровни качества перевода. За время развития постредактирования машинного перевода аналитическим центром «TAUS» - «Translation Automation User Society» были выработаны подобные общие требования. В них был описан набор руководящих принципов постредактирования, который призван помочь не только постредакторам, но и заказчикам в установлении требований к конечному результату. В данных требованиях были четко определены два уровня качества постредактирования машинного перевода:
- Первый уровень качества – «good enough» - «приемлемое качество». Данному уровню соответствуют переводы, которые точно передают смысл оригинального текста, однако допускаются грамматические, синтаксические и стилистические ошибки. Для того, чтобы достичь приемлемого уровня качества переведенного текста, задача постредактора заключается лишь в проверке на правильность семантики перевода.
- Второй уровень качества – «publishable quality» - «публицистическое качество». В данном случае перевод должен полностью соответствовать оригиналу в смысловом, грамматическом, синтаксическом и семантическом плане. Должны быть соблюдены не только лексические нормы, но и грамматические и синтаксические. Иными словами, машинный перевод должен соответствовать переводу, выполненному человеком.
Подобные требования также закреплены в «Международном стандарте по предоставлению переводческих услуг». В данном документе также выделены два уровня качества: легкое постредактирование и полное постредактирование. На сегодняшний день совершенствование технологий машинного перевода обуславливается в большей степени сокращением времени на перевод текстов. Соответственно, постредактирование становится все больше востребованной сферой деятельности, поскольку машинный перевод на данный момент не является совершенным. Таким образом, профессия постредактора становится альтернативой профессии переводчика.
При этом, несмотря на кажущуюся легкость процесса постредактирования, эффективность его напрямую зависит от качества выполненного машинного перевода, а также утвержденных требований к качеству конечного результата.