Большая советсткая энциклопедия Машинный перевод

Машинный перевод

Машинный перевод, автоматический перевод, перевод текстов с одного языка на другой с помощью автоматических устройств. Различают два направления исследований по М. п.: 1) прикладное (промышленная реализация М. п. научно-технических текстов, автоматизация информационного дела и т. п.), 2) теоретическое (моделирование речевой деятельности людей как один из методов её исследования; разработка математических формализмов для лингвистических описаний; поиск алгоритмов переработки языковых объектов; исследование соотношения между человеческих мышлением и машинами и т. п.).

Система М. п. обычно состоит из лингвистического описания входного и выходного языков (то есть автоматических словарей и грамматик формальных всех уровней) и алгоритма (то есть инструкции по использованию этих словарей и грамматик, ориентированной только на их форму), на основе которого выполняется сам перевод. Полный процесс М. п. состоит из следующих основных этапов: 1) анализ текста на входном языке (поиск слов в словаре, морфологический и синтаксический анализ — моделируется понимание текста); 2) преобразование (переход от структуры текста на входном языке к структуре текста на выходном языке); 3) синтез текста на выходном языке (синтаксическое и морфологическое оформление текста — моделируется построение текста). В реальных системах М. п. все эти этапы могут тесно переплетаться, а некоторые из них отсутствовать.

Алгоритм М. п. обычно выполняется универсальной цифровой вычислительной машиной. Полученный в результате М. п. текст может редактироваться человеком — "постредактором", который устраняет ошибки и неоднозначности в переводе. Вот как выглядит в общих чертах пример перевода с английского языка на русский предложения He was seen at 6 o’clock по указанным этапам. На этапе анализа устанавливается, что he — подлежащее, was seen — сказуемое (глагол see в Past Indefinite изъявительного наклонения пассивного залога), а at 6 o’clock — обстоятельство времени. На этапе преобразования английским словам и словосочетаниям ставятся в соответствие русские переводы: he — "он", see — "видеть", 6 o’clock — "шесть часов"; поскольку глагол "видеть" не употребляется в страдательном залоге, английская пассивная конструкция преобразуется в русскую неопределенно-личную конструкцию: "он" становится прямым дополнением ("его") к сказуемому — глаголу "видеть" несовершенного вида изъявительного наклонения действительного залога в прошедшем времени и множественном числе. На этапе синтеза вырабатываются падежные и предложные показатели синтаксических связей между словами, в частности предлог at получает перевод "в + винительный падеж" как показатель обстоятельства времени, "он" как прямое дополнение получает признак "винительный падеж" и т. п. Затем определяется порядок слов, после чего образуются нужные формы слов, так что получается "Его видели в 6 часов". Если в исходном предложении вместо he было бы местоимение it, то при переводе (без учёта предыдущих предложений) возникла бы неоднозначность: "Его видели в 6 часов" (если it — это, например, plane — "самолёт"), "Её видели в 6 часов" (если it — это, например, rocket — "ракета"), "Это видели в 6 часов" (если it — некоторое событие или явление). Человек-постредактор может выбрать из этих вариантов один — правильный.

Проблема М. п. находится на стыке теоретической и прикладной лингвистики (в том числе структурной и статистической лингвистики), математической лингвистики, теории и практики программирования и автоматического программирования для вычислительных машин, информатики. Параллельно с М. п. развивалась автоматизация лингвистических исследований. Методы М. п., разработанные для естественных языков, находят применение в задачах, связанных с искусственными языками (языки автоматического программирования, языки информационные).

Впервые идея М. п. была высказана французским изобретателем Ж. Арцруни и независимо советским изобретателем П. П. Смирновым-Троянским в 1933. С появлением в 40—50-х годах электронных вычислительных машин работы по М. п. начались в США и СССР. В 1954 в Джорджтаунском университете (Вашингтон, США) был проведён первый эксперимент по М. п. с русского языка на английский. В СССР первые опыты М. п. были проведены в 1955—56 (англо-русский и французско-русский М. п.). В дальнейшем исследования по М. п. развернулись во многих других странах. Главные входные языки — английский, русский, французский; выходные — те же, а также немецкий, японский, чешский, вьетнамский и некоторые другие. Начальный период работ над проблемами М. п. (примерно до 1961) характеризовался повышенным вниманием к техническим и программистским вопросам; ориентацией на конкретные пары языков (так называемый бинарный перевод), разработкой лишь морфологических и синтаксических правил перевода; формулировкой правил перевода сразу в виде алгоритмических предписаний; выдачей, как правило, только одного варианта перевода для каждого предложения. В дальнейшем при разработке М. п. стали существенно использоваться результаты современной структурной и математической лингвистики. Основное внимание стало обращаться на разработку и совершенствование общих схем М. п., пригодных для самых различных языков. Правила обработки текста для конкретных языков стали формулироваться большей частью не как алгоритмического предписания, а как условия, налагаемые на правильный результат обработки. Процесс М. п. реализуется алгоритмом достаточно универсального типа, который выявляет и осуществляет все возможные способы обработки текста на данном этапе, приводящие к допустимым (по указанным правилам) результатам (многовариантная обработка); на последующих этапах лишние и неправильные варианты отбрасываются (метод фильтров).

Морфологические и многие синтаксические проблемы М. п. в рамках изолированного предложения в основном решены. Главные трудности при создании полностью автоматизированных систем высококачественного перевода связаны с недостаточным уровнем разработанности семантической теории языков, с помощью которой можно было бы точно сформулировать правила обработки смысла и значений предложений языка.

На практике используются упрощённые и специализированные системы М. п., связанные с автоматизацией обработки научно-технической информации (пословный перевод с частичной грамматической обработкой и автоматическое реферирование — для целей экспресс-информации и патентной документации, а также для информационно-поисковых систем).

Имеются издания, целиком или частично посвященные М. п., например: журналы "Mechanical Translation" (Camb., с 1954), "Т. A. Informations" (P., с 1965; в 1960—64 выходил под названием "Traduction automatique"), "Communications of the Association for Computing machinery" (Phil., с 1958), "Научно-техническая информация. Серия 2" (М., с 1961), сборники "Машинный перевод и прикладная лингвистика" (М., с 1959), "Проблемы кибернетики" (М., с 1958) и другие.

Лит.: Переводная машина П. П. Троянского. Сборник материалов о переводной машине для перевода с одного языка на другие, предложенной П. П. Троянским в 1933 г., М., 1959; Машинный перевод. Сборник статей, перевод с английского, М., 1957; Панов Д. Ю., Автоматический перевод, М., 1958; Ревзин И. И., Розенцвейг В. Ю., Основы общего и машинного перевода, М., 1964; Мельчук И. А., Равич Р. Д., Автоматический перевод. 1949—1963. Критико-библиографический справочник, М., 1967; Автоматический перевод. Сборник статей, перевод с английского, итальянского, немецкого, французского, М., 1971.

И. А. Мельчук, С. Я. Фитиалов

Следующие

Машинный язык, язык программирования, содержание и правила которого реализованы аппаратными средствами ЦВМ. М. я. состоит из сис… читать дальше

Машиноведение, объединяет комплекс научных исследований по наиболее общим вопросам, связанным с машиностроением независимо от от… читать дальше

"Машиноведение", научно-технический журнал, орган Отделения механики и процессов управления АН СССР. Издаётся в Москве… читать дальше

Большая советсткая энциклопедия Машинный перевод

более 90 тысяч статей

Машинный перевод

Следующие