НовостиОпубликовано в журнале "Компьютерра" №9 от 8 марта 2005 года. Страница 11 из 15. Вернуться на первую страницу. Статист-переводчикНа одной из недавних встреч членов Американской ассоциации научного прогресса (American Association for the Advancement of Science) была представлена машинная система перевода, построенная на существенно новых принципах. Если большинство нынешних программ-переводчиков используют для поиска эквивалентных слов и фраз заранее установленные правила, жестко прописанные в коде программы, то в системе, созданной Кевином Найтом и Дэниэлом Марку (Kevin Knight, Daniel Marcu) из университета Южной Калифорнии, упор сделан на самообучение и радикально возросшую вычислительную мощь современных компьютеров. Новая программа перевода сама учится все лучше и лучше понимать незнакомый язык, сканируя многие тысячи уже переведенных документов. В процессе обучения она использует статистический подход, выстраивая вероятностные правила интерпретации слов, фраз и синтаксических структур текста. Иначе говоря, на основе множества разных вариантов перевода для внешне похожих слов и фрагментов программа формирует «параметры перевода», а затем, отталкиваясь от статистических оценок, ранжирует их, присваивая соответствующие веса. Переведенные ранее документы, использующиеся для обучения, можно скармливать программе в виде текстовых файлов, бумажных распечаток или даже аудиозаписей. По свидетельству разработчиков, обученная система работает не только быстрее традиционных алгоритмов, но и лучше подходит для перевода малораспространенных языков и специальных, научных или технических текстов. Для коммерческого продвижения своего детища Найт и Марку уже основали компанию, названную по имени программы Language Weaver («языковой ткач», www.languageweaver.com). Определяя суть своей системы, разработчики именуют ее «программой статистического машинного перевода» и в настоящее время предлагают уже готовый продукт для переводов в обе стороны между английским языком и четырьмя другими — арабским, китайским, французским и испанским. — Б.К.
|