Проза жизни и поэзия перевода
 
06.05.2003
Киви Берд

Благодаря переменам, происходящим в политической жизни США, покров государственной тайны и строгой секретности все больше окутывает наиболее передовые технологические разработки. Эта тенденция отчетливо прослеживается, к примеру, на системах анализа видеоизображений и синхронного машинного перевода, становящихся важным инструментом работы разведслужб. Но пока информация о таких разработках еще публикуется, небезынтересно оценить нынешнее состояние дел в этой области.

Калифорнийская компания Virage (www.virage.com) уже много лет специализируется на компьютерных технологиях индексирования и поиска информации в видеоматериалах. Среди клиентов фирмы — веб-вещательные корпорации и многие телекомпании (в том числе такие крупные, как CNN), поскольку разработанное Virage специализированное ПО SmartEncode позволяет быстро отыскивать в видеоархивах нужную картинку или звуковой фрагмент.

Корни Virage уходят в шпионские дела — она создавалась в 1994 году на деньги довольно скромного гранта в 100 тысяч долларов, выделенного агентством передовых оборонных исследований DARPA. Вскоре дела у компании пошли в гору: когда разведслужбы ознакомились с программой-прототипом SmartEncode, на расширение своих разработок Virage получила еще 750 тысяч долларов. Затем, правда, грянул кризис, фирма понесла убытки, однако после 11 сентября 2001 года спрос на ее продукцию сильно возрос. Сейчас Virage категорически запрещено разглашать имена своих клиентов из государственного сектора, но известно, что ПО SmartEncode используется спецслужбами в тесной связке с технологией распознавания речи, созданной компанией  BBN Technologies (www.bbn.com/speech). Это подразделение гиганта Verizon, ведущее разработки по заказам правительственных ведомств США, в частности в рамках проекта TIDES («Потоки») все того же агентства DARPA (www.darpa. mil/iao/TIDES.htm).

Американские политики и военные любят давать своим начинаниям многозначительно-зашифрованные имена, так что и здесь название проекта является аббревиатурой словосочетания Translingual Information Detection, Extraction and Summarization, то есть «Транслингвистическое выявление, извлечение и обобщение информации». Как можно понять из расшифровки, проект нацелен на то, чтобы возможностями анализа  потоков информации на иностранных языках обладали люди, этими языками не владеющие. Поскольку спецслужбы ощущают явную нехватку специалистов со знанием восточных языков, а объем информации новостных агентств на арабском, китайском, корейском, японском и других языках стремительно растет, спрос на качественные системы синхронного машинного перевода сегодня очень велик.

Программа распознавания и перевода речи BBN может работать на любом достаточно быстром ПК, генерируя на экране бегущую строку текста на исходном языке и параллельно — строку переведенного английского текста. Считается, что при идеальном звучании речи программа обеспечивает 95-процентную аккуратность в распознавании английского языка. С восточными языками дело обстоит хуже, однако и тут результаты расцениваются как «достаточно неплохие», поскольку для человека, совершенно не владеющего языком, становится понятен общий смысл сказанного. Кроме того, в сочетании с программой SmartEncode пакет позволяет быстро находить, выделять и анализировать неясные места в видеопотоке.

Не так давно компания Virage проводила публичную демонстрацию работы своего ПО в Интернете (бизнес есть бизнес, новые клиенты нужны, как и прежде). Для пущего эффекта в качестве примера были избраны теленовости знаменитого ныне телеканала Al Jazeera. Результаты синхронного машинного перевода, правда, нельзя назвать очень уж успешными — арабская речь нередко трансформировалась в английские предложения весьма туманного содержания. Директор Virage по технологиям Брэдли Хоровиц (Bradley Horowitz) оценил итоги демонстрации с долей юмора: «Это больше похоже на поэзию, нежели на прозу».


<<Тайны майя и пыль на ветру
Все материалы номера
Подарок Ильичу >>