О пользе разговоров

Автор: Владимир Гуриев
Опубликовано в журнале "Компьютерра" №36 от 04 октября 2005 года

Честно говоря, я нахожусь в некотором затруднении, потому что тема, которая несколько месяцев назад виделась мне самой простой из всей серии про интерфейсы, неожиданно оказалась самой сложной. И, в общем-то, получилась совсем о другом.
Дело в том, что третью тему мы планировали посвятить диалоговым (conversational) или даже мультимодальным (поскольку использование новых подходов вовсе не исключает полезность старых) интерфейсам. Переход от GUI к свободному общению с компьютером представляется вполне естественным: во-первых, большинству из нас проще высказать свою мысль вслух, чем записать ее. Во-вторых, современные компьютерные интерфейсы (GUI и командная строка) задают пользователю жесткие ограничения, которых можно было бы избежать, научив компьютер понимать нас "с полуслова".

Так, к примеру, можно было бы, валяясь на диване, приказать компьютеру запустить MP3-проигрыватель с нужной песней. Или попросить найти в сетевой библиотеке интересные книжки - "выбери, мол, на мой вкус" (на основании анализа загруженных ранее книг). Или, чуть продрав глаза, уточнить у Outlook список встреч на сегодня.

Мы, конечно, понимали, что многие из этих задач решить непросто, но в последние лет пять о диалоговых интерфейсах писали так уверенно, что, казалось, будто они появятся не сегодня-завтра. Смущало лишь то, что никаких принципиальных прорывов в базовых технологиях, которые необходимы для построения такого рода интерфейсов (синтез и распознавание речи, понимание компьютером естественного языка, умение поддерживать диалог) за те пять лет не произошло. Но если все действительно так, зачем тратить силы и время на разработку интерфейсов, которые невозможно воплотить во всей полноте? Разумно ли обсуждать интерьер, если еще и фундамент не достроен?

Как выяснилось, многие из разработчиков не склонны отвлекаться на такие мелочи, как отсутствие или отставание ключевых технологий. Может, они и правы. В конце концов, в таком деле, как проектирование интерфейсов, есть масса тонких моментов, никоим образом не привязанных к конкретной реализации. В общем, проектировщикам диалоговых интерфейсов есть чем заняться. Но нас больше интересует, в каком состоянии находятся сегодня технологии, без которых построить диалоговый интерфейс не удастся.

Или - когда компьютер, наконец, научится слушать, говорить и понимать.


<<Ничего никому не скажу?
Все материалы номера
Поведение собаки >>