ПЕРЕПИСКА
Видеть
АНДРЕЙ КОЧЕТКОВ
andrey_kochetkov@mail.ru

Некоторые материалы темы "Без ограничений" ("КТ" #335 от 22 февраля 2000 года), посвященной компьютерным технологиям для инвалидов, стимулировали весьма позитивные процессы. Так, автор одной из статей темы, слепоглухонемой доктор психологических наук Александр Суворов теперь имеет выход в Интернет благодаря поддержке, которую ему оказал "Проект гармония" ("Project Harmony", iatp.projectharmony.ru) и отчасти РООИ "Содействие социальной защищенности инвалидов" (rooisszi@online.ru). Мы получили также ряд интересных писем. Сегодня я предлагаю вниманию читателей небольшую статью Андрея Кочеткова об использовании голосовых технологий для "компьютеризации" незрячих. - Л.Л.-М.


В далекие времена, когда крутой системой была DOS 5.5 и начинали свой путь Windows 3.0, а капитан Пауэр сражался с железными роботами лорда Дрэда, почему-то все решили, что голоса у этих разрушительных машин должны быть похожи на скрип жестяных динамиков, без капли человеческого. Но на фоне всеобщей боязни порабощения компьютерами нашлись люди и компании, пожелавшие вдохнуть в скрежет безжизненных аппаратов чуточку людского: если не искру сознания, то хотя бы иллюзию живого голоса. Для людей же с нарушением зрения синтезированный голос открывал компьютерный мир.

Уже в начале 90-х годов в компании IBM был разработан пакет Screen Reader, который вместе с синтезатором речи позволял довольно комфортно работать в программах с текстовым интерфейсом. Пользователь управлял читающей программой через небольшую клавиатуру, похожую на калькулятор. Screen Reader стал первым сервисным приложением, помогающим профессиональной реабилитации людей с ограничениями зрения. Вскоре в США появились незрячие программисты, операторы баз данных, сотрудники по работе с клиентами.

По сей день незрячие всего мира с большой охотой используют в своей работе сервисные DOS-программы. Но прогресс не мог стоять на месте. Появились операционные системы с графическим интерфейсом, что стало огромной проблемой для разработчиков сервисных программ экранного доступа.

Лишь через год после выхода OS/2 и Windows 3.1 компаниями Synthavoice и Henter Joice были выпущены первые пакеты экранного доступа для Windows 3.1. IBM тоже не осталась в стороне, выпустив версию Screen Reader, которая озвучивала OS/2. Эти программы давали незрячим лишь минимальный доступ к работе с различными приложениями. Но среди этих приложений были программы распознавания текста. А значит, стало возможно читать любые печатные издания без помощи глаз!

В те же годы произошло другое событие, определившее дальнейшее развитие голосовых технологий и технологий экранного доступа. Всем владельцам звуковых карт от фирмы Creative Labs известен пакет под названием Text Assist, который стал первым примером программного синтеза речи. Позднее те же Synthavoice и Henter Joice использовали программный синтез речи в своих продуктах Windows Bridge и Jaws for Windows. Появились и другие программные синтезаторы, говорящие разными голосами на нескольких языках. Flextalk, Dectalk, Microsoft Speech Engine, Eloquence, Elan Informatique speech engine - этот ряд можно продолжить.

Сегодня в мире есть несколько сотен тысяч пользователей с ограничениями зрения. Пакеты Jaws for Windows и Windows Bridge позволяют им выполнять 90% операций, не связанных непосредственно с графикой. Почти все действия мыши дублируются командами клавиатуры, при помощи комбинаций клавиш пользователь получает информацию о размере, цвете и стиле шрифтов, о формате документа. В сервис входит чтение диалоговых окон и табличных списков, не говоря уж о чтении текущей строки, слова или буквы.

Безусловно, больше всего вопросов вызывает работа без глаз в Интернете. Однако Virtual Cursor, последняя разработка компании Henter Joice, революционизировала доступ к Интернету для людей с ограничениями зрения. При помощи этой технологии html-документ виртуально преобразуется в текстовый документ в окне Internet Explorer. Пользователь перемещает курсор по строке, а сервисная программа читает текст вместе с информацией о таблицах, картинках и т. д. Произносятся и ссылки, и можно пойти на другую страничку, нажав в нужном месте клавишу Enter.

По сути дела, современные пакеты экранного доступа сделали работу с компьютером для человека без зрения почти неотличимой от работы обычного пользователя. Используя речевой синтезатор, наушники и компьютер с программой экранного доступа, незрячие служат, например, брокерами или аналитиками рынка в ряде крупнейших компаний.

Увы, вышесказанное в девяносто случаях из ста касается стран Запада. В России же развитие голосовых технологий значительно отстает от тамошнего уровня. Широко известный пакет "Говорящая мышь" не отвечает мировым стандартам. По сей день в DOS-приложениях экранного доступа используется речевой драйвер СДРВ, созданный в начале 90-х в Минске. В этом году появился еще один российский синтезатор речи - Digalo, основой которого является Speech Engine от компании "Элан Информатик". Однако эта система может устойчиво работать только на компьютерах с мощным процессором (не слабее PIII 450). К счастью, за создание "русского голоса" взялась Microsoft, и бета-версия программы уже работает.

Сейчас в России всего несколько сотен активных пользователей персональных компьютеров из числа людей с ограничениями зрения, а общее количество ПК, оборудованных для работы без визуального контроля, не превышает 500-600. Поэтому выпуск такого сложного продукта, как синтезатор речи, не может принести быструю прибыль. Вспомним, однако, опыт западных стран, где голосовые технологии стали служить не только людям с ограничениями зрения, но и обычным пользователям персональных компьютеров.

В нашем обществе мало кто осознает, что физические ограничения не являются приговором для человека. Необходимы только дополнительные технические средства и справедливое отношение к людям: ведь человек, лишенный зрения, иногда может быть гораздо более производительным, чем человек с больной печенью или сердцем.

Остается только поблагодарить журнал "Компьютерра" за обращение к этой теме. Если проблема названа, если завязался общественный диалог, это уже первый шаг к ее решению.



Об авторе: Андрей Кочетков - политолог-международник, аспирант кафедры социологии и международных отношений социологического факультета МГУ, специалист по адаптивным компьютерным технологиям для людей с физическими ограничениями, вице-президент клуба незрячих пользователей "Интеграция" (http://integr.hypermart.net).

Ваши предложения и замечания ждем по адресу: tails@computerra.ru

Предыдущий материал | Оглавление номера | Следующий материал

Предыдущая рубрика: FEрмата
Следующая рубрика: КОМПЬЮНОМИКА

Текущая рубрика: ПЕРЕПИСКА