КОМПЬЮТЕРРА / БУМАЖНАЯ КОМПЬЮТЕРРА / 2003 / №47 / Что мы мечтаем увидеть?

Что мы мечтаем увидеть?

08.12.2003
Леонид Левкович-Маслюк

стр. 1

Тема этого номера — визуализация данных. Если бы кто-нибудь захотел сегодня написать подробную книгу о визуализации, толщина такого тома была бы не ограничена ничем, кроме эрудиции и трудолюбия автора. По-настоящему фундаментальный подход потребовал бы начать с рассказа о современном понимании термина «данные», потом проанализировать, в том числе с позиций психологии и философии, что мы имеем в виду, рассуждая о том, как эти данные можно «увидеть», подробно рассказать о жестких и мягких средствах, использующихся для создания цифровых изображений и управления ими, и только тогда можно было бы с чистой совестью переходить к разбору концепций визуализации различных типов данных и способов реализации этих концепций.

Моя задача проще — изложить все это на нескольких страницах журнала. Поэтому в алгоритмические вопросы вникать почти не будем, философию и психологию постараемся игнорировать, и вообще многое оставим за кадром. Я назову лишь некоторые интересные проблемы и направления развития этой огромной отрасли (только американский IEEE каждый год проводит несколько специализированных конференций, собирающих тысячи участников — а ведь это лишь научный авангард), приведу интересные примеры визуализации, расскажу о новых аппаратных средствах. Чуть глубже в научную визуализацию вдается автор следующей статьи Михаил Бурцев, взявший примеры из близких ему областей: искусственной жизни, эволюционного компьютинга.

Итак, не будем уточнять, что такое «данные» (слайды лекции Дэвида Донохо [David Donoho] со злободневными лозунгами на эту тему см. на www.usna.edu/MathSci/Michelson_lecture.html). Главная особенность данных в том, что их невероятно много. Скромное моделирование урагана на суперкомпьютере генерирует несколько терабайт данных. Европейский адронный коллайдер способен за год обеспечить исследователей петабайтами. Жонглируя такими цифрами, обычно мотивируют важность проблем визуализации. Говоря цинично, надо же что-то делать с этим морем битов, в создание которого уже вложены огромные ресурсы. Впрочем, мотивировка здесь если и нужна, то лишь промышленности, бизнесу, но никак не науке. Независимо от сферы применения главная задача визуализации звучит весьма научно: помочь сформулировать гипотезы о структуре и динамике данных.

Маленький подвох заключается в том, что сам выбор способа визуализации уже содержит (хоть и неявно) некоторые гипотезы о том, что именно в данных мы считаем интересным, что хотим наглядно представить и вытащить в привычный нам мир предметов, которые можно повертеть в руках. Но это уже философия, которую мы решительно оставляем за скобками и переходим к технической стороне дела.

Пещерный человек, или Виртуальные устрицы

Начнем с аппаратных средств. Блиц-опрос нескольких продвинутых студентов и аспирантов МГУ показал, что еще не все у нас знают, что такое CAVE. Хуже того, поиски в Яндексе наводят на мысль, что на территории России нет ни одного CAVE. Жванецкий когда-то шутил: давайте поспорим о вкусе устриц с теми, кто их ел. Постараюсь избежать такой оплошности применительно к самой популярной сегодня в мире системе визуализации на основе виртуальной реальности (ВР). Ее название расшифровывается так: Cave Automatic Virtual Environment. Сегодня в мире примерно сто таких «пещер»¹. Созданная в 1991 году в Лаборатории электронной визуализации (EVL) Университета Иллинойса в Чикаго, конструкция (рис. 1) оказалась весьма удачной, ее используют далеко за пределами сообщества ВР — биологи, автомобилестроители, физики, архитекторы, историки [1]. Сейчас существует множество вариаций этой конструкции, реализованных в разнообразных пещероподобных сооружениях, часто называемых просто cave, с маленькой буквы. Классическая CAVE — комната 3 на 3 метра, на три стены и пол проецируется «трехмерная реальность», которую пользователь наблюдает через жидкокристаллические стереоскопические очки CrystalEyes. Очки синхронизируются с обновлением изображений на стенах и полу при помощи стереоэмиттеров с частотой 120 или 96 Гц. Сами изображения генерируются графической станцией SGI, проекторы и зеркала для стен расположены непосредственно за стенами, проектор для пола подвешен к потолку.

Пользователь взаимодействует с ВР при помощи «волшебной палочки» (wand) — трехмерной мыши с тремя кнопками, реагирующей и на силу нажатия, а также шлема с сенсором, отслеживающим движения головы (шесть степеней свободы); еще один сенсор следит за положением волшебной палочки при помощи магнитной системы². Имеется и поддержка звука; звуковой сервер сделан на рабочей станции Indy и управляет миди-интерфейсом и синтезатором; динамики стоят в углах «пещеры». В совокупности это оборудование и обеспечивает вожделенное «погружение» (immersion). Дать некоторое представление о «вкусе устриц» поможет рис. 2.

Существует, оказывается, и такая общность людей, как пользователи CAVE, — по необходимости очень немногочисленная; даже организованных любителей «Спектрума» наверняка побольше наберется. Похоже, Пол Райлих (www.brighton.ncsa.uiuc.edu/~prajlich ) — один из неформальных лидеров этого сообщества; по крайней мере, он реализовал (в свободное от научной визуализации время) поистине суперпроект — портировал на CAVE игру Quake 2 (рис. 3).

Главный недостаток CAVE и ее аналогов, пожалуй, даже не необходимость постоянного инженерного обслуживания (такое «железо» весьма чувствительно к прикосновениям, см. инструкцию на www.evl.uic.edu/pape/CAVE/prog/CAVEGuide.html , а невозможность коллективного использования. В последние годы EVL активно работает над распределенными системами, позволяющими сочетать «погружение» с сетевым доступом к данным и результатам визуализации. Для интересующихся: ключевые слова для поиска — CAVE6D и, главное, TIDE (Tele-Immersive Data Explorer).

В отличие от устриц, ВР-пещеры сохраняют свежесть годами. Однако у совсем новых, только что выловленных экземпляров заметны следы не только технологической, но и концептуальной эволюции. Хотя речь идет о системах, предназначенных не только (и не столько) для разглядывания данных, все же стоит посвятить пару абзацев одной из них.

Система blue-c [2] (blue-c.ethz.ch) cоздана в этом году в Швейцарском федеральном институте технологий ETH³. Целью проекта было радикальное расширение возможностей телеприсутствия — достаточного, например, для виртуального консилиума врачей в процессе постановки диагноза⁴. Одной из важнейших задач становится интерактивная визуализация самого пользователя.

Пещера blue-c способна в реальном времени строить 3D-видеомодель находящегося в ней человека, помещая ее в виртуальный мир (рис. 4). Камеры, расположенные вне пещеры, создают серию видеопотоков с обычным, «плоским» изображением пользователя с разных точек обзора, а вычислительное ядро (Linux-кластер) на лету интегрирует эти потоки в трехмерную модель. Именно эта последняя задача была самой сложной при разработке системы. Усовершенствования (по сравнению с CAVE) в «железе» нацелены прежде всего на ее решение. Например, в качестве стен использованы стеклянные проекционные экраны, содержащие внутренний слой из жидких кристаллов, электрически переключаемый между прозрачным и непрозрачным состоянием. Это нужно для того, чтобы камеры, снимающие пользователя, могли видеть сквозь стены: видеосъемка производится в короткие интервалы смены кадров виртуального мира на стенах пещеры. Математические алгоритмы восстановления и отображения трехмерного аватара используют модные сейчас точечные модели (point-based models) трехмерных объектов, представляющие любой предмет в виде плотного облака разноцветных точек. Простота и скорость работы с такими моделями стали ключом к достижению «реального времени» обновления 3D-облика пользователя. «Реальность», впрочем, пока довольно скромная — 3D-модель весьма посредственного качества обновляется 5–9 раз в секунду. Для отображения с такой частотой полученного трехмерного видеопотока на удаленном компьютере требуется пропускная способность сети 2,5–12,5 Мбит/с, в зависимости от сложности динамики сцены (передаются только обновления изменившихся участков трехмерной модели).

Итак, теперь на данные принято смотреть через вот такие оригинальные приспособления. Эти технологии имеют массу коммерческих (к примеру, дистанционная демонстрация одежды) или общекультурных приложений (в разговорах на последнем «Графиконе» я узнал, что у «компьютерных консерваторов» памятников деревянной архитектуры из японского университета Аидзу [Aizu] в распоряжении всего одна «пещера», тогда как у создателей виртуального Пекина из Сингапурского института высокопроизводительных вычислений — целых четыре), принципиально недоступных для нынешней парадигмы визуализации (взгляд на нечто через окошко монитора). Пещера — это не очередное высокотехнологичное звено в цепи, идущей от графопостроителя на бумажной ленте к монитору современной графической станции, управляемой трехмерной мышью. Пещера — первый шаг в мир так называемых пост-WIMP-взаимодействий с «вычисляемой реальностью» (WIMP расшифровывается как Windows, Icon, Menu, Pointing). Если говорить о визуализации данных — последует ли за этим новое качество результатов, новый уровень понимания процессов, новые откровения? Гм-гм… произошло ли такое при переходе от «ничего» к WIMP? Так или иначе, успех в конечном счете определяется соображениями исследователя о том, на что и как надо смотреть. Отвлечемся теперь от физических средств отображения и познакомимся с некоторыми идеями представления данных.

1 Cave — пещера (англ.).
2 В новых версиях и вариациях CAVE используется до 6–8 сенсоров.
3 Eidgenцssische Technische Hochschule, Zьrich.
4 О системах с аналогичными задачами см. www.advanced.org/tele-immersion/publications.html ,
www.bs.hhi.de/SPAG/SPAG-publications.htm.

стр. 1

стр. 2

<<	Представить непредставимое

Все материалы номера

Большая игра Оуэна Кемпа