Что мы мечтаем увидеть? 08.12.2003 Леонид Левкович-Маслюк
Метафоры, гиперболы, колеса, параллели Одна из самых популярных идей визуализации — организовать данные в интуитивно понятные пространственные структуры, знакомые по повседневной жизни. Выбор структуры часто называют метафорой представления данных. Таких метафор совсем немного, и придумать новые — и практически применимые! — очень трудно. Дерево, здание, город — что еще? Читатели киберпанка (в частности, классической «мостовой трилогии» Уильяма Гибсона) многое знают о таких метафорах — вспомним гигантские массивы виртуальных городов и лед, иногда смертельный (биологически), как символ антихакерской защиты. Авторы [3] реализовали наиболее употребительные метафоры в качестве средств трехмерной навигации виртуальных миров (обычными средствами, без погружения) в своей системе CyberNet (www.eurecom.fr/~abel/cybernet ). Этот проект типичен в том смысле, что реализация его прагматической цели — помочь ориентироваться в сетевых окружениях — сразу наталкивается на очень неформальное, философское, если угодно, препятствие: как подбирать подходящие метафоры для виртуальных миров в зависимости от их содержимого и от устремлений пользователя. Это труднейшая задача, и один из разумных подходов состоит в том, чтобы снабдить пользователя средствами выбора метафоры, а дальше пусть он (она) действует по обстановке. CyberNet, точнее его «маг метафор» (metaphor wizard), позволяет представить виртуальный мир как здание, город, ландшафт или «коническое дерево» (рис. 5). Например, разработчики сочли разумным отобразить сетевой трафик в виде ландшафта на прямоугольном участке поверхности, где интенсивность потоков данных на различных серверах представлена параллельными линиями трехмерных цветных столбиков (положение, высота и шкала цвета — информативные параметры). Изобретательность для применения такой метафоры нужна, признаем, довольно скромная — но главное, что структура получается простая, наглядная и удобная. Напротив, придумать что-то новое и по-настоящему удобное для обозрения огромных деревьев файловых систем совсем не просто. Для таких иерархических структур визуальная метафора дерева сегодня вне конкуренции — хотя она и не единственно возможная. Чтобы довести наглядность визуализации больших деревьев до предела выразительности, авторам недавнего хита этого жанра — файл-менеджера Innolab 3D (см. «КТ» #511) — пришлось в буквальном смысле изобрести колесо (рис. 6).
Тем, кого интересуют подробности, особенно математические, рекомендую диссертацию Мюнцнер и приведенные там ссылки. Эта технология — один из немногочисленных пока примеров применения нетрадиционной для компьютерных наук математики в самой традиционной для этих наук задаче.
Рис. 9–11 иллюстрируют детальный анализ дружеских отношений в одном из австралийских колледжей. Были опрошены все 217 студентов, каждый назвал своих друзей и оценил силу дружественной связи. Затем был проведен так называемый анализ соответствия (correspondence analysis) — стандартная математическая процедура, группирующая опрошенных как точки в трехмерном пространстве по некоему усредненному коэффициенту близости. Общая картина показана на рис. 9. Но если покрутить картинку в пространстве, обнаруживается структура из четырех «крыльев» (рис. 10), визуально тяготеющих к обособлению от «ядра». Как выяснилось [4], во всей структуре существует девятнадцать групп с особенно тесными внутренними связями — и члены четырех из них оказались связующими, опорными звеньями каждого из четырех крыльев. На рис. 10 и 11 эти студенты обозначены золотым («религиозная группа»), серебряным («поклонники стиля грандж»), темно-синим («математики») и светло-голубым («женщины») цветами. За деталями отсылаю к первоисточникам. Вопрос же о том, хорошо или плохо, когда так дотошно изучается структура частных предпочтений и взглядов студентов, выходит далеко за рамки этого материала. Классифицировать методы визуализации — задача для той гипотетической супермонографии, о которой упоминалось в самом начале. А в короткой статье вполне допустимо объединить совершенно разнородные технологии. Что я и делаю, завершая сей краткий экскурс рассказом об одном из самых эффективных и популярных методов «очевидизации» зависимостей в многомерных пространствах. Речь идет о методе параллельных координат. Его идея крайне проста. Предположим, интересующие нас объекты — марки автомобилей, и они изображаются точками в многомерном пространстве, где координаты — вес, расход топлива, количество цилиндров, год выпуска и др. В этом случае строятся несколько вертикальных параллельных осей на равном расстоянии друг от друга, пересекающих одну и ту же горизонтальную ось координат. Для каждого объекта отмечаем на осях удельный расход топлива, количество цилиндров и т. д. Получаем набор линий, который даже без дополнительной обработки может быть очень информативен, особенно если объектов не слишком много — в этом случае можно, если повезет, увидеть кластеры линий, указывающие на связь между различными параметрами объектов. Например, на рис. 12 можно усмотреть, что самые экономичные автомобили, как правило, мало весят. Не бог весть какой неожиданный вывод. Однако есть куда более изощренные (если не сказать иезуитские) способы применения этого подхода. Эдвард Вегман (Edward Wegman, см. его заметки по методам статистической визуализации на www.galaxy.gmu.edu/stats) применил его к анализу риска, которому подвергается банк, дающий займы тем или иным категориям граждан. По такой же технологии были построены тысячи ломаных (в качестве координат использовались возраст, клиентский стаж в данном банке, род занятий, некоторые параметры семейного статуса), а кластеры выделялись при помощи раскраски каждой из ломаных в один из цветов на светофорной (интуитивно понятной банкирам) цветовой шкале: от красного до зеленого (рис. 13). Красным обозначались траектории, соответствующие клиентам, которые залезали в слишком большие долги перед банком. Наложение траекторий теперь сопровождалось наложением цветов. Из однородной массы сразу выделились кластеры красных линий — они однозначно коррелировали с возрастом: опаснее всего банку было связываться с молодыми клиентами. Однако после применения более сложных методов визуализации, уже с выходом в многомерное пространство, выяснилось, что фактор риска — не просто возраст, а некий набор комбинаций возраста, рода занятий, семейного положения и других параметров. И вот теперь банк уже мог отказывать потенциально ненадежным клиентам, не боясь быть обвиненным в дискриминации по возрасту. Заключение Итак, мы познакомились с некоторыми идеями и технологиями визуализации данных. Незатронутыми остались целые пласты — например, визуализация всевозможных контекстов, корреляций в массивах текстов и т. п.6 Очень интересные системы научной визуализации описаны, скажем, здесь (www.cg.tuwien.ac.at/research/vis/dynsys/NDimViewer) и здесь (www.research.ibm.com/dx/srcDownload/index.html), причем последний линк ведет к открытым исходникам. Вообще, мне кажется, что в материале вполне достаточно ссылок, чтобы читатель, заинтересовавшийся одной из тем, мог быстро сделать первые шаги в нужном направлении. Ответ на вопрос из заголовка теперь очевиден. На экране мы — не всегда, конечно, но чаще всего! — мечтаем увидеть готовый ответ на трудные вопросы. Это понятное, безобидное и очень сильное желание сейчас становится одним из серьезных факторов развития процесса куда более важного, чем прогресс визуализации как таковой, и даже чем ожидаемое за счет этого ускорение познания природы. Я говорю о процессе совершенствования и повсеместного проникновения в повседневную жизнь систем виртуальной реальности. Вряд ли кто-нибудь способен предсказать, какую роль сыграет ВР в формировании «дивного нового мира» — но без нее этот мир представить уже невозможно. 5 В зарубежной литературе оно обычно называется гиперболическим пространством.
|