ГРАФИЛЕ
 
27.05.2003
Марат Зиннатов


 
стр. 1
стр. 2 >>

Прежде чем анализировать производительность графических ускорителей, посмотрим, каковы их наряды и что сейчас в моде.

Radeon 9800/Pro

Кодовое имя этого флагмана ATI — R350. Его основные характеристики (см. также таблицу характеристик) таковы:

- производственный процесс 0,15 мкм;
- частота ядра 380 МГц;
- частота памяти 340 МГц DDR (возможна поддержка DDR II, уже есть рабочие образцы);
- шина памяти 256 бит (при использовании DDR II — 128 бит);
- пиковая пропускная способность памяти 21,8 Гбайт/с
- четырехканальный контроллер памяти (по 64 бита на канал);
- полная аппаратная поддержка DirectX 9;
- четыре конвейера вершинных шейдеров;
- восемь пиксельных конвейеров с одним текстурным блоком на каждом;
- интерфейс AGP 8х;
- оптимизационные программно-аппаратные комплексы SmoothVision 2.1 и HyperZ III+;
- комплекс SmartShader 2.1;
- технология VideoShader.

Частоты замедленной версии (не-Pro) во время подготовки статьи не были известны точно, но, судя по всему, они составят 325 МГц для ядра и 310 МГц DDR для памяти. Обе версии нуждаются дополнительном питании, которое поводится извне через стандартный 12-вольтный коннектор (такой же, как в винчестерах).

Из особенностей архитектуры стоит отметить главным образом 256-разрядную шину DDR-памяти и четырехканальный контроллер. Варианты исполнения карт, оснащенных DDR II, вряд ли станут массовыми. Преимущества в производительности при возвращении к 128-разрядной шине мизерны, а цены на DDR II пока чересчур велики.

Radeon 9800/Pro — первый в нашем обзоре чип ATI, в котором используется многоканальный контроллер памяти (NVIDIA предложила архитектуру Crossbar Memory еще в чипе GeForce3), позволяющий распараллелить процессы обмена данными. Среди немногочисленных недостатков такого подхода упомяну повышенные требования к качеству исполнения чипов памяти, чувствительность к всевозможным помехам и небольшое снижение производительности в простейших случаях из-за «административных» затрат. Однако в условиях, создаваемых современными многопоточными приложениями, все эти минусы с лихвой окупаются значительным повышением эффективности использования ценнейшей пропускной способности памяти — например, при пересылке множества небольших пакетов данных. В одноканальной системе на операцию с каждым пакетом, допустим по 64 бита каждый, будут выделяться все 256 бит, а оставшиеся 192 бита — «простаивать». Как видите, эффективность использования пропускной способности составит лишь 25%. Понятно, что Radeon 9800 в описанном случае выделит на пакет лишь один из каналов, оставив три остальных свободными и готовыми к работе. К тому же наличие четырех каналов позволяет одновременно проводить и запись, и чтение.

Технология HyperZ III+ также направлена на разрешение этой проблемы. Ее основу составляют алгоритмы работы с Z-буфером. Функция Early Z Test позволяет уменьшить избыточную прорисовку, пресекая на раннем этапе обработку невидимых пикселов. Hierarchical Z-Buffer ускоряет работу с буфером благодаря постепенному его анализу блоками 4х4, затем — в требующих того областях 2х2 и, наконец, попиксельно. Той же цели служат алгоритмы сжатия без потерь информации о глубине и быстрой очистки буфера. Плюс (который, кстати, появился в названии лишь из-за этой добавки) улучшен Z-кэш, оптимизированный теперь и для работы со stencil-буфером.

Референс-карта Radeon 9800 Pro от ATI.Под общим названием SmoothVision 2.1 объединены алгоритмы улучшения качества изображения. Сюда относятся двух-, четырех- и шестикратное полноэкранное сглаживание (мультисэмплинг, совмещенный с суперсэмплингом, но пока что работает как чистый MSAA), а также двух-, четырех-, восьми- и шестнадцатикратная (!) анизотропная фильтрация.

Блок SmartShader 2.1 отвечает за работу вершинных и пиксельных шейдеров версии 2.0. Также к нему относится F-буфер, позволяющий снять ограничение на максимальное количество инструкций, текстур и констант в шейдерах. Сколь бы велик ни был максимум, если он является конечным числом, его когда-нибудь достигнут. Что уж говорить о спецификациях DirectX 9. Превысить указанные в них значения тех или иных параметров очень легко. Сейчас проблему решают путем дробления одного длинного шейдера на несколько коротких. Но, к сожалению, это неэффективно — приходится проходить кучу ненужных в данном случае шагов рендеринга. F-буфер позволяет использовать шейдеры неограниченной длины (теоретически). Еще одна сфера применения новинки — создание эффекта частичной прозрачности. Проблема в том, что для обработки прозрачного материала требуется хранить информацию как о цвете самого объекта, так и о цвете фона, на что буфера кадра не хватает и приходится подключать, как правило, текстурную память. Но использовать ее таким образом неэффективно. А вот R350 может сохранять промежуточные данные в F-буфере, обходя некоторые ресурсоемкие операции.

Основные характеристки графических ускорителей ATI.

Еще одна интересная технология ATI — VideoShader. Теперь появилась возможность взвалить на окрепшие плечи пиксельных шейдеров некоторые задачи по декодированию и обработке видеоизображения. Интересно это по большей части тем, что мы наблюдаем начало использования шейдерных блоков для решения не предназначенных специально для них проблем. Можно предположить, что вскоре они обретут статус полноценных процессоров и будут обрабатывать все более сложные и разнообразные задачи. Да и наметки языков программирования высокого уровня (Си-подобные), упрощающие реализацию подобного, стали появляться как грибы после дождя, — CineFX и Cg от NVIDIA, HLSL от Microsoft и RenderMonkey от ATI.

Хотя технология TRUFORM явно не получила широкой поддержки игростроителей и, похоже, доживает последние дни, даже в новейших продуктах она все еще имеется. Суть ее работы — в динамическом изменении количества полигонов, образующих объект. Понятно, что на крошечную фигурку человека на заднем плане не стоит тратить производственные мощности в том объеме, которого требует обработка оригинальной модели, так что можно сильно уменьшить количество составляющих ее (фигурку) треугольников — никто и не заметит. В производительности выиграем, не потеряв в качестве. И наоборот, при обработке лица, показанного крупным планом, можно выделить побольше полигонов, чем было изначально, — все равно лицо занимает подавляющую часть сцены, и обрабатывать кроме него нечего. Выиграем в качестве, не потеряв в производительности.


 
стр. 1
стр. 2 >>

<<КАДРЫ РЕШАЮТ ВСЕ
Все материалы номера
Графо построители >>