Свежий номер №9 (386) / GeForce-мажор
 
Дата публикации: 06.03.2001

Артем Морозов, smtg@mail.ru

 
<< Страница 1

Страница 1
Страница 2

Одно из существенных нововведений в NV20 - поддержка новых методов полноэкранного сглаживания, названная HRAA (High Resolution Antialiasing). Теперь сглаживание будет происходить не при помощи суперсэмплинга, а при помощи мультисэмплинга. Кроме того, реализован новый режим АА - Quincunx, который обещает нам качество сглаживания, близкое к четырехсэмпловому, но при падении производительности не большем, чем при двухсэмпловом сглаживании. Метод основывается на том, что для формирования конечного пикселя используется пять сэмплов, один из которых находится в центре решетки разбивки, а остальные по ее углам. Хитрость заключается в том, что каждый угловой сэмпл (кроме тех, что расположены на границе экрана) будет использоваться четыре раза (для формирования четырех конечных пикселей), при этом найден он будет всего один раз. При этом действительно среднее значение найденных пикселей на один сэмпл будет стремиться (справа) к двум. Подход интересен еще и тем, что чем более высокое разрешение используется, тем ближе к двум будет это значение. Не стоит думать, что теперь реализован бесплатный антиалиасинг - просто потери производительности при использовании не будут катастрофическими. Еще одно слагаемое качества картинки - применение более высококачественной анизотропной фильтрации, использующей 32 текстурных сэмпла.

Благодаря конвейерам, оснащенным программируемым T&L-блоком, в NV20 введена поддержка 3D-текстур и, следовательно, воксельной графики (подобную технологию мы видели в ATI Radeon). Технология 3D-текстур позволяет создавать более точные 3D-объекты, передавая специфику материалов, обрабатывать объемные среды (туман, взвесь частиц в луче света), а также создавать объекты с изменяющейся структурой - разрушающиеся стены, вмятины, трещины и тому подобное. Открывается интересная возможность поддержки сплайновых полигонов. Да, сплайновые криволинейные поверхности, это уже почти реальность. Пока трудно судить, насколько эта технология перспективна и эффективна, но при правильной реализации она открывает просто фантастические возможности. Программируемый T&L-блок (nfiniteFX Engine) открывает технологию пиксельных и вершинных шейдеров, позволяя программистам регулировать процесс рендеринга, что дает практически бесконечные возможности по созданию новых эффектов. Ведь, если разобраться, в GeForce256, как и в GeForce2, не было настоящего геометрического процессора. Ну, посудите сами, разве можно назвать процессором то, что не умеет выполнять команды? Да, конечно, в GeForce256 и GeForce2 очень помогала возможность аппаратной трансформации и освещения полигонов, но это же и ограничивало программистов, которые не были больше способны управлять процессами рендеринга и наложения текстур. Теперь появился первый настоящий GPU. Простите, но получается, что GeForce256, GeForce2 да и Radeon были не более чем промежуточными продуктами, подготавливающими почву, - а именно приложения, использующее большое количество полигонов, - для настоящих GPU.

Все вышеприведенные технологии требуют не только больших объемов памяти, но и увеличивают нагрузку на шину данных. И хотя карты будут комплектоваться 64 мегабайтами видеопамяти, ожидается активное использование алгоритмов аппаратного сжатия текстур (DXTC). Кстати, помимо стандартных методов рельефного текстурирования Nvidia использовала технологию EMBM (Environment Mapped Bump Mapping), реализованную еще в Matrox G400. Из всех методов выдавливания этот демонстрирует наибольшую реалистичность.

Итак, при заявленных 800 мегапикселов и 1,6 гигатексела в секунду реальная производительность ожидается несколько выше - благодаря введению технологий HSR, HRAA и DXTC, а также за счет усовершенствования T&L. По сравнению с GeForce2 Ultra производительность нового чипа должна быть выше в 3-7 раз (хотя некоторые синтетические тесты могут выдавать гораздо более низкие результаты). От технологий 3D-текстур и шейдеров следует ждать значительного улучшения качества изображения. Отрицательные стороны новинки - чрезвычайно узкая для такого мощного процессора шина памяти и завышенные цены на готовые карты (около 600 долларов). С учетом быстрого снижения цен уже через год карта сможет стать стандартным графическим решением. Ожидается выпуск удешевленной версии чипа (NV17). Если чип будет иметь такое же соотношение цена/производительность, как и GeForce2MX, то успех младшего брата на рынке будет обеспечен.

А что же остальные производители? Неужели они сидели сложа руки? Во всяком случае этого нельзя сказать о 3dfx.

3dfx Specter

После неудачной серии карт Voodoo4/Voodoo5 все устремили взоры на новый продукт, разрабатываемый более двух лет, что называется, с нуля, и известный ранее как Rampage («Буйный»).

Помните, легендарный чипсет Voodoo Graphics? Он тоже был разработан с нуля и произвел революцию, открыв железный век 3D-графики. Разработчики не испугались сделать два чипа вместо одного, и это дало им много преимуществ. К чему это? А к тому, что последнее творение 3dfx должно было состоять из набора чипов - Sage и Rampage. Все вместе это бы называлось Specter.

Sage содержал четыре программируемых конвейера с мощным геометрическим сопроцессором, а также встроенный RAMDAC. Как и все остальные разработки 3dfx, Sage был синхронизирован с памятью. Функциональная частота - 200 МГц, хотя в данном случае это ограничение не технологии чипа, а скорее частоты наиболее доступной на тот момент памяти. Наконец-то аппаратный T&L, и не какой-нибудь, а уже программируемый. Обработка более 75 млн. треугольников в секунду. Такая большая мощность возможна благодаря тому, что сам видеоконтроллер разбит на два чипа и это позволяет сделать более сложным каждый из них. Естественно, поддерживается технология T-buffer, но уже через технологию M-buffer, которая позволяет увеличить качество, поднять скорость, и главное, создавать эффекты с независимо большим количеством опорных сэмплов. Интересен факт применения внутреннего рендеринга с точностью выше 32 бит, что должно положительно сказаться на конечном качестве изображения. Точно известно, что чипсет поддерживает технологию удаления скрытых поверхностей (аналогично блоку HSR от Nvidia). Программируемый T&L-конвейер, помимо повышения скорости, дает известные преимущества. Аппаратная поддержка воксельной геометрии, 3D-текстур, сплайновых поверхностей. Множество фактов говорит о том, что чип способен создавать криволинейные полигоны, причем сложности высокого порядка. В чип введена Одна из первых карт на GeForce3 — 3D Prophet III от Guillemot/Hercules.поддержка уже привычной технологии сжатия текстур FXT1 (а также S3TC). Остальное - уже стандарт: 32-битные текстуры, 24-битный Z-buffer. Sage использовал 128-битную шину данных и синхронную по частоте с чипом память DDR SDRAM, что дает пропускную способность в 6,4 Гбайт/с. Учитывая, что модулей текстурирования в чипе нет, можно сказать, что чип с запасом сбалансирован по памяти.

Rampage обеспечивал стандартное текстурирование. Хотя слово «стандартное» для чипа с поддержкой криволинейных полигонов не вяжется. Rampage синхронизирован с Sage и памятью и работает на частоте 200 МГц. Кристалл должен был вместить шестнадцать (!) модулей текстурирования, то есть по четыре на каждый конвейер. Эффективность применения четырех TMU на одном конвейере спорна (например, Nvidia в GeForce три на это не пошла). Для трилинейной фильтрации необходимо два модуля. В режиме мультитекстурирования (битекстурирования) используются две текстуры. Если мы хотим накладывать две отфильтрованные текстуры на полигон за один проход в режиме мультитекстурирования, нам понадобятся четыре текстурных блока. Это на сегодняшний день минимум, ведь в DirectX 8 поддерживается мультитекстурирование с 2-8 текстурами на полигон. Естественно, что использование 16-текстурных сэмплов позволяет добиться высокого качества анизотропной фильтрации. Такой подход должен поднять качество и скорость рендеринга. Rampage также использует 128-разрядную шину данных и синхронную память DDR SDRAM, что дает пропускную способность в 6,4 Гбайт/с. Как видим, и этот чип сбалансирован по памяти.

Каждый чип имеет свою память. То есть данный видеоконтроллер имел фиксированное распределение памяти. Это, несомненно, можно отнести к плюсам. Я объясню почему. В результате использования общей шины для различных типов данных могут возникать конфликты доступа. Например, в то время как в кэш память грузятся текстуры из внешней видеопамяти, поступает запрос на порцию данных от RAMDAC видеокарты - шина будет предоставлена RAMDAC, потому что он имеет наивысший приоритет. В результате чип временно прекращает текстурирование и приостанавливает рендеринг. Specter это не грозило, так как на каждый чип фиксировано приходится по 128 разрядов шины памяти. Разделение видеоконтроллера на два функциональных чипа позволило оптимизировать систему кэширования под каждую задачу и увеличить объем кэш-памяти в каждом чипе.

Нас ждал поистине революционный продукт, имеющий со своими предшественниками общее - разве что только фирму разработчика. Увидим ли мы Specter? По всей видимости, нет! Увидит ли кто-нибудь Specter? Возможно. Во-первых, чип уже практически завершен. А Nvidia заключила контракт с Quantum3D на поставку чипов для ее будущих систем Graphite и AAlchemy. Чипы GeForce2 MX и GeForce2 Ultra уже используются в системах Graphite (как одночиповые решения). А системы AAlchemy используют только многочиповые, высокопроизводительные решения. Поскольку чипы Nvidia фактически не умеют объединяться, а в распоряжении Nvidia есть Specter, то вполне возможно, что для систем AAlchemy компания будет поставлять чипы Sage и Rampage (учитывая возможность объединения до 32 пар чипов). Но мы-то все равно этого уже не увидим…

Вместо эпилога

Ну что тут можно сказать? Характеристики продуктов первой половины 2001 года определяются требованиями Microsoft DirectX 8.0. Это и мультисэмплирование, и 3D-текстуры, и шейдеры, и высокие значения Fill rate и Triangle rate, и алгоритмы сжатия текстур. Ждем таких же сильных решений от остальных производителей. ATI обещает уже в марте показать Radeon 2, заявляя, что этот чип будет биться на одном поле с GeForce3.

Видеочипы все больше походят на процессоры. Это и полностью программируемые этапы рендеринга, и реализация нестандартных контроллеров памяти, и даже постоянное увеличение объема накристальной кэш-памяти. Даже судьба их схожа. Вспомните, процессоры AMD не могли показать всю свою мощь до массового выхода программ, использующих 3DNow!. Аналогично - до сих пор не востребованы таланты Pentium 4. Вот и новый GPU Nvidia GeForce3, имея колоссальные возможности, вынужден ждать выхода игр, оные использующих.

Год назад 3dfx пошла по пути улучшения визуального качества 3D-графики, а Nvidia основной упор сделала на скоростные показатели и функциональность своих продуктов. Если бы меня в то время спросили, какой путь предпочтительней, я бы не задумываясь выбрал первый. Однако 15 декабря 2000 года Nvidia купила 3dfx.



 
<< Страница 1

Страница 1
Страница 2


Артем Морозов
smtg@mail.ru
 


<< Над винчестером Western Digital Caviar WD400BB
Все материалы номера
Счастливы обладающие >>