Свежий номер №9 (386) / GeForce-мажор
 
Дата публикации: 06.03.2001

Артем Морозов, smtg@mail.ru

 
Страница 1
Страница 2

Страница 2
 >>

Вторую осень подряд на ведущих производителей видеоакселераторов обрушиваются технические проблемы. Вспомним 1999 год: из всех ведущих производителей видеочипов только Nvidia и S3 смогли представить той осенью новые продукты. Впрочем, объявив Savage2000 раньше конкурентов, S3 сильно задержала его выпуск и поначалу комплектовала традиционно сырыми драйверами. Производительность подкачала, и чип остался в памяти мало популярным последним продуктом S3. Во всяком случае, той S3, к которой мы привыкли.

Нельзя сказать, что для Nvidia осень 99-го прошла без проблем. NV10 стал своего рода легендой ушедшего тысячелетия, открыв серию Nvidia GeForce. Поначалу планировалось, что чип будет производиться по 0,18-мкм технологии, что позволило бы разместить на нем 23 млн. транзисторов и довести тактовую частоту до 200 МГц. Четыре конвейера рендеринга при таком раскладе смогли бы обеспечить производительность в 800 мегапикселов в секунду. Разумеется, столь мощная система требует высокой пропускной способности шины локальной памяти, и в новом продукте было решено применить новейшие технологии, а именно DDR SDRAM. Уже летом у Nvidia был готов новый чип, но технологию 0,18 мкм в течение всего оставшегося 1999 года производственники освоить не сумели. В качестве временной замены был предложен процесс 0,22 мкм. О функционировании на 200 МГц и речи не шло, хотя ожидалась частота 160 МГц. Но 23 млн. транзисторов давали о себе знать. С переходом на более «толстый» техпроцесс, площадь чипа тоже увеличилась, а с ней - и тепловыделение. Чтобы ускоритель работал стабильно, Nvidia предлагала использовать дополнительное питание для платы и отдельные системы отвода тепла от чипа, в частности, воздухоотводящий раструб. Большинство производителей к дополнительному питанию отнеслись спокойно, а вот делать с видеокартой теплоотводящий раструб не согласился никто. Тогда решили снизить напряжение ядра (чтобы отказаться от дополнительного питания) и урезать частоту до 120 МГц. Но появилась еще одна проблема: в первой половине осени производители памяти попросту не были готовы поставлять в нужных количествах DDR SDRAM. Так что, с учетом сильно пониженной частоты чипа, было решено поставлять первые версии карт с обычной SDRAM (ближе к концу года появились карты с DDR-памятью). Таким образом, после череды изменений спецификаций чипа и будущих карт появился на свет GeForce256, а для подстраховки Nvidia запустила в производство 0,22-мкм чипы Riva TNT2 (известные как TNT2A). Так мучительно рождался продукт Nvidia, который в гордом одиночестве совершил победное шествие по осени 99-го.

Новая серия продуктов 3dfx вселяла уверенность в том, что хотя бы у этой компании не будет технических проблем. 0,25-мкм процесс, SDR-память - эти отточенные технологии не могли дать сбоя. Но о VSA-100 уже и так много сказано, так что повторяться не будем. Следствием двух пропущенных циклов стала продажа почти всех имеющиеся материальных и нематериальных активов своему главному конкуренту - компании Nvidia. Другие же компании ограничились либо вариациями на тему MAX, Ultra, Pro, MAXX и тому подобным, либо скромным молчанием.

После чуть более оживленной весны-лета 2000 года все взгляды снова устремились на осень. А она обещала быть жаркой. Во-первых, ждали Nvidia NV20 - чип, который должен был совершить революцию в области графики для PC. Во-вторых, должен был выйти 3dfx Rampage, разрабатывавшийся аж с 1998 года (первые наброски новой технологии появились еще в 97-м). По заявлению 3dfx, этот чип должен был стать королем, каким был Voodoo 2. Дальше - ATI, представившая довольно сильный продукт в лице Radeon и заявившая о возвращении к полугодовому циклу. И, наконец, Matrox, сулившая показать нечто сверхъестественное.

Однако осень 2000-го стала еще более скучной, чем осень 99-го. Выпустить обещанный NV20 помешали технологические проблемы: чип разрабатывался для процесса 0,13 мкм, а был освоен только 0,18 мкм. Nvidia, как всегда, нашла обходные пути, представив GeForce2 Pro (обычный GeForce2 GTS с более быстрой памятью) и GeForce2 Ultra (переразогнанный GeForce2 GTS). 3dfx заявила, что Rampage будет готов только к весне 2001 года, а на осень запланировала сильно переспелый (анонсированный еще в ноябре 99-го) и неимоверно дорогой Voodoo5 6000 на базе четырех чипов VSA-100, но и он был отменен. ATI призналась, что Radeon MAXX (двухпроцессорный Radeon), готовившийся на осень, так и не увидит свет. Причина - в проблеме согласования двух чипов под управлением Windows2000. Зато уже весной 2001 года ATI обещает выпустить Radeon второго поколения (Radeon 2). От Matrox ничего, кроме морально устаревшего еще до своего появления G450, не было видно. Так все ведущие производители видеочипов дружно пропустили «осенний марафон». Зато теперь от зимы-весны первого года нового века все ждали наплыва революционных продуктов.

И начало уже положено. 27 февраля 2001 года (см. также новости этого номера) Nvidia официально объявила свой новый продукт - GeForce3, ранее известный как NV20. Он представляет собой первый образец GPU нового поколения и является первым видеочипом нового столетия.

Nvidia GeForce3

Nvidia удивляет нас не только возможностями своих видеоконтроллеров, но и их количеством. За последние шесть месяцев на рынке появились такие хиты, как GeForce2 GTS, GeForce2 MX, GeForce2 Pro и GeForce2 Ultra. Появления GeForce3 с замиранием сердца ждал весь компьютерный мир.

Чип содержит 57 млн. транзисторов и производится по 0,15 мкм технологии. Это рекордное для нашего времени количество транзисторов служит лучшим подтверждением революционности чипа. Для примера - GeForce2 GTS имел всего 25 млн. вентилей, а разница в 32 миллиона - это, грубо говоря, и есть новые технологии, введен ные в GeForce3.  Несмотря на возможность создания процессора, функционирующего на частоте 250 МГц (изначально для NV20 планировалось 300 МГц), GeForce3 будет тактироваться на 200 МГц. Достоверно известно, что ASUSTeK Computer, получив в распоряжении первую тестовую версию чипа, усердно работала над системой охлаждения новых карт - видимо, снизить частоту заставили проблемы с перегревом кристалла.

Внутренняя архитектура представляет собой четыре конвейера рендеринга с двумя модулями текстурирования (TMU) в каждом, так называемая схема 4х2 (напомним, что у GeForce2 GTS также 4x2, а у Radeon - 3x3). Очень похоже на GeForce2GTS? Да, но в GeForce3 реализована технология удаления скрытых поверхностей HSR (Hidden Surface Removal), которая мгновенно делает этот акселератор на голову выше всех существующих. Еще одно радикальное отличие - возможность объединения результатов рендеринга предыдущих тактов. То есть в пределах одного прохода, используя только один конвейер рендеринга, можно наложить на один пиксель четыре билинейные текстуры. Правда, на это уйдет два такта, но зато мы уже не обращаемся два раза к памяти. Это, во-первых, разгружает шину памяти, а во-вторых, существенно улучшает качество картинки. Качественные улучшения обязаны тому, что логика внутричипового расчета имеет некоторую избыточность, которая пропадает при работе с памятью по схеме чтение-изменение-запись. Вкупе с технологией объединения конвейеров рендеринга GeForce3 стал первым ускорителем, способным наложить четыре текстуры на треугольник (квадротекстурирование) за один проход и за один такт.

Значительно улучшен блок T&L. В первую очередь, возросла производительность: теперь акселератор способен на 3D-расчеты, эквивалентные по сложности 76 млрд. операций с плавающей точкой в секунду. Во-вторых, блок стал программируемым, и это мощный инструмент для разработчиков игровых приложений. И это очевидная «статья расходов» новых транзисторов - они обеспечивают логику и математику GPU нового поколения. Разумеется, T&L упрется в пропускную способность шины AGP, так как ее ширины просто не хватит. По заявлению Nvidia, все данные о геометрии полигонов хранятся в специальном буфере локальной видеопамяти.

Технология HSR (часть архитектуры Lightspeed Memory Architecture) подобно технологии HyperZ от ATI предназначена для снижения значения Overdraw (степень перерисовки). Известно, что видеоакселераторы, реализующие классическую модель рендеринга (все современные продукты Nvidia, 3dfx, S3 и др.) имеют определенный минус. Видеоакселератор рисует все полигоны в сцене, даже те, которые скрыты за другими полигонами. Overdraw показывает, сколько раз был перерисован пиксель до его финального представления (сколько полигонов было нарисовано на месте одного и того же пикселя конечного изображения), и в современных играх колеблется в пределах от одного до восьми. Средняя же величина Overdraw всей сцены обычно имеет значение близкое к трем. Цель технологии HSR - снизить значение Overdraw до единицы, то есть снять с видеоакселератора задачу рисования скрытых полигонов. Освободившиеся ресурсы видеоакселератора будут востребованы для рисования следующих видимых полигонов. Производительность блока HSR характеризуется величиной Depth Complexity (сложность глубины). Она показывает максимальное количество перекрытых полигонов в районе одного экранного пикселя, которое HSR блок способен «отсечь». Depth Complexity в GeForce3 равен шести. То есть в сценах, имеющих постоянное по всему экрану значение Overdraw, равное шести, чип будет работать в шесть раз быстрее за счет выделения только видимых полигонов. Ожидается, что блок HSR поднимет производительность в хорошо оптимизированных приложениях в три раза. Почему не в шесть? Это объясняется тем, что в современных приложениях на экране довольно много места занимают участки, имеющие значение Overdraw равное единице и двум. Отчасти и тем, что средняя величина Overdraw всей сцены обычно имеет значение близкое к трем. К сожалению, технология HSR не разгружает узкую шину памяти, а это, как мы помним, самая критичная часть любого современного видеоакселератора. Разгрузки не происходит потому, что HSR просто перераспределяет ресурсы видеоакселератора более эффективно, но самих ресурсов остается столько же.

Видеопамять для GeForce3, если можно так выразиться, еще не народилась. При использовании производителями 4-наносекундной DDR SDRAM (230/460 МГц) в сильно нагружаемых приложениях чип сможет показать только 60 процентов своих возможностей, остальное срежется узкой полосой пропускания памяти. А если принять во внимание, что, по заявлению Nvidia, чип будет хранить вершины обрабатываемых полигонов в локальной видеопамяти, нагрузка на шину памяти еще возрастет. С решением этой проблемы частично справляется кэш-память, и в NV20 ее объем, по неофициальным данным (хотя, с другой стороны, на что еще можно было потратить 32 млн. транзисторов?), увеличен в разы, так что по сравнению с предшественниками GeForce3 будет более сбалансирован.

Однако разгружать шину памяти только посредством кэширования - кощунство, поэтому Nvidia предложила еще одно решение. Это вторая часть (но отнюдь не по значимости) архитектуры Lightspeed Memory Architecture. Суть: в GeForce3 применен совершенно новый контроллер памяти. Точнее, это уже не один, а четыре контроллера. Чем была плоха реализация контроллера в GeForce256 и GeForce2 GTS? Представьте, что видеочип читает из памяти или записывает в память 64-битный (8-байтовый) блок, - при этом он пользуется всей шириной 256-разрядной внутренней архитектуры и 128-разрядным DDR-каналом шины локальной памяти, хотя для передачи этого блока данных хватило бы и 64-разрядного канала SDR. Получается, что в этом случае три четверти канала памяти просто не используется. Четыре независимых контроллера памяти GeForce3 имеют 64-битную разрядность, что в сумме дает 256-разрядную внутреннюю архитектуру, и обслуживают 128-разрядную шину DDR-памяти. То есть процессор параллельно работает с четырьмя независимыми блоками данных. И если в потоке данных встретится блок размером 64-бита, он будет передан по независимой 64-разрядной шине, а три соседние 64-разрядные шины не будут пустовать, они будут заняты передачей своих блоков данных. Достоинство такого подхода также в том, что часть шины данных может работать на чтение данных, а часть - на запись.

[i38639]


 
Страница 1
Страница 2

Страница 2
 >>


Артем Морозов
smtg@mail.ru
 


<< Над винчестером Western Digital Caviar WD400BB
Все материалы номера
Счастливы обладающие >>