Intel опрескотилась
 
10.02.2004
Александр Карабуто


 
<< стр. 2
стр. 3

Несмотря на множество улучшений, в новом ядре есть и несколько вынужденных «ухудшений». Эти «ухудшения» возникли не от хорошей жизни — они фактически являются альтернативным подходом при проектировании и призваны, на самом деле, улучшить те или иные параметры процессора в расчете на долговременную перспективу и рост частоты ядра. Главным и наиболее критичным для быстродействия процессора изменением стало увеличение длины основного конвейера с 20 тактов до 31. Именно это, а не применение 90-нанометровой технологии в перспективе позволит поднять тактовую частоту ядра процессора до 5 ГГц и выше.

8

Вместе с тем, как мы прекрасно помним по переходу с 10-стадийного на 20-стадийный конвейер (от Pentium III на Pentium 4), это может существенно ухудшить быстродействие системы в некоторых задачах, где велик процент неудачных предсказаний переходов. Чтобы снова не наступать на те же грабли, корпорация предприняла ряд шагов по улучшению работы блока предсказания ветвлений и предвыборки данных. Той же цели (уменьшению потерь производительности за счет удлинения конвейера) служит и вдвое увеличенная кэш-память. Однако, как показали наши тесты, всех этих мер порой оказывается недостаточно для того, чтобы в некоторых приложениях, не оптимизированных для архитектуры Intel NetBurst, скомпенсировать «вредное» влияние длинного конвейера. С другой стороны, на оптимизированных приложениях прирост производительности при таком подходе окажется ощутимым (вспомним, с каким скрипом в первое время продвигался на рынок Pentium 4 Willamette — именно из-за недостатка оптимизированных для него приложений).

Вторым «ухудшением» стала возросшая латентность обоих кэшей (см. рис. 8). Фактически это плата за их возросший объем и задел на будущий рост частоты ядра. В некоторых «линейных» задачах это, возможно, и не повлияет на быстродействие, но в других может оказаться весьма «болезненным». (Напомним, что длинный конвейер и возросшая латентность кэш-памяти призваны преодолеть трудности с согласованием работы блоков, расположенных в разных частях кристалла и работающих с некоторыми задержками друг относительно друга.)

Cхемотехника у Prescott существенно изменилась по сравнению с предшественниками. Большинство блоков процессора разрабатывалось практически с нуля. Более того, при проектировании топологии кристалла Prescott впервые была осуществлена полностью автоматизированная трассировка и размещение элементов (в частности, с целью оптимизации задержек и более равномерного распределения тепла по кристаллу). В результате элементы блоков не обязательно расположены компактно, в пределах своих геометрических границ; блоки как бы проникают друг в друга, а между ними и элементами процессора много пустого места, которое пригодится для исправления мелких схемотехнических ошибок, дальнейшей оптимизации кристалла и пр.

В первое время процессоры Prescott будут работать на чипсетах Canterwood и Springdale, с системной шиной 800 МГц и памятью DDR400, но позднее для них выйдут чипсеты Alterwood и Grantsdale, поддерживающие память DDR II, шину PCI Express, южный мост ICH6 и, видимо, системную шину 1066 МГц. Подавляющее большинство уже выпущенных материнских плат на чипсетах Intel 875/865, а также последних чипсетах SiS, VIA и ATI будут совместимы с Prescott путем обновления BIOS (оно необходимо для правильной инициализации большей кэш-памяти), поскольку эти платы разрабатывались с учетом будущих повышенных требований по питанию (максимальный ток питания у старших Prescott — 91 ампер). Тем не менее, разгон «Прескотта» осилит далеко не каждая плата — только самые лучшие.

Процессоры на ядре Prescott изготавливаются по 90-нанометровой технологии (это первый подобный процессор, вышедший на рынок), причем сразу на

300-миллиметровых подложках. При их производстве применяется ряд новых материалов и технологий микроэлектроники, о которых мы уже не раз писали (см., например, статьи на www.terralab.ru/system/30717  и www.terralab.ru/system/30845 ). Перечень основных технологических новшеств приведен в табл. 3. Важнейшей из них является технология напряженного (strained, растянутого или сжатого) кремния: деформированная в ту или иную сторону кристаллическая решетка обеспечивает большую подвижность электронов или дырок соответственно, а значит, и более высокую частоту работы полевых транзисторов. Для борьбы с возросшими утечками транзисторов также применялись специальные меры — технологические и схемотехнические.

Хотя площадь ядра и уменьшилась, использование новых технологий и материалов при производстве Prescott несколько повысило себестоимость кристаллов. Вместе с тем себестоимость готового процессора возросла незначительно, поэтому модели Northwood и Prescott с одинаковой частотой будут стоить одинаково.

Таблица 3. Основные отличия интеловских технологий производства с нормами 130 и 90 нм.

Три процессора Pentium 4 с частотой 3,4 ГГц, вероятно, станут последними моделями для разъема Socket 478. Это связано с тем, что Pentium 4 с большей частотой, даже изготовленные по более тонкой технологии, будут потреблять гораздо больше энергии, на что не рассчитаны существующие нынче и, как правило, приспособленные для Prescott 3,4 ГГц материнские платы. Процессоры 3,6 ГГц и выше потребуют других спецификаций питания, и, чтобы избежать путаницы с системными платами, все они будут выпускаться с разъемом Socket T (он же LGA 775).

У нас в лаборатории побывал экземпляр Pentium 4 3,20E ГГц на ядре Prescott. Безусловно, новая микроархитектура требует времени для практического изучения, поэтому за те три рабочих дня, что процессор был в нашем распоряжении, мы лишь частично постигли его потенциал. Разумеется, у нас еще будет возможность детально изучить свойства Prescott (прежде всего — быстродействие в разнообразных задачах), а сейчас мы поделимся с вами первыми впечатлениями от новинки.

Описание тестовой конфигурации и подробный анализ полученных данных вы найдете в полной версии обзора на сайте www.terralab.ru , здесь же за недостатком места мы приведем лишь пару наиболее характерных результатов тестов (они представлены на диаграммах) и краткие выводы.

Прежде всего, отметим, что у Prescott немного возросла скорость работы с системной памятью по сравнению с Northwood. Кроме того, повысилась латентность и уменьшилось время выполнения сложных операций (Copy, Scale, Add, Triad). Вместе с тем, на приложениях, не оптимизированных под NetBurst, Prescott уступает своему предшественнику — порой до 15%! Более того, в отдельных задачах Prescott 3,2 ГГц даже проигрывает Northwood 3,06 ГГц на шине 533 МГц! Приложений, в которых Prescott заметно быстрее одночастотного с ним «Нортвуда», пока не так уж много (по крайней мере, в процентном отношении к общему числу программ). Чаще наблюдается ситуация, когда Prescott немного проигрывает Northwood — этим, например, «грешат» многие современные и недавнего прошлого игры, аудиокодеки, программы для математических расчетов. А вот видеокодирование и некоторые профессиональные трехмерные пакеты моделирования чаще благоволят «Прескотту», и его преимущество над Northwood в некоторых случаях доходит до 10–15 процентов.

Таким образом, изменения в микроархитектуре NetBurst требуют оптимизации приложений. Без этого новый процессор иногда работает даже медленнее, чем одинаковый с ним по частоте старый, невзирая на вдвое увеличившуюся кэш-память. На одинаковой частоте Prescott не может (в среднем) соперничать пока с Pentium 4 Extreme Edition. Однако у первого есть ресурсы по наращиванию частоты, в то время как P4EE и Northwood свои ресурсы практически исчерпали. Хотим мы этого или нет, но будущее Pentium 4 однозначно за Prescott. Хотя, вероятно, на первых порах все же выгоднее приобретать процессоры на прежнем ядре. Особенно если учесть, что «Прескотты» заметно горячее в работе, чем аналогичные Northwood и даже Extreme Edition.



 
<< стр. 2
стр. 3

<<Какими будут виртуальные сообщества через пять лет?
Все материалы номера
Ее Величество BIOS Setup >>