Intel опрескотилась
 
10.02.2004
Александр Карабуто


 
<< стр. 1
стр. 2
стр. 3 >>

1Все новинки используют системную шину 800 МГц и технологию Hyper-Threading, кроме самого младшего — «гадкого утенка», «разжалованного» до шины 533 МГц и лишенного HT. Предположительные причины появления такой модели: а) необходимость продать процессоры Prescott ранних степпингов, не столь шустрых и экономичных, как текущие модификации; б) необходимость иметь «свой Prescott» для низкостоимостных систем на чипсетах, не поддерживающих шину 800 МГц; в) компания оставляет лазейку для продажи «отходов» производства более высокочастотных моделей. Последнее предположение имеет под собой гораздо больше оснований, нежели для Northwood. Дело в том, что в ядре Prescott заметно возросли токи утечки и тепловыделение (сто с лишним ватт у старших моделей), а это накладывает более жесткие требования на тестирование ядер для той или иной частоты/модели. Если процессоры на ядре Northwood (и предшественники) имели близкие характеристики зависимости рассеиваемой мощности от частоты работы, то для Prescott имеет место гораздо больший разброс характеристик кристаллов даже внутри одной партии и кремниевой пластины. В результате производитель вынужден выпускать каждый конкретный экземпляр кристалла для строго определенной (по частотным и тепловым характеристикам) модели процессора с весьма небольшими допусками. С этим связан и тот факт, что процессоры на ядре Prescott будут разгоняться неохотно — даже небольшое повышение частоты вызовет у них резкое повышение тока потребления и температуры, что негативно скажется на стабильности и живучести процессора. Это, кстати, подтвердил и побывавший в нашей лаборатории экземпляр. Prescott 3,20E с большим трудом удалось разогнать до 3,4 ГГц, причем работал он нестабильно, выделяя гораздо больше тепла, чем на штатной частоте. Таким образом, стандартный плавкий термоинтерфейс с обратной стороны боксовых кулеров (фото 2) я настоятельно рекомендую заменять хорошей термопастой, если вы имеете дело с процессорами Prescott.

2Некоторые характеристики кристаллов трех типов процессоров (Extreme Edition, Northwood и Prescott) приведены в табл. 2. Для сравнения мы поместили в таблицу и AMD Athlon 64 ClawHammer.

Количество транзисторов у Prescott увеличилось по сравнения с Northwood более чем вдвое, но за счет применения нового техпроцесса площадь кристалла даже немного уменьшилась. Вместе с тем оба заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку используется для «вспомогательных» нужд — магистральные буферы, мультиплексоры и пр.), то получается, что добавление 512 Кбайт кэш-памяти второго уровня потребовало около 30 миллионов транзисторов, а остальные 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. Это огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего 25 миллионов «затворов»!

Таблица 2. Сравнительные характеристики кристаллов современных высокопроизводительных процессоров для настольных ПК.

Еще весной прошлого года специалисты сайта Chip Architect провели подробный анализ расположения и состава каждого из блоков ядра Prescott (см. фото 3 и статьи на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html  и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html) . В частности, выяснилось, что многие блоки существенно избыточны и/или содержат скрытые возможности, среди которых не только очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и, вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений.

3

Что же касается официально объявленных нововведений ядра Prescott — о них мы писали почти год назад (www.terralab.ru/system/23898) ,  и с тех пор изменилось немногое (см. табл. 2 и рис. 4).

4

Во-первых, вдвое увеличена кэш-память не только второго, но и первого уровня. Причем у L1 также вдвое увеличена ассоциативность. Правда, заметно (опять-таки примерно вдвое) возросла латентность каждой из них.

Во-вторых, улучшен блок предсказания ветвлений и механизм предвыборки.

5

В-третьих, добавлено тринадцать новых инструкций (Prescott New Instructions, PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рис. 6). По аналогии с предшественницами эти инструкции назвали SSE3; они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки SSE) и полностью совместимы с программным обеспечением, написанным для процессоров Intel. По оценкам компании, перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5%. Среди уже оптимизированных для SSE3 приложений — будущая версия Unreal II, видеокодировщики MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio, Intervideo и другие, использующие кодек DivX 5.1.1.

6

В четвертых, доработана технология Hyper-Threading, с тем чтобы сделать переключение между тредами более предсказуемым: в частности, наряду с симметричными введено понятие асимметричных тредов (рис. 7). Специально для этого изменили конвейер, теперь больше исполняющих блоков «распараллелено» (рис. 3). Наконец, улучшен режим управления. Блок-схема ядра Prescott, немного проясняющая его структуру, приведена на рис. 5.

7

 



 
<< стр. 1
стр. 2
стр. 3 >>

<<Какими будут виртуальные сообщества через пять лет?
Все материалы номера
Ее Величество BIOS Setup >>