Intel опрескотилась 10.02.2004 Александр Карабуто
Количество транзисторов у Prescott увеличилось по сравнения с Northwood более чем вдвое, но за счет применения нового техпроцесса площадь кристалла даже немного уменьшилась. Вместе с тем оба заметно уступают по площади и числу транзисторов ядру Gallatin. Если учесть, что ячейка кэш-памяти требует шести транзисторов (плюс примерно один транзистор в расчете на одну ячейку используется для «вспомогательных» нужд — магистральные буферы, мультиплексоры и пр.), то получается, что добавление 512 Кбайт кэш-памяти второго уровня потребовало около 30 миллионов транзисторов, а остальные 40 миллионов ушли на другие архитектурные усовершенствования ядра Prescott. Это огромное количество, ведь ядро Northwood без кэш-памяти второго уровня содержит всего 25 миллионов «затворов»! Еще весной прошлого года специалисты сайта Chip Architect провели подробный анализ расположения и состава каждого из блоков ядра Prescott (см. фото 3 и статьи на www.chip-architect.net/news/2003_03_06_Looking_at_Intels_Prescott.html и www.chip-architect.com/news/2003_04_20_Looking_at_Intels_Prescott_part2.html) . В частности, выяснилось, что многие блоки существенно избыточны и/или содержат скрытые возможности, среди которых не только очевидные модули для поддержки технологии La Grande (официально Prescott ее пока не поддерживает) и шины для связи с кэш-памятью третьего уровня (самой памяти L3 на кристалле, естественно, нет), но и, вероятно, блоки для реализации технологии Vanderpool и 64-битных вычислений. Что же касается официально объявленных нововведений ядра Prescott — о них мы писали почти год назад (www.terralab.ru/system/23898) , и с тех пор изменилось немногое (см. табл. 2 и рис. 4). Во-первых, вдвое увеличена кэш-память не только второго, но и первого уровня. Причем у L1 также вдвое увеличена ассоциативность. Правда, заметно (опять-таки примерно вдвое) возросла латентность каждой из них. Во-вторых, улучшен блок предсказания ветвлений и механизм предвыборки. В-третьих, добавлено тринадцать новых инструкций (Prescott New Instructions, PNI), улучшающих комплексные расчеты по SSE/SSE2/x87-FP-командам и позволяющих ускорить выполнение мультимедийных и игровых приложений (рис. 6). По аналогии с предшественницами эти инструкции назвали SSE3; они не требуют специальной поддержки со стороны операционной системы (достаточно поддержки SSE) и полностью совместимы с программным обеспечением, написанным для процессоров Intel. По оценкам компании, перекомпиляция (уже вышел соответствующий компилятор от Intel) приложений под SSE3 способна поднять быстродействие в среднем на 5%. Среди уже оптимизированных для SSE3 приложений — будущая версия Unreal II, видеокодировщики MainConcept, xMPEG, Ligos, Real (RV9), On2 (VP5/VP6), Pegasys TMPGEnc 3.0, Adobe Premier, Pinnacle, Sony DVD Source Creator, Ulead (MediaStudio & Video Studio, Intervideo и другие, использующие кодек DivX 5.1.1. В четвертых, доработана технология Hyper-Threading, с тем чтобы сделать переключение между тредами более предсказуемым: в частности, наряду с симметричными введено понятие асимметричных тредов (рис. 7). Специально для этого изменили конвейер, теперь больше исполняющих блоков «распараллелено» (рис. 3). Наконец, улучшен режим управления. Блок-схема ядра Prescott, немного проясняющая его структуру, приведена на рис. 5.
|