Свежий номер №11 (436) / Искусство серверовки
 
Дата публикации: 25.03.2002

Алекс Карабуто, lx@computerra.ru

 
1
Градация серверов (по Intel) >>

Давайте немного отвлечемся от повседневной персонально-компьютерной суеты - 3D-ускорителей, новомодных оптомышей, наладонников… Задумаемся о серверах. Ведь без них уже фактически немыслима работа любого пользовательского компьютера и тем более мало-мальски организованного сообщества.

Развитие Интернета коренным образом изменило способы ведения бизнеса, обмена информацией и налаживания связей. Как следствие, существенно возросла и роль серверов на предприятиях самого разного калибра - от межнациональных корпораций до мелких фирмочек. Сегодня главным вычислительным инструментом стали распределенные сети, и серверы широко используются для реализации сложных взаимодействий - от работы с базами данных и транзакциями до обслуживания внешних запросов на доступ к Web-страницам, количество которых может достигать миллиардов в день (то есть десятков и даже сотен тысяч в секунду)!

Объем поставок серверов в Европе (по данным Dataquiest).

Все это порождает новые требования к серверной инфраструктуре: приходится не только увеличивать количество самих серверов для обслуживания растущих объемов транзакций, но и наращивать производительность каждого из них для поддержки все более сложных и ресурсоемких приложений, разрабатываемых программистами на потребу времени, например, таких как CRM (системы управления взаимоотношения с клиентами), управление знаниями и базами данных, электронное обучение и пр.

Благодаря ряду новаций Intel на рынке корпоративных серверов, за последние годы семейство ее процессоров Xeon («Зион»), впервые представленное в 1998 году, заметно изменило ситуацию на рынке 32-разрядных серверов, потеснив традиционно сильные позиции RISC-серверов (см. диаграмму), а процессор Intel Itanium, появившийся на рынке в мае 2001 года, обещает стать катализатором серьезных перемен для 64-разрядных серверов высшего класса.

В этом обзоре мы ознакомим вас с особенностями современного рынка серверов и предложениями корпорации Intel по процессорам для каждого класса серверов, в том числе остановимся на особенностях некоторых новейших серверных продуктов Intel, анонсированных на февральском Intel Developer Forum (IDF) в Сан-Франциско и мартовской выставке «CeBIT» в Ганновере. В будущем мы планируем рассмотреть серверные решения других компаний, хотя уверенная рыночная поступь серверных архитектур от Intel оставляет им все меньше шансов с каждым годом. По прогнозам, в нынешнем году продажи серверов с архитектурой Intel впервые могут превысить в денежном выражении продажи традиционно популярных RISC-серверов. А в России доля серверов на архитектуре Intel вообще подавляюща (см. таблицу в полной версии обзора на www.ferra.ru/online/system/16656).

Основные типы серверов различной производительности и применение в них процессоров Intel рассмотрены во врезке. Новые тенденции в серверных технологиях - это масштабирование, макропроцессинг, многопоточность и кластеризация на серверах, построенных на открытых отраслевых стандартах (подробности читайте на www.ferra.ru/online/system/16656). Бюджетные преимущества такого подхода слишком привлекательны, чтобы их игнорировать. Помочь Процессоры Intel Xeon MP/DP.в развитии этих направлений могут современные серверные решения от Intel - в частности, процессоры Xeon MP/DP.

Процессоры Intel Xeon MP/DP

Новейшие семейства процессоров Xeon для многопроцессорных (Xeon MP) и двухпроцессорных (Xeon DP) серверных платформ отличаются достаточно сильно, несмотря на практически одновременное появление на рынке.

Объявленный 25 февраля на IDF процессор Xeon (он же Xeon DP - процессор второго поколения для двухпроцессорных систем с архитектурой NetBurst) базируется на ядре Prestonia, производимом по технологии 0,13 мкм, имеет встроенную кэш-память L2 объемом 512 Кбайт, системную шину 400 МГц, поддержку технологии Hyper-Threading и частоту ядра 2,2, 2,0 и 1,8 ГГц. Фактически, Intel DP есть не что иное, как хорошо знакомый нам Pentium 4 на ядре Northwood, но с аппаратно активизированной поддержкой двухпроцессорности (APIC) и Hyper-Threading (многопоточности вычислений внутри одного чипа, см. врезку).

Возможно, эти два процессора даже имеют один и тот же дизайн кристалла - просто на этапе, предшествующем корпусировке, чипы для Xeon подвергаются более тщательному тестированию и отбору, а в чипы для Pentium 4 прошивается микрокод, отключающий в них функции APIC и HT. В пользу этого говорит как опознавание программами наличия APIC в Northwood (см. www.ferra.ru/online/system/15067), так и упорные слухи (в том числе, со слов некоторых руководящих сотрудников Intel), что технология Hyper-Threading уже присутствует в Northwood и может быть легко активирована в ближайшем будущем. Тем не менее, использовать Northwood в двухпроцессорных системах вряд ли удастся, поскольку Xeon (Prestonia) упаковывается в другой корпус - 603-контактный FC-mPGA2P/INT-mPGA (см. фото; напомню, что Pentium 4 корпусируется в 478-контактный FCPGA2). Новые Xeon (Prestonia) отличаются от первого поколения двухпроцессорных Xeon (Foster) тем же, чем Pentium 4 Northwood отличается от Willamette, за исключением появившейся поддержки Hyper-Threading. Несмотря на выход более прогрессивных Xeon DP (Prestonia), процессоры Xeon (Foster) с частотой до 2 ГГц и кэш-памятью L2 256 Кбайт будут производиться корпорацией как минимум до конца года.

Представленный 12 марта на «CeBIT» процессор Xeon MP на ядре Foster MP, напротив, является лишь первым поколением CPU для многопроцессорных (4-8) систем с микроархитектурой Intel NetBurst. Производимое по технологии 0,18 мкм ядро Foster MP является аналогом ядра Willamette первого поколения процессоров Pentium 4 и, соответственно, ядра Foster дуальных процессоров Xeon (напомню, что, как и в Northwood, программы определяют наличие аппаратного блока APIC в современных кристаллах Willamette, см. предыдущий линк). Однако Foster MP отличается от Foster гораздо больше, чем Foster от Willamette, поскольку помимо кэш-памяти L2 емкостью 256 Кбайт (с улучшенной по сравнению с Willamette передачей данных) содержит на том же кристалле еще и кэш-память третьего уровня (L3) емкостью 512 или 1024 Кбайт (в зависимости от модификации процессора), а также поддерживает технологию Hyper-Threading. Как и остальные Xeon, процессоры на ядре Foster MP пока предназначены для системной шины 400 МГц и пакуются в 603-контактный корпус INT-mPGA. Однако на данный момент они выпускаются только с частотами от 1,4 до 1,6 ГГц, - видимо, наличие высокоскоростного кэша L3 не только затрудняет теплоотвод, но и препятствует достижению предельной для данной технологии частоты 2 ГГц даже при идеальном теплоотводе (низкий выход годных выше 1,6 ГГц). Хотя спрос «на гигагерцы» есть и на рынке серверов.

Процессор Xeon MP содержит 108 млн. транзисторов - это примерно вдвое больше, чем для кристалла Willamette, то есть на «пририсованный» кэш L3 пришлось более 50 млн. «затворов». Кэш-память третьего уровня в мультипроцессорных чипах нужна, чтобы «развязать» ядро и системную шину (FSB). В отличие от кэш-памяти L2, которая является синхронной (то есть при ее заполнении процессор «простаивает»), кэш-память третьего уровня асинхронная, что позволяет процессору полноценно работать при ее наполнении. Для мультипроцессорных CPU наличие емкого кэша L3 важно еще и потому, что системная шина у процессоров общая (а их на ней может сидеть до восьми штук), то есть соседним «камням» не придется приостанавливать вычисления, пока один из них обращается к системной памяти.

Такая архитектура как нельзя лучше отвечает требованиям приложений для мощных серверов масштаба предприятия и серверов для электронного бизнеса. Кэш-память с отслеживанием исполнения (L1, 12 Кбайт микрокоманд) обеспечивает ускоренный доступ к декодированным микрокомандам и увеличивает пропускную способность конвейера, кэш-память данных L1 (8 Кбайт) уменьшает задержки в работе блока быстрого исполнения благодаря применению новейших технологий доступа, кэш-память L2 с улучшенной передачей данных ускоряет доступ к данным сервера за счет точной синхронизации с кэш-памятью данных L1 и блоком быстрого исполнения, а интегрированная кэш-память L3 в сочетании с быстрой системной шиной формирует высокоскоростной канал обмена данными с системной памятью. Максимальная пропускная способность подсистемы кэш-памяти этих процессоров составляет 51,2 Гбайт/с, тогда как для их предшественников Pentium III Xeon (которые будут продаваться еще достаточно долго) она составляет всего 28,8 Гбайт/с при ширине шины 32 байта против 128 байт у Foster MP. Для сравнения в таблице приведены основные характеристики процессоров Xeon и Pentium 4.

На смену Xeon MP разрабатываются процессоры на ядре Gallatin, изготавливаемом по технологии 0,13 мкм (фактически это Prestonia с интегрированной кэш-памятью L3). Они должны появиться в четвертом квартале этого года. Текущие оптовые цены на процессоры Xeon MP составляют от 3690 долларов за старшую модель (1,6 ГГц, 1 Мбайт L3) до 1177 долларов за младшую модель 1,4 ГГц с 512 Кбайт L3. Попутно отмечу, что цены на Xeon DP (Prestonia) будут гораздо ниже - почти как на аналогичные по частоте модели Northwood: 615 долларов за 2,2 ГГц, 417 и 251 долларов за младшие модели 2 и 1,8 ГГц. Чипсет Intel E7500Компания Hewlett-Packard уже объявила о выпуске шести серверов на новых чипах Xeon. Почти все они выполнены на чипсете ServerWorks GC-HE - например, модель tc6100 за $7600 на двух Xeon (Pentium 4) и tc7100 за $12560 на четырех Xeon MP высотой 8,75 дюйма с монтажом в стойках.

Чипсет Intel E7500

Одновременно с выпуском процессоров Xeon DP Intel объявила (в компанию к старичку i860 на RDRAM) новый серверный чипсет E7500 (Plumas), предназначенный для двухпроцессорных систем и двухканальной памяти DDR200 (см. www.intel.com/design/chipsets/e7500). Отрадно, что почти сразу вслед за бытовым DDR-чипсетом i845D корпорация привнесла память DDR «в массы» серверов. Однако тут не обошлось без курьезов: дело в том, что этот чипсет поддерживает только память устаревшего стандарта PC1600 и строго двухканальную (как, например, i850 для RDRAM). И, разумеется, только регистровые модули памяти. Между тем в таком подходе есть свой резон. Видимо, памятуя о скоростных успехах синхронных чипсетов i440BX/GX, Intel и этот чипсет решила сделать полностью синхронным, то есть шины процессора и памяти работают всегда на одинаковой тактовой частоте (в данном случае - 100 МГц). При этом пропускная способность шины процессора совпадает с пропускной способностью двух каналов DDR200 - 3,2 Гбайт/с. В принципе, в отсутствие мощного графического ускорителя на шине AGP 4x (зачем он в серверах) такой подход вполне оправдан, хотя прожорливые клиенты на высокопроизводительной шине PCI могут все же сместить баланс системы в сторону недостатка скорости памяти. Тем не менее, синхронность делает обмен данными между процессором и памятью наиболее быстрым из всех возможных способов. Что ж, при случае мы проверим это на практике. А в будущем, с выходом Xeon на шине 533 МГц этот чипсет может быть легко модифицирован для работы с DDR266 («разгонять» свои собственные продукты Intel умеет великолепно) - чипсет Plumas 533 запланирован на конец этого года.

Максимальный объем памяти, поддерживаемый чипсетом E7500, - 16 Гбайт (до четырех модулей DIMM на канал). Разумеется, есть ECC, а также аппаратная очистка памяти и отключение неисправных микросхем. В чипсете применена новая система связи компонентов наборов микросхем - Intel Hub Interface 2.0 c пониженной амплитудой напряжения сигналов 0,7 В. Она позволяет достичь скорости обмена свыше 1 Гбайт/с (точнее - 1,066) в любом парном соединении «северного» хаба MCH с каждым из трех «периферийных» устройств. Чипы-компаньоны P64H2 (до трех штук) обеспечивают чипсету поддержку широкой профессиональной шины PCI/PCI-X с функцией «горячей замены» PCI-устройств (!) для лучшего обслуживания, надежную сегментацию I/O и улучшенный доступ к скоростным сетям. Чип P64H2 выводит технологию PCI/PCI-X на новый уровень скорости и универсальности, обеспечивая два контроллера «горячего подключения» и два независимых 64 бит/133 МГц сегмента PCI-X, то есть всего до шести независимых шин PCI-X в системе (плюс один сегмент PCI 32 бит/33 МГц от хаба ICH3-S, который подключен с MCH по прежнему Hub Interface 1.5). По высокоскоростному HI 2.0 можно также подключать Network InfiniBand и будущие хабы ICH. Сегменты PCI-X независимы, каждый поддерживает до четырех слотов PCI: один 64-разрядный слот может работать на частоте 133 МГц, а четыре слота - на 66 МГц. Быстрые карты расширения (например, гигабитный Ethernet, Ultra320 SCSI и пр.) лучше подключать на разные мосты PCI-X для более полной реализации скоростного потенциала системы.

Разумеется, E7500 обучен поддержке технологии Hyper-Threading, чтобы оптимально управлять прерываниями при установке двух CPU. В чипсете есть специальная шина управления системой. Оптовые цены на E7500 пока установлены в размере 92 и 132 доллара за минимальную и максимальную конфигурацию соответственно. На чипсете E7500 Intel выпустила уже две серверные системные платы - SE7500CW2 и SE7500WV2.

Не следует думать, что все эти «высокие материи» очень далеки от простого компьютерного обывателя. Сейчас Intel обкатывает новые технологии процессоров и чипсетов в серверах, а завтра они придут в каждый дом (вспомните про Интернет-холодильники).

У Intel нет своих чипсетов для многопроцессорных систем - она отдала этот рынок на откуп сторонним производителям, в частности своим многолетним партнерам. Наиболее популярным здесь является чипсет ServerWorks GC-HE для процессоров Xeon MP c поддержкой DDR200, обладающий очень похожими на E7500 характеристиками. Есть свой чипсет для этого и у IBM (Summit) с поддержкой до шестнадцати процессоров.

Масштабируемость процессоров Xeon.

Масштабируемость систем на базе процессора Xeon MP наглядно демонстрирует диаграмма. При удвоении числа процессоров (с одного до двух или с двух до четырех) производительность сервера на специализированном ПО возрастает примерно на 70%. Все это обеспечивает новейшим серверным продуктам Intel хорошие перспективы на рынке серверов самых разных классов.

В планах корпорации - переход в конце года на ядро Gallatin с частотой от 2 ГГц и кэшем L3 емкостью 1 и 2 Мбайт. В стане IA-64 летом этого года произойдет полный переход на McKinley, а в 2003 году - и на ядро Madison с кэшем L3 в 3 и 6 Мбайт. Двухпроцессорный рынок средних по мощности серверов очень скоро и надолго полностью захватит Prestonia, постепенно пересев на шину 533 МГц и чипсет Plumas 533, а летом 2003 года нас ждут новинки. В классе компактных экономичных серверов процессоры Pentium III на ядре Tualatin с частотами до 1,4 и 1,53 ГГц еще долго будут вне конкуренции.


 
1
Градация серверов (по Intel) >>


Алекс Карабуто
lx@computerra.ru
 


<< Личный связной
Все материалы номера
Абвгдейка >>