Организация вычислительных систем

       

Классы параллельных систем


I. Векторно-конвейерные компьютеры (PVP). Имеют MIMD-архитектуру (множество инструкций над множеством данных).

Основные особенности:

  • конвейерные функциональные устройства;
  • набор векторных инструкций в системе команд;
  • зацепление команд (используется как средство ускорения вычислений).

Характерным представителем данного направления является семейство векторно-конвейерных компьютеров CRAY.

Рассмотрим, например, суперкомпьютер CRAY Y-MP C90, имеющий следующие характеристики:

  1. Максимальная конфигурация - 16 процессоров, время такта - 4,1 нс, что соответствует тактовой частоте почти 250 МГц.
  2. Разделяемые ресурсы процессора:
    • Оперативная память (ОП) разделяется всеми процессорами и секцией ввода/вывода, разделена на множество банков, которые могут работать одновременно.
    • Секция ввода/вывода. Компьютер поддерживает три типа каналов с разной скоростью передачи:

      Low-Speed Channels - 6 Мбайт/с

      High-Speed Channels - 200 Мбайт/с

      Very High-Speed Channels - 1800 Мбайт/с

    • Секция межпроцессорного взаимодействия содержит регистры и семафоры, предназначенные для передачи данных и управляющей информации.
  3. Вычислительная секция процессора состоит из:
    • регистров (адресных, скалярных, векторных);
    • функциональных устройств;
    • сети коммуникаций.
  4. Секция управления.

    Команды выбираются из ОП блоками и заносятся в буфера команд.

  5. Параллельное выполнение программ.

    Все основные операции, выполняемые процессором - обращение в память, обработка команд и выполнение инструкций - являются конвейерными.

II. Массивно-параллельные компьютеры с распределенной памятью. Объединяется несколько серийных микропроцессоров, каждый со своей локальной памятью, посредством некоторой коммуникационной среды.

Достоинств у такой архитектуры много: если нужна высокая производительность, то можно добавить еще процессоров; если ограничены финансы или заранее известна требуемая вычислительная мощность, то легко подобрать оптимальную конфигурацию и т.д.

Каждый процессор имеет доступ лишь к своей локальной памяти, а если программе нужно узнать значение переменной, расположенной в памяти другого процессора, то задействуется механизм передачи сообщений.
Блоки целочисленных операций в обеих группах идентичны не полностью. Одна из них содержит блок умножения, а вторая - специальную логику для обработки движущихся изображений (MPEG). Для этого набор команд Alpha был дополнен пятью новыми командами. Самая интересная из них - PERR - служит для оценки движения, т.е. выполнения задачи, возникающей как при сжатии, так и декомпрессии MPEG. Команда PERR выполняет работу девяти обычных инструкций. Таким образом, процессор 21264 может декодировать видеопоследовательности MPEG-2, а также DVD-аудиоданные AC-3 в режиме реального времени без использования дополнительных периферийных устройств.

В процессоре 21264, в отличие от его предшественников практически полностью реорганизована иерархия кэш-памяти. Он снабжен одним 64-Кбайт кэшем первого уровня (L1) для инструкций и еще одним 64-Кбайт кэшем первого уровня для данных; оба являются двукратно-ассоциативными. Кэш-память второго уровня (L2) была вынесена за пределы чипа - к ней можно обращаться через 128-бит backside-шину.

Сравнительные характеристики Alpha 21164 и 21264 приведены в табл. 10.1.

Таблица 10.1. Сравнительные характеристики Alpha 21164 и 21264ЦПAlpha 21164Alpha 21264
Тактовая частота, МГц600600
Кэш L1Емкость:8(I)+8(D)Емкость: 64(I)+64(D)
Блокируется при числе непопаданий, равном28
Число ФИУ46
Емкость файла32 (I)80 (I), 2 копии
Регистров32 (FP)72 (FP)
Переименование регистровнетда
Внеочередное выполнение команднетда
Динамическое предсказание переходовдаусовершенствованное
Шина верхнего кэшасистемнаявыделенная
Поддержка мультимедианетда
Число транзисторов9,3 млн15,2 млн
Площадь, мм2298302

Содержание раздела