Обзор методов оптимизации кода для процессоров с поддержкой параллелизма на уровне команд
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Процессоры, способные одновременно и независимо выполнять несколько команд, обладают исключительно высоким потенциалом производительности и находят все более широкое применение. О процессорах такого типа говорят, что они поддерживают параллелизм на уровне команд (Instruction Level Parallelism, ILP). Далее для краткости они будут называться ILP-процессорами. Класс ILP-процессоров включает суперскалярные процессоры и процессоры с очень длинным командным словом (Very Large Instruction Word, VLIW), к числу которых относятся, в частности, многие модели цифровых процессоров обработки сигналов (ЦПОС).
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Другие работы
Формирование потребительских предпочтений
Slolka
: 28 октября 2013
Введение
Характеристики покупателя
Факторы культурного уровня
Социальный фактор
Факторы личного порядка
Психологические факторы
Процесс принятия решения о покупке
Осознание проблемы
Оценка вариантов
Решение о покупке
Реакция на покупку
Лояльность потребителей как цель любого предприятия
Понятие лояльности
Лояльность и удовлетворенность потребителей
Как слушать потребителей?
Использование полученной от потребителей информации
Почитание брэнда
Основные понятия брэндинга
Процесс создания брэнда
Сег
10 руб.
Тепломассообмен ТГАСУ 2017 Задача 3 Вариант 11
Z24
: 3 февраля 2026
Определение времени нагревания вала до заданной температуры
Длинный стальной вал диаметром d = 2r0, который имел температуру t0, °C, был помещен в печь с температурой tж, ºС. Определить время τ, необходимое для нагрева вала, если нагрев считается законченным, когда температура на оси вала станет равной tr=0, ºC. Определить также температуру на поверхности вала tr=ro в конце нагрева.
Коэффициент теплопроводности и температуропроводности стали равны соответственно λ и a. Коэффициент теплоотд
200 руб.
Гидравлика и теплотехника ТОГУ Теплопередача Задача 21 Вариант 0
Z24
: 5 марта 2026
Определить температуру поверхности трубы с наружным диаметром d, если линейная плотность результирующего потока излучением от нее составляет ql, а интегральная степень черноты поверхности ε. Температура окружающего воздуха tв = 17 ºС.
150 руб.
Курсовая работа по дисциплине: Электроника вариант 06
rusyyaaaa
: 19 января 2020
Исходные данные:
Напряжение источника питания - Uпит = +15 В.
Коэффициент усиления по напряжению - Кu = 12 раз.
Входное сопротивление - Rвх = 3,3 МОм.
Сопротивление нагрузки - Rн = 0,6 кОм.
Номинальное напряжение - Uном = 3 В.
Нижняя рабочая частота (НРЧ) - fн = 20 Гц.
Верхняя рабочая частота (ВРЧ) - fв = 15 кГц.
Коэффициент частотных искажений в области НЧ - Мн =1 дБ.
Коэффициент частотных искажений в области ВЧ - Мв =1 дБ.
Тип входа - Н.
Тип выхода - С.
100 руб.