Обзор методов оптимизации кода для процессоров с поддержкой параллелизма на уровне команд
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Процессоры, способные одновременно и независимо выполнять несколько команд, обладают исключительно высоким потенциалом производительности и находят все более широкое применение. О процессорах такого типа говорят, что они поддерживают параллелизм на уровне команд (Instruction Level Parallelism, ILP). Далее для краткости они будут называться ILP-процессорами. Класс ILP-процессоров включает суперскалярные процессоры и процессоры с очень длинным командным словом (Very Large Instruction Word, VLIW), к числу которых относятся, в частности, многие модели цифровых процессоров обработки сигналов (ЦПОС).
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Другие работы
Проекционное черчение БГТУ.010114.003. Вариант 1
coolns
: 1 сентября 2024
Проекционное черчение БГТУ.010114.003. Вариант 1
Сложный ступенчатый разрез
Задача 3. Условие задания
Построить три вида детали по двум данным. Выполнить необходимые сложные ступенчатые разрезы А-А и Б-Б.
Чертеж выполнен на формате А3 + 3d модель + pdf (все на скриншотах показано и присутствует в архиве) выполнены в КОМПАС 3D.
Также открывать и просматривать, печатать чертежи и 3D-модели, выполненные в КОМПАСЕ можно просмоторщиком КОМПАС-3D Viewer.
По другим вариантам и всем вопросам пишит
150 руб.
Экономика и управление предприятием ТО автомобилей
firsov2586
: 29 ноября 2012
СОДЕРЖАНИЕ
1. ВВЕДЕНИЕ.................................................................................. 4
2. РАСЧЕТ ПРОИЗВОДСТВЕННОЙ ПРОГРАММЫ ПО РЕМОНТУ
И ОБСЛУЖИВАНИЮ ПОДВИЖНОГО СОСТАВА................................ 6
2.1. Расчет количества технических обслуживаний подвижного
состава на год................................................................................. 6
2.2. Расчет трудоемкости.................................................................... 9
3.РАСЧЕТ ЧИСЛЕННОСТИ РЕ
Гидравлика АКАДЕМИЯ ГРАЖДАНСКОЙ ЗАЩИТЫ Задача 7 Вариант 16
Z24
: 11 марта 2026
Определить предельно возможную длину магистральной линии LМ, если из второго ствола (dH2) необходимо получить струю производительностью g2.
Рукавная система состоит из магистральной линии диаметром dM и трех рабочих линий длинами l1; l2; l3 диаметрами d1; d2; d3 и стволами с диаметрами насадков dН1; dН2; dН3. Стволы подняты относительно разветвления на высоту Z1; Z2; Z3, а разветвление установлено относительно оси насоса пожарного автомобиля АНР-40(130) на высоте Zразв. Рукава системы прорез
200 руб.
Мир солей
wizardikoff
: 7 января 2012
Содержание
Содержание 2
Введение. 3
Графическое изображение формул солей 6
Названия солей. 4
Классификация солей 7
1. Кислые соли 7
2. Средние соли 7
3. Основные соли 8
4. Двойные соли 9
5. Комплексные соли …………………………………………………...10
Получение солей 10
1. Реакция нейтрализации. 10
2. Реакция кислот с основными оксидами. 11
3. Реакция оснований с кислотными оксидами . 11
4. Реакция основных и кислотных оксидов между