Обзор методов оптимизации кода для процессоров с поддержкой параллелизма на уровне команд
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Процессоры, способные одновременно и независимо выполнять несколько команд, обладают исключительно высоким потенциалом производительности и находят все более широкое применение. О процессорах такого типа говорят, что они поддерживают параллелизм на уровне команд (Instruction Level Parallelism, ILP). Далее для краткости они будут называться ILP-процессорами. Класс ILP-процессоров включает суперскалярные процессоры и процессоры с очень длинным командным словом (Very Large Instruction Word, VLIW), к числу которых относятся, в частности, многие модели цифровых процессоров обработки сигналов (ЦПОС).
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Другие работы
Маркетинг. Задания и тесты.
studypro2
: 29 июня 2017
Задания.
9.Выполните оценку запросов целевых покупателей в целевом сегменте сбыта базовой организации и уточните, что именно привлекает потребителей в условиях кризисной ситуации: низкие цены, высокое качество продуктов, их широкий ассортимент, уровень обслуживания (затраты времени на обслуживание, приобретение покупки; Удобный график работы; возможность получить консультацию у продавца; Удобное расположения магазина, сервисной организации и т.п.)
10.В современных условиях кризисной ситуации оче
150 руб.
Контрольная работа По дисциплине: Антенны и распространение радиоволн
WILDPOWER
: 28 апреля 2022
День рождения 27.04
Задача 1
Определить отношение плотности тока смещения к плотности тока проводимости для морской воды с параметрами ԑ = 80, μ =1, σ = 8 См/м и сухой почвы с параметрами ԑ = 8, μ = 1, σ = 2•10-3 См/м на частотах f1 = (М + 1)•104, f2 = (М + 1)•106, f3 = (М + 1)•108 Гц. Провести сравнение этих отношений для заданных сред. Определить комплексную диэлектрическую проницаемость обеих сред для указанных частот.
Задача 2
Определить критическую длину волны слоя ионосферы с электронной к
200 руб.
Лабораторная работа № 3 по дисциплине: Использование ЭВМ в исследовании элементов оборудования систем передачи
JuliaRass
: 26 января 2013
Задание 1.
Собрать схему:
Исследовать зависимость напряжения на резисторе от частоты сигнала.
Результаты записать в таблицу:
Частота f (КГц) 0.1 1 10 100 1000
U (B)
В соответствии с таблицей построить график амплитудно-частотной характеристики.
Примечание: индикатор напряжения должен быть установлен в режим измерения переменного напряжения. Для этого по нему необходимо щелкнуть правой кнопкой мышки, в меню выбрать Component Properties и задать там режим Mode AC.
Задание 2.
С
100 руб.
Валковая дробилка
194595
: 9 января 2011
Введение 3
1. Технические характеристики 4
2. Описание и обоснование выбранной конструкции 5
3. Расчёты 6
3.1 Определение начальных параметров 6
3.2 Определение угла захвата α 6
3.3 Определение мощности привода 7
3.4 Расчет производительности 7
3.5 Определение частоты вращения 8
3.6 Определение дробящего усилия 8
3.7 Расчет на прочность пре