Обзор методов оптимизации кода для процессоров с поддержкой параллелизма на уровне команд
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Процессоры, способные одновременно и независимо выполнять несколько команд, обладают исключительно высоким потенциалом производительности и находят все более широкое применение. О процессорах такого типа говорят, что они поддерживают параллелизм на уровне команд (Instruction Level Parallelism, ILP). Далее для краткости они будут называться ILP-процессорами. Класс ILP-процессоров включает суперскалярные процессоры и процессоры с очень длинным командным словом (Very Large Instruction Word, VLIW), к числу которых относятся, в частности, многие модели цифровых процессоров обработки сигналов (ЦПОС).
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Другие работы
Лабораторная №2 ОПТСС вар. 8
syberiangod
: 10 сентября 2010
Цель работы. Изучение принципа эффективного кодирования источника дискретных сообщений.
Домашнее задание:
1. Изучить принцип эффективного кодирования источника дискретных сообщений (метод Хаффмена).
2. Осуществить кодирование каждого сообщения алфавита, используя двоичный код:
• равномерный;
• код Хаффмена, в соответствии с заданным вариантом.
3. Определить значения и .
4. Рассчитать значения и
СибГУТИ
150 руб.
Вклады населения как источник ресурсной базы коммерческого банка
Lokard
: 30 ноября 2013
Содержание.
ВВЕДЕНИЕ 3
1. РЕСУРСНАЯ БАЗА КОММЕРЧЕСКИХ БАНКОВ 5
1.1 Сущность ресурсной базы коммерческих банков 5
1.2 Формирование ресурсов коммерческих банков Российской Федерации 7
2. Вклады населения как источник ресурсной базы банка 15
2.1 Привлеченные средства банка. 15
2.2. Сущность и место вкладов населения в ресурсной базе коммерческих банков. 16
2.3. Роль вкладов населения в ресурсной базе коммерческих банков РФ на современном этапе развития. 29
3. Вклады населения в ЗАО «Нижегоропромстр
5 руб.
Как сократить расходы на бизнес-образование?
alfFRED
: 23 октября 2013
В числе причин, которые могут заставить задуматься о целесообразности получения бизнес-образования, несомненно, входит стоимость восхождения на эту новую ступеньку в карьере.
Первое, с чем при проведении исследования рынка бизнес-образования мы столкнёмся, так это с тем, что основное различие в цене зависит от того, где получать MBA.
Цифра эта колеблется так же, как стоимость трёхкомнатной квартиры в Москве, только повышение происходит не в зависимости от близости к центру Москвы, а от близост
10 руб.
Усовершенствование сепарационных устройств сепаратора высокого давления пластовой смеси
neftyanik
: 30 апреля 2018
Дипломный проект на тему: «Модернизация сепарационных устройств сепаратора высокого давления пластовой смеси АГКМ» состоит из следующих разделов:
В разделе «Теоритическая часть» проведен анализ существующих конструкций сепарационного оборудования, а также оборудование, которое позволит стабилизировать поток подаваемого сырья на установку. Проанализирована существующая схема сепарации пластовой смеси Астраханского газоконденсатного месторождения, выявлены проблемные места.
В разделе «Технологичес
999 руб.