Обзор методов оптимизации кода для процессоров с поддержкой параллелизма на уровне команд
Состав работы
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Процессоры, способные одновременно и независимо выполнять несколько команд, обладают исключительно высоким потенциалом производительности и находят все более широкое применение. О процессорах такого типа говорят, что они поддерживают параллелизм на уровне команд (Instruction Level Parallelism, ILP). Далее для краткости они будут называться ILP-процессорами. Класс ILP-процессоров включает суперскалярные процессоры и процессоры с очень длинным командным словом (Very Large Instruction Word, VLIW), к числу которых относятся, в частности, многие модели цифровых процессоров обработки сигналов (ЦПОС).
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Важное преимущество ILP по сравнению с параллелизмом многопроцессорных архитектур заключается в том, что программный параллелизм на уровне команд извлекается (аппаратурой или компилятором) автоматически, без дополнительных усилий со стороны прикладных программистов, в то время как использование параллелизма многопроцессорных архитектур подразумевает переписывание приложений.
Для реального использования высокой производительности ILP-процессоров необходимы компиляторы с языков высокого уровня, способные генерировать эффективный код. Применение одних лишь традиционных методов оптимизации кода оказывается совершенно недостаточным. Например, согласно [3] или [41], типичный компилятор для ЦПОС (поддерживающий только традиционные оптимизации) генерирует код, который по времени выполнения может уступать оптимальному в 5-10 и более раз.
В течение последних лет прилагаются значительные усилия по разработке специальных методов оптимизации программ для ILP-процессоров, направленных на выявление и расширение программного параллелизма на уровне команд. Настоящая работа содержит обзор таких методов.
В разделе 2 дается краткий обзор ILP-процессоров и их основных характеристик. Раздел 3 посвящен критериям оптимизации кода для ILP-процессоров. В разделе 4 представлена примерная схема работы компилятора, характеризуются основные задачи, связанные с оптимизацией кода для ILP-процессоров. В разделе 5 дается обзор способов формирования областей (фрагментов компилируемой программы), в рамках которых возможно эффективное распараллеливание. В разделе 6 описываются методы оптимизации, направленные на усиление внутреннего программного параллелизма в рамках выделенных областей. В разделе 7 рассматриваются методы распараллеливания кода в предварительно выделенных областях. Раздел 8 посвящен специфике оптимизации кода для ЦПОС. В разделе 9 приводится информация о языковых расширениях и их роли в увеличении эффективности процессоров. В заключении (раздел 10) представлены некоторые из актуальных нерешенных до настоящего время проблем оптимизации кода для ILP-процессоров.
Другие работы
Функционирование российских предприятий в условиях кризиса
Qiwir
: 13 ноября 2013
Содержание
Введение
Глава 1. Теоретические основы анализа функционирования предприятия в условиях кризиса
1.1 Экономический кризис как элемент внешней среды деятельности предприятия
1.2 Сущность антикризисной политики предприятия
Глава 2. Особенности деятельности российских предприятий в условиях экономического кризиса
2.1 Влияние экономического кризиса на результаты деятельности предприятия
2.2 Разработка антикризисной политики на российских предприятиях
Заключение
Библиографический сп
10 руб.
Зачет по дисциплине «Приборы СВЧ и ОД»
Лесник
: 4 июля 2010
Вопросы к зачету по курсу «ЭКП СВЧ и ОД»:
Какие частоты входят в поддиапазон дециметровых волн?
Как можно снизить потери энергии в проводниках на СВЧ?
При каких условиях наведенный ток во внешней цепи вакуумного зазора равен конвекционному току внутри зазора?
Какой должна быть форма электронного потока (конвекционного тока) для наилучшего отбора энергии в виде электромагнитных колебаний?
Назовите электровакуумные приборы СВЧ, в которых используется электростатическое управление электр
70 руб.
Расчёт технологической схемы воздухоснабжения промышленного предприятия
Алексей2
: 30 сентября 2011
Курсовая работа на тему: «Расчёт технологической схемы воздухоснабжения промышленного предприятия»
По дисциплине «Технологические энергоносители предприятий»
Вариант №9
Расчёт падения давления на главной магистрали
Расчёт простых ответвлений
Расчёт простых ответвлений
Определяется фактическое падение давления на начальном участке
2450 руб.
Маркетинг. Товарный ассортимент.
Kristushka07
: 30 апреля 2013
Содержание
Введение - 3 -
1. Формирование ассортимента продукции. Причины сокращения товарной линии. - 4 -
2. Виды маркетингового контроля. - 8 -
3. Тест - 11 -
Заключение - 12 -
Список используемой литературы - 13 -