Отказоустойчивые вычислительные системы. Лабораторная работа №3

D6ABED0E-5730-46D1-9B46-7BD66B095B31.rar [568 KB]

LWork3

example3.vcxproj [4 KB]

example3.vcxproj.user [143 bytes]

LWork3.doc [Office 2010, 9 стр., 68 KB]

source1.cpp [620 bytes]

source2.cpp [753 bytes]

source3.cpp [835 bytes]

source4.cpp [906 bytes]

source5.cpp [593 bytes]

упражнение1.exe [415 KB]

упражнение2.exe [415 KB]

упражнение3.exe [415 KB]

упражнение4.exe [470 KB]

упражнение5.exe [415 KB]

Необходимые программы

Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:

Microsoft Word

Что делать, если файл не открывается

Описание

ЛАБОРАТОРНАЯ №3. ПАРАЛЛЕЛЬНЫЕ ЦИКЛЫ В OpenMP

3.1.Опции директивы parallel
Директива parallel – инициализирует параллельную область и создает группу из OMP_NUM_THREADS нитей. Определение и задание переменной OMP_NUM_THREADS будет дано в следующем параграфе.

Синтаксис оператора. Язык Си
#pragma omp parallel [опция[[,] опция]...]

Возможные опции:
if(условие) – выполнение параллельной области по условию. Вхождение в параллельную область осуществляется только при выполнении некоторого условия. Если условие не выполнено, то директива не срабатывает и продолжается обработка программы в прежнем режиме;
num_threads (целочисленное выражение) – явное задание количества нитей, которые будут выполнять параллельную область; по умолчанию выбирается последнее значение, установленное с помощью функции omp_set_num_threads(), или значение переменной OMP_NUM_THREADS;
reduction(оператор:список) – задаёт оператор и список общих переменных; для каждой переменной создаются локальные копии в каждой нити; локальные копии инициализируются соответственно типу оператора (для аддитивных операций – 0 или его аналоги, для мультипликативных операций – 1 или её аналоги); над локальными копиями переменных после выполнения всех операторов параллельной области выполняется заданный оператор; оператор это: для языка Си – +, *, -, &, |, ^, &&, ||, для языка Фортран – +, *, -, .and., .or., .eqv., .neqv., max, min, iand, ior, ieor; порядок выполнения операторов не определён, поэтому результат может отличаться от запуска к запуску.

Опции, описанные в предыдущей лабораторной:
default(private|firstprivate|shared|none);
private(список);
firstprivate(список);
shared(список);
copyin(список).

При входе в параллельную область порождаются новые OMP_NUM_THREADS-1 нитей, каждая нить получает свой уникальный номер, причём порождающая нить получает номер 0 и становится основной нитью группы («мастером»).
Остальные нити получают в качестве номера целые числа с 1 до OMP_NUM_THREADS-1. Количество нитей, выполняющих данную параллельную область, остаётся неизменным до момента выхода из области. При выходе из параллельной области производится неявная синхронизация и уничтожаются все нити, кроме породившей.
Все порождённые нити исполняют один и тот же код, соответствующий параллельной области. Предполагается, что в SMP-системе нити будут распределены по различным процессорам (однако это, как правило, находится в ведении операционной системы).
Пример 1 демонстрирует применение опции reduction. В данном примере производится подсчет общего количества порождённых нитей. Каждая нить инициализирует локальную копию переменной count значением 0. Далее, каждая нить увеличивает значение собственной копии переменной count на единицу и выводит полученное число. На выходе из параллельной области происходит суммирование значений переменных count по всем нитям, и полученная величина становится новым значением переменной count в последовательной области.

Пример 1.
Опция reduction на языке Си
#include <stdio.h>
int main(int argc, char *argv[])
{
int count = 0;
#pragma omp parallel num_threads(3)reduction (+: count)
{
count++;
printf("Текущее значение count: %d\n", count);
}
printf("Число нитей: %d\n", count);
}

3.2. Параллельные циклы
Если в параллельной области встретился оператор цикла, то, согласно общему правилу, он будет выполнен всеми нитями текущей группы, то есть каждая нить выполнит все итерации данного цикла. Для распределения итераций цикла между различными нитями можно использовать директиву for (do ... [end do]).

Синтаксис оператора. Язык Си
#pragma omp for [опция[[,] опция]...]

Эта директива относится к идущему следом за данной директивой блоку, включающему операторы for (do).
Возможные опции:
private(список) – задаёт список переменных, для которых порождается локальная копия в каждой нити; начальное значение локальных копий переменных из списка не определено;
firstprivate(список) – задаёт список переменных, для которых порождается локальная копия в каждой нити; локальные копии переменных инициализируются значениями этих переменных в нити-мастере;
lastprivate(список) – переменным, перечисленным в списке, присваивается результат с последнего витка цикла;
reduction(оператор:список) – задаёт оператор и список общих переменных; для каждой переменной создаются локальные копии в каждой нити; локальные копии инициализируются соответственно типу оператора (для аддитивных операций – 0 или его аналоги, для мультипликативных операций – 1 или её аналоги); над локальными копиями переменных после завершения всех итераций цикла выполняется заданный оператор; оператор это: для языка Си – +, *, -, &, |, ^, &&, ||, для языка Фортран – +, *, -, .and., .or., .eqv., .neqv., max, min, iand, ior, ieor; порядок выполнения операторов не определён, поэтому результат может отличаться от запуска к запуску;
schedule(type[, chunk]) – опция задаёт, каким образом итерации цикла распределяются между нитями;
collapse(n) — опция указывает, что n последовательных тесновложенных циклов ассоциируется с данной директивой; для циклов образуется общее пространство итераций, которое делится между нитями; если опция collapse не задана, то директива относится только к одному непосредственно следующему за ней циклу;
ordered – опция, говорящая о том, что в цикле могут встречаться директивы ordered; в этом случае определяется блок внутри тела цикла, который должен выполняться в том порядке, в котором итерации идут в последовательном цикле;
nowait – в конце параллельного цикла происходит неявная барьерная синхронизация параллельно работающих нитей: их дальнейшее выполнение происходит только тогда, когда все они достигнут данной точки; если в подобной задержке нет необходимости, опция nowait позволяет нитям, уже дошедшим до конца цикла, продолжить выполнение без синхронизации с остальными. Если директива end do в явном виде не указана, то в конце параллельного цикла синхронизация все равно будет выполнена.
Если в программе на языке Фортран не указывается директива end do, то она предполагается в конце цикла do.
На вид параллельных циклов накладываются достаточно жёсткие ограничения. В частности, предполагается, что корректная программа не должна зависеть от того, какая именно нить какую итерацию параллельного цикла выполнит. Нельзя использовать побочный выход из параллельного цикла. Размер блока итераций, указанный в опции schedule, не должен изменяться в рамках цикла.

Формат параллельных циклов на языке Си
for([целочисленный тип] i = инвариант цикла;
i {<,>,=,<=,>=} инвариант цикла;
i {+,-}= инвариант цикла)

Эти требования введены для того, чтобы OpenMP мог при входе в цикл точно определить число итераций.
Если директива параллельного выполнения стоит перед гнездом циклов, завершающихся одним оператором, то директива действует только на самый внешний цикл.
Итеративная переменная распределяемого цикла по смыслу должна быть локальной, поэтому в случае, если она специфицирована общей, то она неявно делается локальной при входе в цикл. После завершения цикла значение итеративной переменной цикла не определено, если она не указана в опции lastprivate.
Пример 2 демонстрирует использование директивы for. В последовательной области инициализируются три исходных массива A, B, C. В параллельной области данные массивы объявлены общими. Вспомогательные переменные i и n объявлены локальными. Каждая нить присвоит переменной n свой порядковый номер. Далее с помощью директивы for определяется цикл, итерации которого будут распределены между существующими нитями. На каждой i-ой итерации данный цикл сложит i-ые элементы массивов A и B и результат запишет в i-ый элемент массива C. Также на каждой итерации будет напечатан номер нити, выполнившей данную итерацию.

Пример 2.
Директива for на языке Си.
#include <stdio.h>
#include <omp.h>
int main(int argc, char *argv[])
{
int A[10], B[10], C[10], i, n;
/* Заполним исходные массивы */
for (i=0; i<10; i++){ A[i]=i; B[i]=2*i; C[i]=0; }
#pragma omp parallel shared(A, B, C) private(i, n)
{
/* Получим номер текущей нити */
n=omp_get_thread_num();
#pragma omp for
for (i=0; i<10; i++)
{
C[i]=A[i]+B[i];
printf("Нить %d сложила элементы с номером %d\n",
n, i);
}
}
}

Параллельные секции
Директива sections (sections ... end sections) используется для задания конечного (неитеративного) параллелизма.

Синтаксис оператора. Язык Си
#pragma omp sections [опция[[,] опция]...]

Эта директива определяет набор независимых секций кода, каждая из которых выполняется своей нитью.
Возможные опции:
private(список) – задаёт список переменных, для которых порождается локальная копия в каждой нити; начальное значение локальных копий переменных из списка не определено;
firstprivate(список) – задаёт список переменных, для которых порождается локальная копия в каждой нити; локальные копии переменных инициализируются значениями этих переменных в нити-мастере;
lastprivate(список) – переменным, перечисленным в списке, присваивается результат с последнего витка цикла;
reduction(оператор:список) – задаёт оператор и список общих переменных; для каждой переменной создаются локальные копии в каждой нити; локальные копии инициализируются соответственно типу оператора (для аддитивных операций – 0 или его аналоги, для мультипликативных операций – 1 или её аналоги); над локальными копиями переменных после завершения всех итераций цикла выполняется заданный оператор; оператор это: для языка Си – +, *, -, &, |, ^, &&, ||; порядок выполнения операторов не определён, поэтому результат может отличаться от запуска к запуску;
nowait – в конце параллельного цикла происходит неявная барьерная синхронизация параллельно работающих нитей: их дальнейшее выполнение происходит только тогда, когда все они достигнут данной точки; если в подобной задержке нет необходимости, опция nowait позволяет нитям, уже дошедшим до конца цикла, продолжить выполнение без синхронизации с остальными. Если директива end do в явном виде не указана, то в конце параллельного цикла синхронизация все равно будет выполнена.

Директива section задаёт участок кода внутри секции sections для выполнения одной нитью.

Синтаксис оператора. Язык Си
#pragma omp section

Перед первым участком кода в блоке sections директива section не обязательна. Какие именно нити будут задействованы для выполнения какой секции, не специфицируется. Если количество нитей больше количества секций, то часть нитей для выполнения данного блока секций не будет задействована. Если количество нитей меньше количества секций, то некоторым (или всем) нитям достанется более одной секции.
Пример 5 иллюстрирует применение директивы sections. Cначала три нити, на которые распределились три секции section, выведут сообщение со своим номером, а потом все нити напечатают одинаковое сообщение со своим номером.

Пример 5.
Директива sections на языке Си.
#include <stdio.h>
#include <omp.h>
int main(int argc, char *argv[])
{
int n;
#pragma omp parallel private(n)
{
n=omp_get_thread_num();
#pragma omp sections
{
#pragma omp section
{
printf("Первая секция, процесс %d\n", n);
}
#pragma omp section
{
printf("Вторая секция, процесс %d\n", n);
}
#pragma omp section
{
printf("Третья секция, процесс %d\n", n);
}
}
printf("Параллельная область, процесс %d\n", n);
}
}

Пример 6 демонстрирует использование опции lastprivate. В данном примере опция lastprivate используется вместе с директивой sections. Переменная n объявлена как lastprivate переменная. Три нити, выполняющие секции section, присваивают своей локальной копии n разные значения. По выходе из области sections значение n из последней секции присваивается локальным копиям во всех нитях, поэтому все нити напечатают число 3. Это же значение сохранится для переменной n и в последовательной области.

Пример 6.
Директива lastprivate на языке Си.
#include <stdio.h>
#include <omp.h>
int main(int argc, char *argv[])
{
int n=0;
#pragma omp parallel num_threads(4)
{
#pragma omp sections lastprivate(n)
{
#pragma omp section
{
n=1;
}
#pragma omp section
{
n=2;
}
#pragma omp section
{
n=3;
}
}
printf("Значение n на нити %d: %d\n",
omp_get_thread_num(), n);
}
printf("Значение n в последовательной области: %d\n", n);
}

Упражнения

1. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу подсчет суммы элементов массива A. (Примечание: использование опции reduction директивы parallel).
2. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу определения маскимального и минимального элементов массива A. (Примечание: использование опции reduction директивы parallel).
3. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу, в которой нити с четными номерами выводят на экран четные элементы массива A, а нити с нечетными номерами выводят на экран нечетные элементы массива A. (Примечание: использование опции if директивы parallel).
4. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу подсчет суммы элементов массива A. Если n меньше 100, то программа выполняется последовательно только главной нитью. Если n больше 100, то подсчет суммы выполняется всеми нитями. Если n равно 100, то программа аварийно завершается. (Примечание: использование опций if, reduction директивы parallel).
5. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу подсчет суммы элементов массива A, количество нитей задается опцией num_threads. (Примечание: использование опций num_threads, reduction директивы parallel).
6. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу подсчета количества нулевых элементов массива A. (Примечание: использование опции reduction директив parallel, for (do)).
7. Даны два одномерных массива A и B из n элементов, рассположеных в общей памяти. Элементы массива A задаются по следующей формуле a(i)=i, где i – индекс цикла, а элементы массива B по формуле b(i)=thread_num, где thread_num – номер нити. Опцией schedule директивы for (do) задается следующие типы разбиений: static, dynamic, guided. Размер блока chunk равен 1, 2, 4, 8. Программа заполняет массивы A и B, замеряет время выполнения цикла, выводит массивы A, B и время на экран (в файл). Требуется провести анализ времени выполнения программы, определить эффективный тип разбиения массива. (Примечание: количество элементов n более 100, использование опции schedule директив parallel, for (do)).
8. Даны два двумерных массива A и B из NxN элементов, рассположеных в общей памяти. Дано программа запускается на двух нитях. Написать программу заполнения массивов A и B, при условии, что первых массив заполняет первая нить, второй – вторая нить. (Примечание: использование директивы sections).
9. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Элементы массива A задаются по следующей формуле a(i)=i, где i – индекс цикла. Написать программу вывода массива A на экран (в файл) при условии, что вывод выполняется в параллельной области, данные выводятся только один раз. (Примечание: использование директивы single).
10. Дан одномерный массив A из n элементов, рассположеный в общей памяти. Написать программу подсчет суммы элементов массива A. (Примечание: использование комбинированной директивы parallel for(do)).

Вопросы (увеличить количество)

1. В каких случаях может быть необходимо использование опции if директивы parallel?
2. В каких случаях может быть необходимо использование директивs single?
3. Может ли нить-мастер выполнить область, ассоциированную с директивой single?
4. Определите, сколько процессоров доступно в вашей системе для выполнения параллельной части программы, и займите каждый из доступных процессоров выполнением одной нити в рамках общей параллельной области?
5. При помощи трёх уровней вложенных параллельных областей породите 8 нитей (на каждом уровне параллельную область должны исполнять 2 нити). Посмотрите, как будет исполняться программа, если запретить вложенные параллельные области?

Дополнительная информация

Уважаемый студент, дистанционного обучения,
Оценена Ваша работа по предмету: Отказоустойчивые вычислительные системы (ДВ 3.2)
Вид работы: Лабораторная работа 3
Оценка:Зачет
Дата оценки: 09.05.2019
Рецензия

Задорожный Анатолий Филиппович

Отказоустойчивые вычислительные системы

96. Дан одномерный массив A из n элементов, расположенный в общей памяти. Написать программу определения маскимального и минимального элементов массива A. (Примечание: использование опции reduction директивы parallel). 106. Написать и реализовать параллельную программу перемножения квадратных матриц на 4-х ядерном процессоре. Размерность массивов N = № пароля *100. Использовать OpenMP. 116. Написать программу параллельного решения задачи Дирихле методом Гаусса-Зейделя для 4-х процесcорной ВС.

Вычислительная техника и информационные технологии Работа Контрольная

nura : 15 июня 2019

200 руб.

Лабораторная работа №3 по дисциплине: Отказоустойчивые вычислительные системы. Вариант №4

ЛАБОРОТОРНАЯ №3. ПАРАЛЛЕЛЬНЫЕ ЦИКЛЫ В OpenMP Задание Цель лабораторной работы – рассмотреть различные условия выполнения параллельных циклов. Исходные тексты программ Упражнение 4. Дан одномерный массив A из n элементов, расположенный в общей памяти. Написать программу подсчет суммы элементов массива A. Если n меньше 100, то программа выполняется последовательно только главной нитью. Если n больше 100, то подсчет суммы выполняется всеми нитями. Если n равно 100, то программа аварийно завершает

СибГУТИ Отказоустойчивые вычислительные системы Работа Лабораторная

IT-STUDHELP : 16 июня 2019

480 руб.

Отказоустойчивые вычислительные системы. Билет №17

1. В каких величинах проводится оценки производительности многопроцессорных вычислительных систем? 4. К какому классу в соответствии с систематикой Флинна относятся векторные и векторно-конвейерные ВС? 8. В качестве системообразующего вычислительного модуля в кластерных системах используется.... 9. Два или более ПК, объединяемых по топологии «шина» или с помощью коммутатора и являющиеся единым информационно-вычислительным ресурсом, называют ....

******* Не известно Отказоустойчивые вычислительные системы Работа Зачетная

Prorabs : 29 декабря 2019

200 руб.

Лабораторная работа 2-3 по дисциплине: Отказоустойчивые вычислительные системы. Вариант 7

ЛАБОРОТОРНАЯ №2. СОЗДАНИЕ ПАРАЛЛЕЛЬНЫХ ОБЛАСТЕЙ В OpenMP Задание Цель лабораторной работы – рассмотреть условия выполнения параллельных областей. Распределение выполняемой программой работы между главной нитью и остальными. Исходные тексты программ Упражнение 4. Напишите программу скалярного произведения двух векторов. При инициализации параллельной области явно укажите количество используемых нитей 2 или 4. Упражнение 5. Программу упражнения 4 измените так, чтобы вывод результата скалярного

СибГУТИ Отказоустойчивые вычислительные системы Работа Лабораторная

IT-STUDHELP : 14 мая 2022

600 руб.

Отказоустойчивые вычислительные системы. Лабораторная работа №1

ЛАБОРОТОРНАЯ №1. ИЗУЧЕНИЕ РАБОТЫ С НИТЯМИ в OpenMP. Цель лабораторной работы – знакомство с библиотекой OpenMP и получение первичных навыков параллельного программирования. 1. Создание приложения с применением OpenMP 1. Запустите Microsoft Visual Studio 2010. 2. Выбирите пункт в меню File -> New -> Project, или нажмите Ctrl+Shift+N 3. В окне New Project в раскрывающемся списке Visual C++ выбирите Win32. В подокне Templates установите Win32 Console Application. Введите имя (Name), например, examp

Работа Лабораторная Вычислительные машины, системы и сети

nura : 12 мая 2019

300 руб.

Отказоустойчивые вычислительные системы. Лабораторная работа №2

ЛАБОРОТОРНАЯ №2. СОЗДАНИЕ ПАРАЛЛЕЛЬНЫХ ОБЛАСТЕЙ В OpenMP. Цель лабораторной работы – рассмотреть Условия выполнения параллельных областей. Распределение выполняемой программой работы между главно нитью и остальными. 2.1.Обзор директив разделения задач При запуске программы создается процесс и запускается одна нить приложения OpenMP. Первая нить называется главная, она существует на протяжении всего цикла работы программы, в литературе не редко главная нить называется нить-мастер (master threa

Работа Лабораторная Вычислительные машины, системы и сети

nura : 12 мая 2019

550 руб.

Контрольная и Лабораторная работа 2-3 по дисциплине: Отказоустойчивые вычислительные системы. Вариант 7

7. В чем особенность кластерных вычислительных систем? 17. Назовите важнейшие свойства архитектуры ВС. 27. Какое расписание является оптимальным? 37. Как определяется понятие стоимости вычислений? 47. Зависят ли параметрически правила масштабирования от количества процессоров? 57. Какие проблемы возникают при использовании общих данных в параллельно выполняемых потоках? 67. Как определяются общие и локальные переменные потоков? 77. Как используются постоянные локальные переменные потоков (директ

СибГУТИ Отказоустойчивые вычислительные системы Работа Лабораторная

IT-STUDHELP : 14 мая 2022

1300 руб.

Зачет по дисциплине: Отказоустойчивые вычислительные системы. Билет № 2

Билет № 2 2. Критериями оценки эффективности многопроцессорных вычислительных систем являются: Масштабируемость, Отказоустойчивость, Производительность. Многопроцессорность, Надежность, Вычислительная мощность. Надежность, Производительность, Мультипроцессность. 4. К какому классу в соответствии с систематикой Флинна относятся векторные и векторно-конвейерные ВС? SIMD. SISD. MISD. MIMD. 6. Какие преимущества предоставляет пользователям вычислительных систем с суперкомпьютерным уровнем кластер

СибГУТИ Отказоустойчивые вычислительные системы Работа Зачетная

IT-STUDHELP : 18 апреля 2021

400 руб.

Электротехника, электроника и схемотехника. Семестр 3-й. Зачет. Билет № 3

Билет № 3 1. Операторный метод расчета переходных процессов. Построение эквивалентной схемы с помощью основных свойств преобразования Лапласа. 2. Определить частоты гармоник спектра заданного сигнала. U1,B 2Um

Электротехника СибГУТИ Работа Зачетная

rt : 9 ноября 2014

80 руб.

Контрольная работа по дисциплине: Физиология человека. Вариант №8

Вариант №8 1. Физиология пищеварения. Нейрогуморальная регуляция секреции пищеварительных желез 2. Обмен веществ и энергии. Возрастные особенности обмена веществ =============================================

СибГУТИ Физиология человека Работа Контрольная

IT-STUDHELP : 22 апреля 2023

350 руб.

Гидравлика УрИ ГПС МЧС Задание 2 Вариант 92

Ответить на теоретические вопросы: Объясните понятия абсолютного и избыточного давления, вакуума. Какими приборами измеряется давление, вакуум. Устройство и принцип работы этих приборов. Вывод основного уравнения гидростатики и его физический смысл. Что такое поверхность равного давления и каким уравнением она описывается? Что является поверхностью равного давления для жидкости в поле сил тяжести? Задача 2. Какое усилие необходимо приложить к окончанию рычага гидравлического пресса (F),

Задачи Гидравлика

Z24 : 18 марта 2026

110 руб.

Сети доступа - контрольная работа 5 вариант

Детский садик Кол-во внутренних телефонных абонентов – 15 ДВО: • временный запрет входящей связи; • перевод соединения другому абоненту; • музыка на удержании; Скорость интернет канала, 8Мбит/с Технические условия: 20 метров от узла в здании Задание 1. Рассчитать количество входящих линий при условии, что средняя нагрузка на линию: СаLL-центр 0,6-0,7 эрл Такси, службы доставки и т.д 0,4-0,5 эрл Бизнес-сегмент 0,2-0,3 эрл 2. Определить тип входящих линий 3. Подобрать АТС

СибГУТИ Сети доступа Работа Контрольная

vlanproekt : 26 августа 2019

290 руб.

Отказоустойчивые вычислительные системы. Лабораторная работа №3

Состав работы

Необходимые программы

Описание

Дополнительная информация

Похожие материалы

Другие работы

Вход