Контрольная и Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Excel
- Microsoft Word
Описание
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения AxV, где A – матрица, V – вектор.
3. Реализуйте параллельный алгоритм умножения VxA, где A – матрица, V – вектор.
4. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
5. Прочитайте главу "Профилирование программ", ответьте на контрольные вопросы в конце главы (ответы на контрольные вопросы не нужно включать в отчёт по лаборатор-ной работе).
6. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффек-тивность доступа к глобальной памяти.
Лабораторная работа №2
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффективность доступа к глобальной памяти.
Лабораторная работа №3
Задание
1. Прочитайте главы теоретического материала под названиями "Pinnedmemory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения AxV, где A – матрица, V – вектор.
3. Реализуйте параллельный алгоритм умножения VxA, где A – матрица, V – вектор.
4. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
5. Прочитайте главу "Профилирование программ", ответьте на контрольные вопросы в конце главы (ответы на контрольные вопросы не нужно включать в отчёт по лаборатор-ной работе).
6. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффек-тивность доступа к глобальной памяти.
Лабораторная работа №2
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффективность доступа к глобальной памяти.
Лабораторная работа №3
Задание
1. Прочитайте главы теоретического материала под названиями "Pinnedmemory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Дополнительная информация
Оценка: Зачет
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте паралле
900 руб.
Онлайн Тест 3 по дисциплине: Программирование графических процессоров.
IT-STUDHELP
: 19 декабря 2022
Вопрос №1
Callbackфункция – это функция…
Любая функция, выполняемая хостом.
Функция, выполняемая хостом, которая блокирует выполнение функции-ядра в любой момент времени.
Функция, выполняемая устройством.
Функция, выполняемая устройством, которая вызывается внутри функции-ядра.
Функция, выполняемая хостом, блокирующая выполнение потока.
Вопрос №2
Что делает функция tex1Dfetch?
Связывает линейную область памяти с одномерной текстурой.
Связывает линейную область памяти с двумерной т
750 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Пояснения по выполнению заданий.
Контрольная работа состоит из трёх заданий.
В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.
Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается.
750 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32
750 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
IT-STUDHELP
: 3 декабря 2021
Лабораторная работа 1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельны
900 руб.
Контрольная и Лабораторные работы 1-3 по дисциплине: Информатика. Вариант №15
IT-STUDHELP
: 17 мая 2023
Контрольная работа
1. Обработка одномерных массивов.
Цель: изучение простейших алгоритмов организации и обработки одномерных массивов на языке С++.
Задание
1. Самостоятельно изучить возможности языка программирования C++ для описания, инициализации и обработки одномерных массивов.
2. Создать консольное приложение, в котором реализовать следующие вычисления:
объявление заданного массива целых чисел фиксированной длины;
инициализацию элементов массива посредством ввода с клавиатуры;
заданный
850 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Другие работы
Теоретические основы электротехники. Нелинейные сопротивления
Liya38
: 25 июля 2014
ЗАДАНИЕ.
Рассчитать нелинейную цепь переменного тока:
- Определить аналитические выражения токов и напряжений на всех участках
цепи, на всех интервалах времени в пределах 1,5 периода питающего напряжения. Составить расчетные схемы для каждого интервала.
- Определить моменты перехода процессов с одного интервала на другой и длительность интервала.
- Построить в масштабе кривы изменения всех токов и напряжений на указанных интервалах. При построении указать все параметры синусоид, составл
80 руб.
Вопросы по зачетной работе для дисциплины “Технические средства РС, РВ и ТВ”. Вариант № 9.
perveeva
: 13 ноября 2012
Вариант 9
1. Технические показатели радиопередатчиков.
2. Виды антенно-фидерных устройств.
3. Структурная схема цифрового ревербератора.
200 руб.
Метрология, стандартизация и сертификация в инфокоммуникациях. Контрольная работа. Вариант №06
SibGUTI2
: 20 ноября 2019
Контрольная работа. Вариант No06
Задача No 1
Для определения расстояния до места повреждения кабельной ли-нии связи был использован импульсный рефлектометр. С его помо-щью получено n результатов однократных измерений (результатов наблюдений) расстояния до места повреждения.
Считая, что случайная составляющая погрешности рефлектометра распределена по нормальному закону, определить:
1. Результат измерения с многократными наблюдениями расстоя-ния до места повреждения кабеля .
2. Оценку сред
300 руб.
Лабораторная работа №1 «Исследование влияния параметров спекания бокситов на степень извлечения оксида алюминия из спека при дальнейшем выщелачивании с применением ЭВМ» Лабораторная работа №2 «Влияние параметров декомпозиции настепень извлечения оксида ал
Lokard
: 4 октября 2017
Лабораторная работа №1 «Исследование влияния параметров спекания бокситов на степень извлечения оксида алюминия из спека при дальнейшем выщелачивании с применением ЭВМ»
Лабораторная работа №2 «Влияние параметров декомпозиции настепень извлечения оксида алюминия из раствора и на продолжительность процесса»
Лабораторная работа №3 «Исследование обогатимости медно-молибденовых руд методом флотации с применением ЭВМ»
Лабораторная работа №4 «Влияние концентрации кислорода в дутье на показатели окислит
15 руб.