Программирование графических процессоров (Милешко). Вариант №5
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №5
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения.
«Программирование графических процессоров»
Вариант №5
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения.
Дополнительная информация
Оценка: Зачет
Дата оценки: 14.02.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 14.02.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Онлайн Тест 8 по дисциплине: Программирование графических процессоров (Милешко).
IT-STUDHELP
: 1 октября 2023
Вопрос №1
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
Какая степень конфликта банков данных в данном доступе к разделяемой памяти?
Конфликтов нет.
Вторая степень.
Четвёртая степень.
Восьмая степень.
Шестнадцатая степень.
Тридцать
750 руб.
Онлайн Тест 7 по дисциплине: Программирование графических процессоров (Милешко).
IT-STUDHELP
: 1 октября 2023
Вопрос №1
Mapped memory – это…
Динамическая память, выделенная на хосте.
Динамическая память, выделенная на устройстве.
Некэшируемая pinned память.
Pinned память доступная на всех устройствах системы сразу после выделения.
Pinned память отображённая в адресное пространство устройства.
Вопрос №2
Дана спецификация графического процессора:
1. 1. Максимальное число варпов на мультипроцессор:32
2. 2. Максимальное число блоков на мультипроцессор:16
3. 3. Максимальное количество
750 руб.
Онлайн Тест 9 по дисциплине: Программирование графических процессоров (Милешко).
IT-STUDHELP
: 1 октября 2023
Вопрос №1
Дана спецификация графического процессора:
1. 1. Максимальное число варпов на мультипроцессор:32
2. 2. Максимальное число блоков на мультипроцессор:16
3. 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. 4. Максимальное количество 32-х битных регистров на блок: 65536
5. 5. Максимальное количество 32-х битных регистров на нить: 255
6. 6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. 7. Размер разделяемой памяти блока
750 руб.
Программирование графических процессоров. Вариант 5
Zla
: 29 марта 2022
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1
650 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров. Вариант №17
IT-STUDHELP
: 3 декабря 2021
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
750 руб.
Другие работы
Проект разработки металлосберегающих технологий штамповки деталей семейства «УАЗ» с использованием универсального оборудования и рабочих чертежей технологической оснастки
Рики-Тики-Та
: 10 сентября 2012
Дипломного проекта студента машиностроительного факультета Кочеткова И. В. группы ОМд-51
Тема: Разработка металлосберегающих технологии штамповки деталей семейства «УАЗ» с использованием универсального оборудования и рабочих чертежей технологической оснастки.
Пояснительная записка выполнена на 158 страницах, иллюстраций 43, таблиц 44, графическая часть на 8 листах формата А1, 2 листа формата А2.
Цель работы – совершенствование действующих и разработка прогрессивных технологических процессов шта
330 руб.
Гидравлика и теплотехника ТОГУ Термодинамика Задача 20 Вариант 7
Z24
: 4 марта 2026
Влажный насыщенный пар с абсолютным давлением р1 поступает в дроссельный калориметр для определения его влажности. После дросселирования до давления р2 = 0,1 МПа температура пара становится равной t2. Какова влажность пара до дросселирования? Как возрастает удельная энтропия пара в дроссельном калориметре? Решение задачи иллюстрировать в i-S диаграмме.
160 руб.
Гидромеханика РГУ нефти и газа им. Губкина Гидродинамика Задача 1 Вариант 9
Z24
: 6 декабря 2025
Насос подает жидкость из подземной ёмкости с избыточным давлением газа на поверхности жидкости. На всасывающей линии (длина l, диаметр d, трубы сварные, бывшие в эксплуатации) имеются местные сопротивления: приёмная коробка с клапаном и сеткой, колено и кран с коэффициентом сопротивления ξкр. Показание вакуумметра на входе в насос равно рv, расход жидкости Q, температура t°C.
Определить рабочую высоту всасывания насоса hвс и предельную высоту из условия отсутствия кавитации на входе в насос.
200 руб.
Термодинамика и теплопередача ПНИПУ 2006 Задача 2 Вариант 46
Z24
: 5 ноября 2025
Произвести термодинамический расчет многоступенчатого поршневого компрессора, производящего G, кг/c сжатого до давления pk воздуха, если предельно допустимое повышение температуры газа в каждой ступени Δt, а сжатие происходит с показателем политропы n.
Состояние воздуха на входе в компрессор: р1=0,1 МПа; t1=27ºC. В промежуточных теплообменниках сжатый воздух охлаждается изобарно до первоначальной температуры t1.
Определить:
— количество ступеней компрессора:
— температуру воздуха пос
600 руб.