Программирование графических процессоров. Контрольная работа №1. Вариант №20

Состав работы

material.view.file_icon
material.view.file_icon
material.view.file_icon Контрольная работа.pdf
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
  • Adobe Acrobat Reader

Описание

Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 48
Рассчитайте теоретическую заполняемость? Чем она ограничена?

Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.

Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде с использованием разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.

1. Выбор варианта контрольной работы. Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.

2.Пояснения по выполнению заданий.

Контрольная работа состоит из трёх заданий.

В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.

Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.

В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).

Дополнительная информация

Зачтено без замечаний
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №20
Контрольная работа Вариант №20 Задание1.Данаспецификацияграфического процессора: 1. Максимальноечисловарповнамультипроцессор:64 2. Максимальноечислоблоковнамультипроцессор:16 3. Максимальноеколичество32-х битных регистровнамультипроцессор: 65536 4. Максимальноеколичество32-х битныхрегистровнаблок:65536 5. Максимальноеколичество32-х битныхрегистровнанить:255 6. Размерразделяемойпамятимультипроцессора(байт): 32768 7. Размерразделяемойпамятиблока(байт):24576 Параметры запускаемой программы: 1. Ра
User IT-STUDHELP : 19 декабря 2022
750 руб.
promo
Контрольная работа по дисциплине "Программирование графических процессоров". Вариант №20
Методические указания и задание на выполнение контрольной работы Для выполнения третьего задания контрольной работы понадобится видеокарта NVIDIA с поддержкой технологии CUDA. Поддерживает ли ваша видеокарта технологию CUDA, можно узнать в её спецификации на официальном сайте NVIDIA или в документах, идущих в комплекте с видеокартой. Кроме видеокарты вам понадобится установить CUDA Toolkit, компилятор с языка программирования C, текстовый редактор. На сайте NVIDIA есть инструкции для установки
User vpozyaikin : 1 марта 2021
1000 руб.
Программирование графических процессоров Лабораторная 2
Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реал
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 3
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 1
Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения Ax
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров. Вариант 5
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор:32 2. Максимальное число блоков на мультипроцессор:16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1
User Zla : 29 марта 2022
650 руб.
Программирование графических процессоров. Вариант №17
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы:
User IT-STUDHELP : 3 декабря 2021
750 руб.
promo
«Программирование графических процессоров». Вариант №1
Тема контрольной работы: «Базовые принципы организации памяти GPU» Некоторые выдержки из отчета приведены далее. Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций. Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
User boeobq : 1 декабря 2021
150 руб.
«Программирование графических процессоров». Вариант №1
Контрольная работа по дисциплине: Экология. Вариант №3
Контрольная работа По дисциплине: Экология Вариант: 03 4. Учение В.И.Вернадского о биосфере. Границы распространения жизни в биосфере. 91. Воздействие тепловых электростанций на окружающую среду. Задача No2 Сделать оценку качества поверхностного источника питьевого водо-снабжения населенного пункта по степени опасности загрязнения химиче-скими веществами. Привести наиболее распространенные причины загряз-нения поверхностных вод, а также методы снижения этого загрязнения. таблица 2. Исходные
User IT-STUDHELP : 16 декабря 2022
480 руб.
Контрольная работа по дисциплине: Экология. Вариант №3 promo
Контрольная работа. Вариант №11. Метрология, стандартизация и сертификация
В описании указана только часть условий задач. Полное описание задач во вложениях. Задача № 1 . Для определения расстояния до места повреждения кабельной линии связи был использован импульсный рефлектометр. С его помощью получено n результатов однократных измерений (результатов наблюдений) расстояния до места повреждения. Задача № 2 . При определении вносимого ослабления четырехполюсника необходимо измерить абсолютный уровень мощности рн, отдаваемой генератором с внутренним сопр
User Teuserer : 15 января 2016
150 руб.
Контрольная работа. Вариант №11. Метрология, стандартизация и сертификация
Гидравлика ИжГТУ 2007 Задача 1.3 Вариант 9
Прямоугольная (b·d) квадратная (d·d) либо круглая (φ·d) крышка люка закрывает отверстие в плоской наклонной стенке водоема. Найти силу давления воды на крышку, а также расстояние уцд от точки О до центра давления цд. Плотность воды — 1000 кг/м³.
User Z24 : 22 октября 2025
150 руб.
Гидравлика ИжГТУ 2007 Задача 1.3 Вариант 9
Ограничения и обременения в земельном праве
Понятие и виды ограничений в земельном праве Частные ограничения прав Сервитуты Императивные ограничения земельного законодательства Заключение Список литературы
User evelin : 8 марта 2013
15 руб.
up Наверх