Программирование графических процессоров. Контрольная работа №1. Вариант №20

Состав работы

material.view.file_icon
material.view.file_icon
material.view.file_icon Контрольная работа.pdf
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
  • Adobe Acrobat Reader

Описание

Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 48
Рассчитайте теоретическую заполняемость? Чем она ограничена?

Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.

Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде с использованием разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.

1. Выбор варианта контрольной работы. Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.

2.Пояснения по выполнению заданий.

Контрольная работа состоит из трёх заданий.

В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.

Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.

В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).

Дополнительная информация

Зачтено без замечаний
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №20
Контрольная работа Вариант №20 Задание1.Данаспецификацияграфического процессора: 1. Максимальноечисловарповнамультипроцессор:64 2. Максимальноечислоблоковнамультипроцессор:16 3. Максимальноеколичество32-х битных регистровнамультипроцессор: 65536 4. Максимальноеколичество32-х битныхрегистровнаблок:65536 5. Максимальноеколичество32-х битныхрегистровнанить:255 6. Размерразделяемойпамятимультипроцессора(байт): 32768 7. Размерразделяемойпамятиблока(байт):24576 Параметры запускаемой программы: 1. Ра
User IT-STUDHELP : 19 декабря 2022
750 руб.
promo
Контрольная работа по дисциплине "Программирование графических процессоров". Вариант №20
Методические указания и задание на выполнение контрольной работы Для выполнения третьего задания контрольной работы понадобится видеокарта NVIDIA с поддержкой технологии CUDA. Поддерживает ли ваша видеокарта технологию CUDA, можно узнать в её спецификации на официальном сайте NVIDIA или в документах, идущих в комплекте с видеокартой. Кроме видеокарты вам понадобится установить CUDA Toolkit, компилятор с языка программирования C, текстовый редактор. На сайте NVIDIA есть инструкции для установки
User vpozyaikin : 1 марта 2021
1000 руб.
Программирование графических процессоров Лабораторная 2
Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реал
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 3
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 1
Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения Ax
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров. Вариант 5
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор:32 2. Максимальное число блоков на мультипроцессор:16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1
User Zla : 29 марта 2022
650 руб.
Программирование графических процессоров. Вариант №17
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы:
User IT-STUDHELP : 3 декабря 2021
750 руб.
promo
«Программирование графических процессоров». Вариант №1
Тема контрольной работы: «Базовые принципы организации памяти GPU» Некоторые выдержки из отчета приведены далее. Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций. Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
User boeobq : 1 декабря 2021
150 руб.
«Программирование графических процессоров». Вариант №1
Классификация финансовых инструментов для формирования инвестиционных портфелей и их сущность
Введение 3 1. Понятие и виды инвестиционного портфеля 4 2. Характеристики финансовых инструментов 13 Заключение 19 Список использованной литературы 20
User Алёна51 : 19 ноября 2015
100 руб.
История (1 семестр). Экзаменационная работа. Экзамен. Билет 7
Билет № 7 1. Причины феодальной раздробленности Руси. Характеристика Владимиро-Суздальского, Галицко-Волынского княжеств, Новгородской феодальной республики. 2. Россия в Первой мировой войне (1914 – 1918 гг.).
User Huliya : 21 ноября 2017
150 руб.
Автоматизированное рабочее место производственного менеджера
СОДЕРЖАНИЕ: Введение; № Варианта; 1.Проектирование базы данных; 1.1 Алгоритм работы программы; 1.2 Анализ предметной области; 1.3 Инфологическое проектирование; 2. Физическая реализация базы данных «Школьная библиотека; 3.Создание Базы Данных средствами Microsoft Access; 3.1Создание таблиц «Школьная Библиотека»; 4.Создание Новой Базы данных; 5.Создание таблиц; 6.Создание Схемы данных; 7.Ввод и редактирование данных в таблицах; 8.Создание запросов; 9.Создание форм; 10.Отчет; 11.Макросы; Заключени
User Aronitue9 : 6 января 2012
11 руб.
ИГ.05.09.01 - Корпус. Виды
Все выполнено в программе КОМПАС 3D v16 Вариант 9 ИГ.05.09.01 - Корпус. Виды 1. По прямоугольной изометрической проекции построить главный вид, вид сверху и вид слева. Показать линии невидимого контура. 2. Нанести размеры. В состав работы входят 4 файла: - 3D модель данной детали, расширение файла *.m3d; - ассоциативный чертеж формата А3 в трёх видах с линиями невидимого контура и проставленными размерами, выполненый по данной 3D модели, расширение файла *.cdw; - аналогичный обычный чертеж, р
80 руб.
ИГ.05.09.01 - Корпус. Виды
up Наверх