Программирование графических процессоров. Контрольная работа №1. Вариант №20

Состав работы

material.view.file_icon
material.view.file_icon
material.view.file_icon Контрольная работа.pdf
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
  • Adobe Acrobat Reader

Описание

Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 48
Рассчитайте теоретическую заполняемость? Чем она ограничена?

Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.

Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде с использованием разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.

1. Выбор варианта контрольной работы. Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.

2.Пояснения по выполнению заданий.

Контрольная работа состоит из трёх заданий.

В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.

Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.

В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).

Дополнительная информация

Зачтено без замечаний
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №20
Контрольная работа Вариант №20 Задание1.Данаспецификацияграфического процессора: 1. Максимальноечисловарповнамультипроцессор:64 2. Максимальноечислоблоковнамультипроцессор:16 3. Максимальноеколичество32-х битных регистровнамультипроцессор: 65536 4. Максимальноеколичество32-х битныхрегистровнаблок:65536 5. Максимальноеколичество32-х битныхрегистровнанить:255 6. Размерразделяемойпамятимультипроцессора(байт): 32768 7. Размерразделяемойпамятиблока(байт):24576 Параметры запускаемой программы: 1. Ра
User IT-STUDHELP : 19 декабря 2022
750 руб.
promo
Контрольная работа по дисциплине "Программирование графических процессоров". Вариант №20
Методические указания и задание на выполнение контрольной работы Для выполнения третьего задания контрольной работы понадобится видеокарта NVIDIA с поддержкой технологии CUDA. Поддерживает ли ваша видеокарта технологию CUDA, можно узнать в её спецификации на официальном сайте NVIDIA или в документах, идущих в комплекте с видеокартой. Кроме видеокарты вам понадобится установить CUDA Toolkit, компилятор с языка программирования C, текстовый редактор. На сайте NVIDIA есть инструкции для установки
User vpozyaikin : 1 марта 2021
1000 руб.
Программирование графических процессоров Лабораторная 1
Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения Ax
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 2
Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реал
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 3
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров. Вариант 5
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор:32 2. Максимальное число блоков на мультипроцессор:16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1
User Zla : 29 марта 2022
650 руб.
Программирование графических процессоров. Вариант №17
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы:
User IT-STUDHELP : 3 декабря 2021
750 руб.
promo
«Программирование графических процессоров». Вариант №1
Тема контрольной работы: «Базовые принципы организации памяти GPU» Некоторые выдержки из отчета приведены далее. Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций. Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
User boeobq : 1 декабря 2021
150 руб.
«Программирование графических процессоров». Вариант №1
Множества + Булевы функции +отношения =6 задач
Дискретная математика Контрольная работа (6 задач) Номер варианта определяется последней цифрой студбилета (зачетной книжки). Если номер билета оканчивается на 0, то это десятый вариант. Задания нумеруются следующим образом. Например, задание 3.4. означает, что это третье задание четвертого варианта. Задание №1. Доказать равенство множеств: а) исходя из определения равенства множеств; б) Преобразуя левую (или правую) часть равенства в правую часть (соответственно, в левую); в) используя харак
User Максим102 : 15 июля 2014
99 руб.
Вильгельм Вундт: "Введение в психологию"
На вопрос о задаче психологии обыкновенно отвечают: эта наука должна изучать состояния сознания, их связь и отношения, чтобы найти в конце концов законы, управляющие этими отношениями. Сознание представляет собой сумму сознаваемых нами состояний. Ведь всем предметам, данным нам в опыте, присуще то, что мы, в сущности, можем не определить их, а лишь указать на них; или, если они сложны по природе своей, перечислить их свойства. Большинство своих опытов Вундт проводил с помощью метронома, так как
User Slolka : 18 октября 2013
Защита информации. Экзамен. Билет №11.
1. Определите количество операций умножения, которых достаточно для вычисления выражения 5^16: а) 5 б) 4 в) 15 г) 16 2. Конструкция Диффи-Хеллмана является а) системой c открытым ключом б) совершенным шифром в) блоковым шифром 3. В протоколе «электронные деньги» подделать купюру без знания ключа банка а) возможно при полном переборе ключей б) возможно при наличии идеального генератора случайных чисел в) невозможно 4. Шифр Вернама использует ……. ключ (вставить пропущенное слово). 5.
User Cole82 : 4 февраля 2017
39 руб.
up Наверх