Программирование графических процессоров. Контрольная работа №1. Вариант №20

Состав работы

material.view.file_icon
material.view.file_icon
material.view.file_icon Контрольная работа.pdf
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
  • Adobe Acrobat Reader

Описание

Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 48
Рассчитайте теоретическую заполняемость? Чем она ограничена?

Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.

Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде с использованием разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.

1. Выбор варианта контрольной работы. Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.

2.Пояснения по выполнению заданий.

Контрольная работа состоит из трёх заданий.

В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.

Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.

В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).

Дополнительная информация

Зачтено без замечаний
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №20
Контрольная работа Вариант №20 Задание1.Данаспецификацияграфического процессора: 1. Максимальноечисловарповнамультипроцессор:64 2. Максимальноечислоблоковнамультипроцессор:16 3. Максимальноеколичество32-х битных регистровнамультипроцессор: 65536 4. Максимальноеколичество32-х битныхрегистровнаблок:65536 5. Максимальноеколичество32-х битныхрегистровнанить:255 6. Размерразделяемойпамятимультипроцессора(байт): 32768 7. Размерразделяемойпамятиблока(байт):24576 Параметры запускаемой программы: 1. Ра
User IT-STUDHELP : 19 декабря 2022
750 руб.
promo
Контрольная работа по дисциплине "Программирование графических процессоров". Вариант №20
Методические указания и задание на выполнение контрольной работы Для выполнения третьего задания контрольной работы понадобится видеокарта NVIDIA с поддержкой технологии CUDA. Поддерживает ли ваша видеокарта технологию CUDA, можно узнать в её спецификации на официальном сайте NVIDIA или в документах, идущих в комплекте с видеокартой. Кроме видеокарты вам понадобится установить CUDA Toolkit, компилятор с языка программирования C, текстовый редактор. На сайте NVIDIA есть инструкции для установки
User vpozyaikin : 1 марта 2021
1000 руб.
Программирование графических процессоров Лабораторная 1
Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения Ax
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 2
Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реал
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 3
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров. Вариант 5
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор:32 2. Максимальное число блоков на мультипроцессор:16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1
User Zla : 29 марта 2022
650 руб.
Программирование графических процессоров. Вариант №17
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы:
User IT-STUDHELP : 3 декабря 2021
750 руб.
promo
«Программирование графических процессоров». Вариант №1
Тема контрольной работы: «Базовые принципы организации памяти GPU» Некоторые выдержки из отчета приведены далее. Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций. Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
User boeobq : 1 декабря 2021
150 руб.
«Программирование графических процессоров». Вариант №1
Что мешает коммерциализации российской науки?
Как это может показаться ни странно, но ученые порой бывают неадекватны в обыденной жизни. Они склонны идеализировать окружающую действительность – строят модели общественной жизни, исходя из своих желаемых представлений, почему-то отказываясь замечать противоречия между моделью и фактами, вовремя не корректируют свои убеждения и поведение. Фактически тот свой базовый навык, который отличает естественников от гуманитариев – соотносить модельные представления и реальную действительность, они ника
User alfFRED : 23 октября 2013
10 руб.
Гранные поверхности №2318. Вариант №16. РУТ (МИИТ) 2005г.
Методические указания к выполнению домашней работы по начертательной геометрии. Домашняя работа на тему "Гранные поверхности" состоит из следующих задач: Задача №1 Построение проекций многогранника а) по заданным координатам его вершин (варианты задания 1/32) Задание №2 Построение сечения многогранника плоскостью, а) проходящей через заданную точку K и перпендикулярной к одной из плоскостей проекций ( варианты заданий 1/32) Задание №3 Определение натуральной величины сечения (варианты 1/32) ВАР
User werchak : 15 декабря 2020
550 руб.
Гранные поверхности №2318. Вариант №16. РУТ (МИИТ) 2005г.
Редуктор Ц2НШ-560 станка качалки СКДТ10-3,5-5600-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
Редуктор Ц2НШ-560 станка качалки СКДТ10-3,5-5600-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
User as.nakonechnyy.92@mail.ru : 19 февраля 2018
485 руб.
Редуктор Ц2НШ-560 станка качалки СКДТ10-3,5-5600-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
Лабораторная работа №3 по дисциплине: Метрология, стандартизация и сертификация в инфокоммуникациях. Вариант 04 (14, 24 и т.д.)
Лабораторная работа №3 «Измерение напряжения электрических сигналов» 1. Цель работы 1.1. Изучить: 1.1.1 Параметры переменных напряжений и токов; 1.1.2 Методы измерения параметров переменных напряжений и токов; 1.1.3 Принцип действия, устройство и метрологические характеристики электронных вольтметров; 1.1.4 Особенности измерения напряжения электронными вольтметрами переменного тока; 1.1.5 Источники погрешности при измерении электронными вольтметрами. 1.2. Получить навыки работы с измерительными
User Учеба "Под ключ" : 3 декабря 2023
500 руб.
promo
up Наверх