Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Пояснения по выполнению заданий.
Контрольная работа состоит из трёх заданий.
В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.
Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.
В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).
Для того чтобы контрольная работа была зачтена нужно выполнить самостоятельно все три задания, допускаются небольшие недочёты.
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Контрольная работа состоит из трёх заданий.
В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.
Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается. Кроме ответа на вопрос, указанный в задании, нужно указать для каждого четырёхбайтового слова, в каком банке данных оно находится.
В третьем задании нужно реализовать один или два алгоритма и проанализировать их с точки зрения производительности или эффективности использования памяти. Все параллельные алгоритмы реализуются с применением технологии CUDA. Ответом на это задания является код рабочей программы/программ, результаты исследования (с указанием оборудования на котором проводились исследования и описанием данных). Если в задании нужно исследовать эффективность доступа к памяти при помощи утилиты nvprof, нужно подобрать подходящие для этого метрики профилирования. В том случае если эффективность доступа к памяти ниже 75%, нужно сформулировать причину низкой эффективности доступа к памяти. Если нужно сравнить производительность двух алгоритмов, следует указать абсолютное время выполнения каждого алгоритма и рассчитать коэффициент ускорения. Все исследования должны проводиться на данных размером не менее 4.500.000 четырёхбайтовых слов (или эквивалент для другого типа данных).
Для того чтобы контрольная работа была зачтена нужно выполнить самостоятельно все три задания, допускаются небольшие недочёты.
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Дополнительная информация
Оценка: Зачет
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32
750 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 3
Учеба "Под ключ"
: 14 октября 2025
Вариант 3
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры з
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 04
xtrail
: 24 августа 2025
Вариант 4
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 16
Учеба "Под ключ"
: 16 июля 2025
Выполнение контрольной работы
Вариант 16
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (ба
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 8
Учеба "Под ключ"
: 7 июля 2025
Расчет номера варианта
Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.
Нумерация букв алфавита:
А=1, Б=2, В=3, Г=4, Д=5, Е=6, Ё=7, Ж=8, З=9, И=10, Й=11, К=12, Л=13, М=14, Н=15, О=16, П=17, Р=18, С=19, Т=20, У=21, Ф=22, Х=23, Ц=24, Ч=25
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 14
xtrail
: 30 июня 2025
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №09
holm4enko87
: 29 апреля 2025
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
400 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 11
Учеба "Под ключ"
: 27 января 2025
Вариант №11
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаем
800 руб.
Другие работы
Контрольная работа по дисциплине "Электротехника и электроника". Вариант №1. (5-й семестр)
xtrail
: 18 сентября 2013
Задача 1.
По выходным характеристикам полевого транзистора построить передаточную характеристику при указанном напряжении стока. Определить дифференциальные параметры , , полевого транзистора и построить их зависимости от напряжения на затворе.
Сделать выводы о зависимости параметров транзистора от режима работы.
Исходные данные для задачи: транзистор КП302А, 12 В, -8 В.
Задача 2.
Используя характеристики заданного биполярного транзистора определить h-параметры биполярного транзистора и
180 руб.
Насос НПС 65/35-500, Ротор в сборе, Модернизация уплотнения ротора, Деталировка-Чертежи-Графическая часть-Курсовая работа-Дипломная работа-Оборудование для добычи и подготовки нефти и газа
https://vk.com/aleksey.nakonechnyy27
: 17 мая 2016
Насос НПС 65/35-500, Ротор в сборе, Модернизация уплотнения ротора, Деталировка-Чертежи-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
1392 руб.
Арматура фонтанная на рабочее давление 19 МПа Сборочный чертеж-ЗМС 65 21 Сборочный чертеж-Катушка стволовая-Тройник 65-Спецификация-Деталировка-Сборочный чертеж-Чертежи-Графическая часть-Оборудование транспорта и хранения нефти и газа-Курсовая работа-Дипл
lesha.nakonechnyy.92@mail.ru
: 20 сентября 2023
Арматура фонтанная на рабочее давление 19 МПа
Сборочный чертеж-ЗМС 65 21 Сборочный чертеж-Катушка
стволовая-Тройник 65-Спецификация-Деталировка-Сборочный чертеж-Чертежи-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Оборудование транспорта и хранения нефти и газа-Курсовая работа-Дипломная работа
557 руб.
Понятие аудит. Цели аудиторской деятельности
Aronitue9
: 8 января 2012
Оглавление:
Введение.
Понятие «аудит». Цели аудиторской деятельности.
Сущность и содержание аудита. Возникновение аудита.
Цели и задачи аудита и аудиторской деятельности.
Классификация и виды аудиторской деятельности.
Выводы по Главе I.
Принципы аудита.
Принципы аудита.
Услуги, сопутствующие аудиту.
Субъекты обязательного аудита.
Ответственность экономического субъекта за уклонение от проведения обязательной аудиторской проверкой.
Выводы по Главе II.
Заключение.
20 руб.