Контрольная работа По дисциплине: Программирование графических процессоров. Вариант 18
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 200
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 23
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде без использования разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 200
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 23
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц и параллельный алгоритм умножения матриц, который подразумевает, что вторая матрица хранится в транспонированном виде без использования разделяемой памяти. Реализуйте последовательный алгоритм умножения матриц. Сравните время работы умножения по схеме (параллельное транспонирование + параллельное умножение) и время работы последовательного умножения матриц. Рассчитайте коэффициент ускорения.
Дополнительная информация
Сдано в 2023 на отлично
Похожие материалы
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 18
Roma967
: 20 июля 2024
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант №18
IT-STUDHELP
: 19 декабря 2022
Контрольная работа
Вариант №18
Задание1.Данаспецификацияграфического процессора:
1. Максимальноечисловарповнамультипроцессор:64
2. Максимальноечислоблоковнамультипроцессор:16
3. Максимальноеколичество32-х битных регистровнамультипроцессор: 65536
4. Максимальноеколичество32-х битныхрегистровнаблок:65536
5. Максимальноеколичество32-х битныхрегистровнанить:255
6. Размерразделяемойпамятимультипроцессора(байт): 32768
7. Размерразделяемойпамятиблока(байт):24576 Параметры запускаемой программы:
1. Ра
750 руб.
Программирование графических процессоров. Контрольная работа.
sibguter
: 17 января 2019
Контрольная работа выполняется в виде реферата. На титульном листе студент должен указать свои фамилию, имя, отчество и группу. При ответе на вопросы 3 – 7 студент должен обязательно указать, в каких случаях применяются данные элементы GPU. При ответе на вопросы 3 – 8 плюсом будет фрагмент кода, демонстрирующий работу с данным элементом GPU.
Список вопросов:
Базовые принципы организации памяти GPU.
Различия архитектур GPU и CPU.
Константная память.
Глобальная память.
Разделяемая память.
Текстурн
199 руб.
Контрольная работа. Программирование графических процессоров
Axi0ma
: 14 июня 2018
умножение матриц на CUDA
1. с использованием глобальной памяти
2. с использованием shared memory
3. с использованием shared memory без конфликта банков
сравнить время для этих трех случаев используя профайлер nvprof
обнаружить конфликт банков для 2 случая с помощью профайлера
200 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 3
Учеба "Под ключ"
: 14 октября 2025
Вариант 3
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры з
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 04
xtrail
: 24 августа 2025
Вариант 4
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 16
Учеба "Под ключ"
: 16 июля 2025
Выполнение контрольной работы
Вариант 16
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (ба
800 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 8
Учеба "Под ключ"
: 7 июля 2025
Расчет номера варианта
Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица.
Нумерация букв алфавита:
А=1, Б=2, В=3, Г=4, Д=5, Е=6, Ё=7, Ж=8, З=9, И=10, Й=11, К=12, Л=13, М=14, Н=15, О=16, П=17, Р=18, С=19, Т=20, У=21, Ф=22, Х=23, Ц=24, Ч=25
800 руб.
Другие работы
Зачетная работа по дисциплине: Сети доступа. Билет №10
SibGOODy
: 10 июля 2023
Билет №10
1. Классификация сетей доступа. По назначению
сетей
2. Технологии IEEE 802. Wi-Fi
300 руб.
Теория систем и системный анализ. Лабораторные работы №1,2,3 (2 вариант)
Milka189904
: 22 мая 2022
Лабораторная работа №1. Построение модели "чёрный ящик".
Цель работы: освоить построение модели типа "чёрный ящик".
Варианты систем для выполнения Лабораторной работы:
2) Материнская плата;
Лабораторная работа №2. Построение модели «состав системы».
Цель работы: освоить процесс построения модели «состав системы».
Варианты систем для выполнения Лабораторной работы:
2) Материнская плата;
Лабораторная работа №3. Построение модели «структура системы».
Цель работы: освоить процесс построения модел
300 руб.
Микроэкономика. Экзамен, 15-й билет
Margo777
: 20 ноября 2013
Выберите правильный ответ:
1. Если правительство установит нижний предел цены в Р* для ситуации, изображенной на графике, то в результате:
a) Количество предлагаемого товара сократится
б) Возникнет избыток товара
в) Кривая предложения сдвинется вправо
г) Произойдет все вышеперечисленное
д) Ничего из указанного не произойдет
Ответ: д), так как установилась равновесная цена, ни избытка, ни недостатка в товаре не будет.
2. Деятельность спекулянтов:
a) увеличивает риск для законного предпринимат
100 руб.
Премии качества
Slolka
: 14 октября 2013
Ввведние.
Наиболее престижными премиями качества являются: приз Деминга (Deming Application Prize — DAP) в Японии, национальная награда за качество Мэлкома Бэлдриджа (Malcom Baldrige National Quality Award — MBNQA) в США и Европейская награда за качество (European Quality Award — EQA) для компаний Европы.
Прежде чем рассматривать эти премии качества, следует обратить внимание на различный подход к вопросу качества в Европе, США и Японии. В Европе большое внимание уделяется в настоящее время Си
10 руб.