Программирование графических процессоров (Милешко). Вариант №5

Состав работы

material.view.file_icon 6A1861DF-417B-4E2E-BDC5-7BE5B03E6470.docx
Работа представляет собой файл, который можно открыть в программе:
  • Microsoft Word

Описание

Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №5


Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?



Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6

Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?



Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения.

Дополнительная информация

Оценка: Зачет
Дата оценки: 14.02.2022

Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Онлайн Тест 7 по дисциплине: Программирование графических процессоров (Милешко).
Вопрос №1 Mapped memory – это… Динамическая память, выделенная на хосте. Динамическая память, выделенная на устройстве. Некэшируемая pinned память. Pinned память доступная на всех устройствах системы сразу после выделения. Pinned память отображённая в адресное пространство устройства. Вопрос №2 Дана спецификация графического процессора: 1. 1. Максимальное число варпов на мультипроцессор:32 2. 2. Максимальное число блоков на мультипроцессор:16 3. 3. Максимальное количество
User IT-STUDHELP : 1 октября 2023
750 руб.
promo
Онлайн Тест 9 по дисциплине: Программирование графических процессоров (Милешко).
Вопрос №1 Дана спецификация графического процессора: 1. 1. Максимальное число варпов на мультипроцессор:32 2. 2. Максимальное число блоков на мультипроцессор:16 3. 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. 4. Максимальное количество 32-х битных регистров на блок: 65536 5. 5. Максимальное количество 32-х битных регистров на нить: 255 6. 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. 7. Размер разделяемой памяти блока
User IT-STUDHELP : 1 октября 2023
750 руб.
promo
Онлайн Тест 8 по дисциплине: Программирование графических процессоров (Милешко).
Вопрос №1 Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается. Номер нити Номер слова Какая степень конфликта банков данных в данном доступе к разделяемой памяти? Конфликтов нет. Вторая степень. Четвёртая степень. Восьмая степень. Шестнадцатая степень. Тридцать
User IT-STUDHELP : 1 октября 2023
750 руб.
promo
Программирование графических процессоров. Вариант 5
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор:32 2. Максимальное число блоков на мультипроцессор:16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1
User Zla : 29 марта 2022
650 руб.
Программирование графических процессоров Лабораторная 1
Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения Ax
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 2
Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реал
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров Лабораторная 3
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером
User svladislav987 : 28 августа 2023
200 руб.
Программирование графических процессоров. Вариант №17
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы:
User IT-STUDHELP : 3 декабря 2021
750 руб.
promo
Особенности получения и применение интерферонов
Введение Интерфероны представляют собой белковые молекулы с молекулярной массой от 15000 до 21000 дальтон, продуцируемые и секретируемые клетками в ответ на вирусную инфекцию или другие возбудители. Интерфероны (ИФН) — группа аутогенных гликопротеинов, биомеханизм действия которых связан с одновременным противовирусным эффектом - активацией клеточных генов, в результате чего синтезируются белки, ингибирующие синтез вирусной ДНК (РНК) и обладающие иммуномодулирующим эффектом — способностью усилив
User Aronitue9 : 2 февраля 2013
Основы теории цепей. Вариант №3
Кр: Задание 1 1. Рассчитать схему методом наложения. 2. Составить систему уравнений по методу законов Кирхгофа. 3. Рассчитать схему методом узловых напряжений. 4. Проверить баланс мощности. Задание 2 1. Составить систему уравнений по методу законов Кирхгофа. 2. Рассчитать ток в L1 методом контурных токов. 3. Рассчитать ток в L1 методом эквивалентного генератора. Лабораторная работа No 1 Законы Ома и Кирхгофа в резистивных цепях 1. Цель работы: Изучение, исследование и проверка законов Ома
User Anastas31 : 6 июля 2020
250 руб.
Комплексный чертеж детали Башмак
Вариант 4 Лист 7, Комплексный чертеж детали Целевое назначение листа: освоить правила и методы изображения разрезов, сечений деталей на чертежах всех отраслей промышленности (ГОСТ 2.305— 68); закрепить приемы выполнения технического рисунка предмета. Есть чертеж и 3д модель Сделано в 16 компасе, дополнительно сохранено в пдф и джпг Также файлы компаса можно просматривать и сохранять в нужный формат бесплатной программой КОМПАС-3D Viewer. Если есть какие-то вопросы или нужно другой вариант, пиши
User Laguz : 17 ноября 2024
120 руб.
Комплексный чертеж детали Башмак
Экзамен по дисциплине: «Отечественная история». Вариант №6(1-й семестр)
ВОПРОСЫ К ЭКЗАМЕНУ ПО ОТЕЧЕСТВЕННОЙ ИСТОРИИ 1 Отечественная война 1812 г. и русское общество. В русском обществе между тем нарастало раздражение, шли разговоры об измене. В армии разрастался конфликт между Барклаем де Толли и Багратионом, призывавшим остановить отступление и дать Наполеону генеральное сражение. Кутузов принял трудное решение. Отступление было прекращено, армия начала подготовку к генеральному сражению. Оно состоялось 26 августа (7 сентября) в 110 км от Москвы у села Бородино. В
User daffi49 : 1 января 2014
60 руб.
up Наверх