Контрольная работа по курсу «Программирование графических процессоров» Вариант №2
Состав работы
|
|
|
|
|
|
|
|
Работа представляет собой zip архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 5000
1. 32-х битных регистров на нить: 10
Рассчитайте теоретическую заполняемость? Чем она ограничена?
=====================================
Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
10 11
11 12
12 13
13 14
14 15
15 16
16 17
17 18
18 19
19 20
20 21
21 22
22 23
23 24
24 25
25 26
26 27
27 28
28 29
29 30
30 31
31 32
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
=====================================
Задание 3.
Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA с использованием разделяемой памяти. Проанализируйте, реализованный алгоритм с точки зрения эффективности доступа к разделяемой памяти.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 5000
1. 32-х битных регистров на нить: 10
Рассчитайте теоретическую заполняемость? Чем она ограничена?
=====================================
Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
10 11
11 12
12 13
13 14
14 15
15 16
16 17
17 18
18 19
19 20
20 21
21 22
22 23
23 24
24 25
25 26
26 27
27 28
28 29
29 30
30 31
31 32
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
=====================================
Задание 3.
Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA с использованием разделяемой памяти. Проанализируйте, реализованный алгоритм с точки зрения эффективности доступа к разделяемой памяти.
Дополнительная информация
Контрольная работа
Оценка: Зачет
Год сдачи: 2022
Уважаемый , Милешко Антон Владимирович
Оценка: Зачет
Год сдачи: 2022
Уважаемый , Милешко Антон Владимирович
Похожие материалы
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 2
Roma967
: 20 июля 2024
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
800 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров. Вариант 5
Zla
: 29 марта 2022
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1
650 руб.
Программирование графических процессоров. Вариант №17
IT-STUDHELP
: 3 декабря 2021
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
750 руб.
«Программирование графических процессоров». Вариант №1
boeobq
: 1 декабря 2021
Тема контрольной работы: «Базовые принципы организации памяти GPU»
Некоторые выдержки из отчета приведены далее.
Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций.
Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет
собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
150 руб.
«Программирование графических процессоров». Билет №19
boeobq
: 1 декабря 2021
Задания билета.
Задание 1
Конфликт по банкам памяти
Задание 2
Управление памятью
Отчет содержит ответы на поставленные задания. Ответы в отчете поясняются рисунками и листингами программного кода.
Объем отчета составляет 14 станиц формата А4.
Отчет содержит 6 поясняющих рисунков.
Оформление отчета соответствует предъявляемым требованиям.
160 руб.
Другие работы
Проект завода по производству блоков из неавтоклавного газобетона, мощностью 25000 м3год
JackSkipjack
: 25 ноября 2012
Введение
1. Номенклатура выпускаемой продукции
2. Сырьевые компоненты
3. Способы производства неавтоклавного газобетона
Неавтоклавный газобетон относится к ячеистым бетонам и представляет собой долговечный искусственный цементный камень с равномерно распределенными по объему сферическими порами диаметром примерно до 0,5–3 мм.
В основе производства газобетона лежит процесс газообразования. От его динамики, повторяемости, состава сырьевых компонентов, а также температурных условий газообразующего
Реферат: История Таганского района
evelin
: 26 августа 2013
Таганский район охватывает юго-восточную часть города, которая в далеком прошлом именовалась Заяузьем.
Район Заяузья заселялся и рос по мере роста и развития основного ядра города. Начало Москвы было положено селением на Боровицком холме, где затем вырос Московский Кремль. Позже к Кремлю примкнули Китай-город и Белый-город.
Год от года всё большая часть горожан расселялась вне Кремля, в самом низу холма – на посаде. Так постепенно в XI-XVI веках складывался Большой или Великий посад. В XIV веке
5 руб.
Архитектура Древнего Рима
Lokard
: 28 августа 2013
СОДЕРЖАНИЕ
ВВЕДЕНИЕ
1.СРЕДСТВА РАЗМЕЩЕНИЯ В РИМСКОЙ ИМПЕРИИ
1.1 ИСТОРИЯ РАЗВИТИЯ ГОСТЕПРИИМСТВА. КАК ПОЯВИЛАСЬ ПЕРВАЯ ГОСТИНИЦА?
2. АРХИТЕКТУРНЫЕ СООРУЖЕНИЯ ДРЕВНЕГО РИМА
3. УБРАНСТВО ДРЕВНЕГО РИМА
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ
ВВЕДЕНИЕ
Люди жили в разные эпохи античности и были неравны по происхождению, социальному положению, образованию, характеру. Античное наследие «золотой цепью» связывало воедино времена и народы; наследие, без которого не мог обойтись ни один последующий век.
20 руб.
Курсовая работа по дисциплине: «Операционные системы». Вариант № 1
xtrail
: 2 апреля 2013
Необходимо написать программу, реализующую параллельную работу нескольких процессов. Каждый процесс может состоять из одного или нескольких потоков. Любой из потоков, работающих в составе этих процессов, может быть приостановлен и вновь запущен некоторой определенной клавишей (можно использовать буквенные или цифровые клавиши). Нажатия клавиш обрабатывать с помощью прерывания от клавиатуры.
Задания:
1. Два потока: первый читает информацию из файла (например, стихи или текст про-граммы) в буфер,
500 руб.