Программирование графических процессоров. Вариант 5
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Контрольная работа
Оценка:Зачет
Дата оценки: 27.03.2022
Милешко Антон Владимирович
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Контрольная работа
Оценка:Зачет
Дата оценки: 27.03.2022
Милешко Антон Владимирович
Похожие материалы
Программирование графических процессоров (Милешко). Вариант №5
IT-STUDHELP
: 14 февраля 2022
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №5
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 6553
750 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров. Вариант №17
IT-STUDHELP
: 3 декабря 2021
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
750 руб.
«Программирование графических процессоров». Вариант №1
boeobq
: 1 декабря 2021
Тема контрольной работы: «Базовые принципы организации памяти GPU»
Некоторые выдержки из отчета приведены далее.
Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций.
Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет
собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
150 руб.
«Программирование графических процессоров». Билет №19
boeobq
: 1 декабря 2021
Задания билета.
Задание 1
Конфликт по банкам памяти
Задание 2
Управление памятью
Отчет содержит ответы на поставленные задания. Ответы в отчете поясняются рисунками и листингами программного кода.
Объем отчета составляет 14 станиц формата А4.
Отчет содержит 6 поясняющих рисунков.
Оформление отчета соответствует предъявляемым требованиям.
160 руб.
Программирование графических процессоров. Вариант №8
IT-STUDHELP
: 6 ноября 2019
8. Нити и блоки.
Методические указания и задание на выполнение контрольной работы
Контрольная работа выполняется в виде реферата. На титульном листе студент должен указать свои фамилию, имя, отчество и группу. При ответе на вопросы 3 – 7 студент должен обязательно указать, в каких случаях применяются данные элементы GPU. При ответе на вопросы 3 – 8 плюсом будет фрагмент кода, демонстрирующий работу с данным элементом GPU.
На титульном листе студент должен указать свои фамилию, имя, отчество и
190 руб.
Другие работы
По двум видам модели построить третий. Упражнение №40. Вариант №13
bublegum
: 15 февраля 2021
Упражнение 40 Вариант 13
По двум видам модели построить третий. Выполнить необходимые разрезы. Поставить размеры.
3d модель и чертеж (все на скриншотах изображено) выполнены в компасе 3D v13, возможно открыть в 14,15,16,17,18,19 и выше версиях компаса.
Просьба по всем вопросам писать в Л/С. Отвечу и помогу.
100 руб.
АФУ СВЧ. Контрольная работа. Вариант 02
hedgehog
: 21 октября 2014
Задача No 1
Линейная антенная решетка состоит из n=14 ненаправленных (изотропных) излучателей, которые расположены на расстоянии d1 / λ = 0,3 друг от друга. Излучатели питаются синфазными токами одинаковой амплитуды.
d1/λ 0,3
n 14
Ψ1 ̊ 10
Задача No 2
Рис. 3. Пирамидальная рупорная антенна
Пирамидальная рупорная антенна (рис.2) имеет оптимальную длину и возбуждается прямо-угольным волноводом на частоте f = 5 ГГц. Ширина диаграммы направленности в плоскостях Е и Н одинакова, а коэффициент нап
250 руб.
ОСТ 1 00243-93. Трубопроводы летательных аппаратов. Нормы рабочих давлений
Lokard
: 29 июня 2013
Настоящий стандарт устанавливает нормы рабочих давлений в бесшовных трубопроиодах из стали 12Х18Н10Т по ГОСТ 19277, стали 08Х21Г11АН6-П (ВКС53-П) по ТУ 14-3-1870-92, титанового сплава ПТ-7М по ГОСТ 22897, алюминиевого сплава АМг2М по ОСТ 1 90038, работающих при внутреннем давлении.
10 руб.
Проблемно-ориентированные вычислительные системы 3. Разработка программных единиц на языке PL/SQL
Aronitue9
: 20 марта 2012
1. Создать процедуру, удаляющую запасы заданной группы товара со склада.
Создать входной параметр для наименования группы товара.
Организовать контроль правильности входных параметров.
Для группы определить количество товарных позиций и записать все сведения об удаляемом товаре в промежуточную таблицу.
Сформировать сообщение на экран о количестве удаленных строк.
Обработать возможные исключительные ситуации.
2. Перечислить особенности взаимодействия с сервером в PL/SQL.
20 руб.