Программирование графических процессоров. Вариант №17
Состав работы
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 100
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 32
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 19
1 54
2 116
3 244
4 1
5 23
6 52
7 84
8 117
9 149
10 179
11 214
12 19
13 52
14 116
15 244
16 19
17 53
18 115
19 244
20 500
21 1012
22 2035
23 4085
24 244
25 277
26 309
27 341
28 372
29 406
30 436
31 469
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц без использования разделяемой памяти. Реализуйте последовательный алгоритм транспонирования матриц. Сравните время работы алгоритмов на данных различных размеров, рассчитайте коэффициент ускорения.
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 100
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 32
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 19
1 54
2 116
3 244
4 1
5 23
6 52
7 84
8 117
9 149
10 179
11 214
12 19
13 52
14 116
15 244
16 19
17 53
18 115
19 244
20 500
21 1012
22 2035
23 4085
24 244
25 277
26 309
27 341
28 372
29 406
30 436
31 469
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц без использования разделяемой памяти. Реализуйте последовательный алгоритм транспонирования матриц. Сравните время работы алгоритмов на данных различных размеров, рассчитайте коэффициент ускорения.
Дополнительная информация
Оценка: Зачет
Дата оценки: 03.12.2021
Помогу с вашим вариантом, другой работой, дисциплиной или онлайн-тестом.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 03.12.2021
Помогу с вашим вариантом, другой работой, дисциплиной или онлайн-тестом.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров. Вариант 5
Zla
: 29 марта 2022
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1
650 руб.
«Программирование графических процессоров». Вариант №1
boeobq
: 1 декабря 2021
Тема контрольной работы: «Базовые принципы организации памяти GPU»
Некоторые выдержки из отчета приведены далее.
Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций.
Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет
собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
150 руб.
«Программирование графических процессоров». Билет №19
boeobq
: 1 декабря 2021
Задания билета.
Задание 1
Конфликт по банкам памяти
Задание 2
Управление памятью
Отчет содержит ответы на поставленные задания. Ответы в отчете поясняются рисунками и листингами программного кода.
Объем отчета составляет 14 станиц формата А4.
Отчет содержит 6 поясняющих рисунков.
Оформление отчета соответствует предъявляемым требованиям.
160 руб.
Программирование графических процессоров. Вариант №8
IT-STUDHELP
: 6 ноября 2019
8. Нити и блоки.
Методические указания и задание на выполнение контрольной работы
Контрольная работа выполняется в виде реферата. На титульном листе студент должен указать свои фамилию, имя, отчество и группу. При ответе на вопросы 3 – 7 студент должен обязательно указать, в каких случаях применяются данные элементы GPU. При ответе на вопросы 3 – 8 плюсом будет фрагмент кода, демонстрирующий работу с данным элементом GPU.
На титульном листе студент должен указать свои фамилию, имя, отчество и
190 руб.
Программирование графических процессоров. Билет №2.
MayaMy
: 23 февраля 2019
Уважаемый студент, дистанционного обучения,
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Экзамен
Оценка:Отлично
Дата оценки: 17.01.2019
Рецензия:Уважаемая,
Ваша работа оценена на "отлично".
Милешко Антон Владимирович
450 руб.
Другие работы
Основы визуального программирования. Лабораторная работа № 2 Для всех вариантов
SNF
: 2 января 2017
Лабораторная работа № 2
Тема: Компоненты MainMenu, PopupMenu, Memo, OpenDialog, SaveDialog.
Создание вложенного динамического меню.
Задания
Задание 1:
Создание простейшего редактора, который работает с файлом memos.txt, находящемся в текущей папке.
1. Создайте главное меню – компонент MainMenu - с пунктами:
File Help
New About… F1
Open… F3
Close
Save F2
Save As…
Exit Alt+X
1.1. Создайте обработчики событий, поступающих от объектов:
Exit1 – закрытие фор
25 руб.
Экономическая оценка проектируемого устройства прибора
Qiwir
: 30 декабря 2014
СОДЕРЖАНИЕ:
1. Задачи курсового проектирования.
1.1 Введение.
2. Выбор элементов схемы.
2.1 Экономическая оценка проектируемого устройства (прибора)
3. Расчет технологичности конструкции
3.1 Оценка качества компоновки
3.2 Основные показатели экономичности конструкций гибридных интегральных схем
3.3 Технико-экономическая характеристика проектируемого изделия
3.4 Расчет полной себестоимости изготовления (сборки, монтажа) прибора
4 Методика проведения отдельных расчетов элементов полной се
10 руб.
Лабораторная работа №1 по предмету "Специальные главы математического анализа". Вариант 2
dipost
: 18 мая 2014
1. Исследовать сходимость числового ряда.
2. Найти интервал сходимости степенного ряда
3. Вычислить определенный интеграл с точностью до 0.001, разложив подынтегральную функцию в степенной ряд и затем проинтегрировать его почленно.
4. Разложить данную функцию f(x) в ряд Фурье
5. Найти общее решение дифференциального уравнения.
6. Найти частное решение дифференциального уравнения , удовлетворяющее начальным условиям
99 руб.
Тепломассообмен ТГАСУ 2017 Задача 3 Вариант 13
Z24
: 3 февраля 2026
Определение времени нагревания вала до заданной температуры
Длинный стальной вал диаметром d = 2r0, который имел температуру t0, °C, был помещен в печь с температурой tж, ºС. Определить время τ, необходимое для нагрева вала, если нагрев считается законченным, когда температура на оси вала станет равной tr=0, ºC. Определить также температуру на поверхности вала tr=ro в конце нагрева.
Коэффициент теплопроводности и температуропроводности стали равны соответственно λ и a. Коэффициент теплоотд
200 руб.