Программирование графических процессоров. Вариант №17
Состав работы
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 100
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 32
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 19
1 54
2 116
3 244
4 1
5 23
6 52
7 84
8 117
9 149
10 179
11 214
12 19
13 52
14 116
15 244
16 19
17 53
18 115
19 244
20 500
21 1012
22 2035
23 4085
24 244
25 277
26 309
27 341
28 372
29 406
30 436
31 469
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц без использования разделяемой памяти. Реализуйте последовательный алгоритм транспонирования матриц. Сравните время работы алгоритмов на данных различных размеров, рассчитайте коэффициент ускорения.
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 100
2. Разделяемая память на блок (байт): 1000
1. 32-х битных регистров на нить: 32
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 19
1 54
2 116
3 244
4 1
5 23
6 52
7 84
8 117
9 149
10 179
11 214
12 19
13 52
14 116
15 244
16 19
17 53
18 115
19 244
20 500
21 1012
22 2035
23 4085
24 244
25 277
26 309
27 341
28 372
29 406
30 436
31 469
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм транспонирования матриц без использования разделяемой памяти. Реализуйте последовательный алгоритм транспонирования матриц. Сравните время работы алгоритмов на данных различных размеров, рассчитайте коэффициент ускорения.
Дополнительная информация
Оценка: Зачет
Дата оценки: 03.12.2021
Помогу с вашим вариантом, другой работой, дисциплиной или онлайн-тестом.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 03.12.2021
Помогу с вашим вариантом, другой работой, дисциплиной или онлайн-тестом.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров. Вариант 5
Zla
: 29 марта 2022
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1
650 руб.
«Программирование графических процессоров». Вариант №1
boeobq
: 1 декабря 2021
Тема контрольной работы: «Базовые принципы организации памяти GPU»
Некоторые выдержки из отчета приведены далее.
Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций.
Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет
собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
150 руб.
«Программирование графических процессоров». Билет №19
boeobq
: 1 декабря 2021
Задания билета.
Задание 1
Конфликт по банкам памяти
Задание 2
Управление памятью
Отчет содержит ответы на поставленные задания. Ответы в отчете поясняются рисунками и листингами программного кода.
Объем отчета составляет 14 станиц формата А4.
Отчет содержит 6 поясняющих рисунков.
Оформление отчета соответствует предъявляемым требованиям.
160 руб.
Программирование графических процессоров. Вариант №8
IT-STUDHELP
: 6 ноября 2019
8. Нити и блоки.
Методические указания и задание на выполнение контрольной работы
Контрольная работа выполняется в виде реферата. На титульном листе студент должен указать свои фамилию, имя, отчество и группу. При ответе на вопросы 3 – 7 студент должен обязательно указать, в каких случаях применяются данные элементы GPU. При ответе на вопросы 3 – 8 плюсом будет фрагмент кода, демонстрирующий работу с данным элементом GPU.
На титульном листе студент должен указать свои фамилию, имя, отчество и
190 руб.
Программирование графических процессоров. Билет №2.
MayaMy
: 23 февраля 2019
Уважаемый студент, дистанционного обучения,
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Экзамен
Оценка:Отлично
Дата оценки: 17.01.2019
Рецензия:Уважаемая,
Ваша работа оценена на "отлично".
Милешко Антон Владимирович
450 руб.
Другие работы
Аудиовизуальные средства мультимедиа. Вариант 09
alexkrt
: 16 июня 2015
1.5.20. Перечислите преимущества ЧМ – растрирования.
1.7.2. Какие существуют технологии сканирования изображения? Опишите сканеры технологии PMT.
2.15.17. Каковы особенности стандарта MPEG-4?
3.21.2. Поясните алгоритм обработки изображения по стандарту JPEG.
100 руб.
СИБГУТИ. ТЭС. Теория электрической связи. Лабораторная работа №3
Alexis87
: 9 сентября 2010
ИССЛЕДОВАНИЕ СОГЛАСОВАННОГО ФИЛЬТРА ДИСКРЕТНЫХ СИГНАЛОВ ИЗВЕСТНОЙ ФОРМЫ.
Цель работы.
Экспериментальное исследование характеристик сложных дискретных сигналов и особенностей их приёма согласованным фильтром.
Лабораторное задание.
1. Ознакомиться с особенностями экспериментального исследования на ЭВМ приёма дискретных сигналов согласованным фильтром (СФ).
2. Исследовать связь между импульсной характеристикой СФ и видом сигнала, с которым он должен быть согласован.
3. Исследовать форму с
150 руб.
Контрольная работа по дисциплине: Функциональное и логическое программирование. Вариант №06.
ДО Сибгути
: 16 марта 2018
Вариант задачи выбирается по последней цифре пароля. Программы должны быть написаны на языке двух языках: Лисп и Пролог. В программе на Прологе исходные данные должны вводиться с клавиатуры, цель - внутренняя.
Задание. Вариант №6.
Сформируйте новый список, включающий в себя без повторений все элементы двух списков (объединение множеств).
Например: На Лиспе для списков (1 2 3 5) и (6 4 1 8 3) результатом будет список
(2 5 6 4 1 8 3).
99 руб.
Операционные системы реального времени. Лабораторная работа + Контрольная работа. Вариант №3
Cole82
: 5 декабря 2016
Лабораторная работа
по материалу первой главы курса "Процессы и нити"
В данной лабораторной работе предлагается разработать систему из двух программ: программа рисования, работающая в графическом режиме с помощью библиотеки wingraph, и запускающее её, а затем управляющее ей консольное приложение. Всё это делается по аналогии с примерами, рассмотренными в лекционном материале. Варианты заданий уточняются ниже. Во всех заданиях движение фигур должно реализовываться отдельными нитями. Рекомен
21 руб.