Программирование графических процессоров. Вариант 5
Состав работы
|
|
Работа представляет собой файл, который можно открыть в программе:
- Microsoft Word
Описание
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 32
2. Разделяемая память на блок (байт):1000
1. 32-х битных регистров на нить:50
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2.Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 1
2 1
3 1
4 2
5 2
6 2
7 2
8 2
9 2
10 3
11 3
12 3
13 3
14 3
15 3
16 4
17 4
18 4
19 4
20 4
21 4
22 4
23 5
24 5
25 5
26 5
27 5
28 6
29 6
30 6
31 6
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3.Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA без использования разделяемой памяти. И последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения
Дополнительная информация
Уважаемый студент дистанционного обучения,
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Контрольная работа
Оценка:Зачет
Дата оценки: 27.03.2022
Милешко Антон Владимирович
Оценена Ваша работа по предмету: Программирование графических процессоров
Вид работы: Контрольная работа
Оценка:Зачет
Дата оценки: 27.03.2022
Милешко Антон Владимирович
Похожие материалы
Программирование графических процессоров (Милешко). Вариант №5
IT-STUDHELP
: 14 февраля 2022
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №5
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор:32
2. Максимальное число блоков на мультипроцессор:16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 6553
750 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Программирование графических процессоров. Вариант №17
IT-STUDHELP
: 3 декабря 2021
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
750 руб.
«Программирование графических процессоров». Вариант №1
boeobq
: 1 декабря 2021
Тема контрольной работы: «Базовые принципы организации памяти GPU»
Некоторые выдержки из отчета приведены далее.
Graphics Processing Unit (GPU) - высокопроизводительный многопроцессорный блок, использующийся в графическом конвейере видеокарты для ускорения графических операций.
Графический процессор специализирован для интенсивных, параллельных вычислений - именно то, что представляет
собой графический рендеринг (rendering — «визуализация» Термин в компьютерной графике, обозначающий процесс
150 руб.
«Программирование графических процессоров». Билет №19
boeobq
: 1 декабря 2021
Задания билета.
Задание 1
Конфликт по банкам памяти
Задание 2
Управление памятью
Отчет содержит ответы на поставленные задания. Ответы в отчете поясняются рисунками и листингами программного кода.
Объем отчета составляет 14 станиц формата А4.
Отчет содержит 6 поясняющих рисунков.
Оформление отчета соответствует предъявляемым требованиям.
160 руб.
Программирование графических процессоров. Вариант №8
IT-STUDHELP
: 6 ноября 2019
8. Нити и блоки.
Методические указания и задание на выполнение контрольной работы
Контрольная работа выполняется в виде реферата. На титульном листе студент должен указать свои фамилию, имя, отчество и группу. При ответе на вопросы 3 – 7 студент должен обязательно указать, в каких случаях применяются данные элементы GPU. При ответе на вопросы 3 – 8 плюсом будет фрагмент кода, демонстрирующий работу с данным элементом GPU.
На титульном листе студент должен указать свои фамилию, имя, отчество и
190 руб.
Другие работы
Экзаменационная работа По дисциплине: Основы построения телекоммуникационных систем и сетей, билет 16
ннааттаа
: 1 сентября 2017
Билет № 16
Вопрос №1.
Расчет параметров поэлементной синхронизации: Погрешность синхронизации, время синхронизации, время поддержания синхронизма, вероятность срыва синхронизма.
Вопрос №2.
УПС. Назначение. Методы преобразования спектра с использованием несущей: АМ, ЧМ, ФМ. Связь ширины спектра канала и максимальной скорости модуляции. Структурные схемы, реализующие данные методы.
Вопрос №3.
Определить скорости модуляции и передачи информации, если длительность единичного интервала 5 мс, а пе
300 руб.
Пожаровзрывозащита мукомольного производств
alfFRED
: 21 марта 2014
Введение
1. Особенности распространения пожара (взрыва)
1.1. Описание расчетной ситуации
1.2. Особенности пожаровзрывоопасности горючих пылей
1.3. Расчет критериев пожарной опасности при сгорании взрывоопасной пыли
1.3.1. Расчет избыточного давления при сгорании пылевоздушной смеси в помещении
1.3.2. Расчет интенсивности теплового излучения и времени существования «Огненного шара»
1.3.3. Расчет параметров волны давления при сгорании горючей пыли
1.3.4. Расчет размеров возможного пожара и его пот
10 руб.
Гидравлика и нефтегазовая гидромеханика Хабаровск ТОГУ Задача 7 Вариант 4
Z24
: 26 ноября 2025
Вода, находящаяся под избыточным давлением р, заполняет резервуар через трубу диаметром d (рис.6). Определить минимально необходимый диаметр шарообразного поплавка, обеспечивающего автоматическое закрытие клапана при наполнении резервуара, если известны размеры a и b. Весом поплавка и рычага пренебречь.
180 руб.
Нагнетательная арматура скважинная-Приспособления для разборка центробежного секционного насоса ЦНС 180-1900-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
leha.nakonechnyy.92@mail.ru
: 20 февраля 2018
Нагнетательная арматура скважинная-Приспособления для
разборка центробежного секционного насоса ЦНС 180-1900-(Формат Компас-CDW, Autocad-DWG, Adobe-PDF, Picture-Jpeg)-Чертеж-Оборудование для добычи и подготовки нефти и газа-Курсовая работа-Дипломная работа
369 руб.