Контрольная и Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
Состав работы
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Excel
- Microsoft Word
Описание
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения AxV, где A – матрица, V – вектор.
3. Реализуйте параллельный алгоритм умножения VxA, где A – матрица, V – вектор.
4. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
5. Прочитайте главу "Профилирование программ", ответьте на контрольные вопросы в конце главы (ответы на контрольные вопросы не нужно включать в отчёт по лаборатор-ной работе).
6. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффек-тивность доступа к глобальной памяти.
Лабораторная работа №2
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффективность доступа к глобальной памяти.
Лабораторная работа №3
Задание
1. Прочитайте главы теоретического материала под названиями "Pinnedmemory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 312
2. Разделяемая память на блок (байт): 5500
1. 32-х битных регистров на нить: 60
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 62
2 125
3 252
4 1
5 31
6 61
7 92
8 126
9 157
10 189
11 222
12 28
13 60
14 125
15 252
16 28
17 61
18 124
19 252
20 509
21 1020
22 2044
23 4093
24 253
25 285
26 318
27 349
28 381
29 414
30 445
31 477
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения.
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения AxV, где A – матрица, V – вектор.
3. Реализуйте параллельный алгоритм умножения VxA, где A – матрица, V – вектор.
4. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
5. Прочитайте главу "Профилирование программ", ответьте на контрольные вопросы в конце главы (ответы на контрольные вопросы не нужно включать в отчёт по лаборатор-ной работе).
6. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффек-тивность доступа к глобальной памяти.
Лабораторная работа №2
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффективность доступа к глобальной памяти.
Лабораторная работа №3
Задание
1. Прочитайте главы теоретического материала под названиями "Pinnedmemory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Дополнительная информация
Оценка: Зачет
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Дата оценки: 14.05.2022
Помогу с вашим онлайн тестом, другой работой или дисциплиной.
E-mail: sneroy20@gmail.com
E-mail: ego178@mail.ru
Похожие материалы
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте паралле
900 руб.
Онлайн Тест 3 по дисциплине: Программирование графических процессоров.
IT-STUDHELP
: 19 декабря 2022
Вопрос №1
Callbackфункция – это функция…
Любая функция, выполняемая хостом.
Функция, выполняемая хостом, которая блокирует выполнение функции-ядра в любой момент времени.
Функция, выполняемая устройством.
Функция, выполняемая устройством, которая вызывается внутри функции-ядра.
Функция, выполняемая хостом, блокирующая выполнение потока.
Вопрос №2
Что делает функция tex1Dfetch?
Связывает линейную область памяти с одномерной текстурой.
Связывает линейную область памяти с двумерной т
750 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Пояснения по выполнению заданий.
Контрольная работа состоит из трёх заданий.
В первом задании контрольной работы дана спецификация мультипроцессора и параметры запуска функции-ядра. Требуется рассчитать теоретическую заполняемость мультипроцессора и указать ограничивающий её фактор, если он есть. При сдаче работы в этом задании кроме ответа на вопрос нужно подробно описать ход решения задачи.
Во втором задании дана таблица, указывающая какая нить варпа к какому четырёхбайтовому слову обращается.
750 руб.
Контрольная работа по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Контрольная работа по курсу
«Программирование графических процессоров»
Вариант №15
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32
750 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
IT-STUDHELP
: 3 декабря 2021
Лабораторная работа 1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельны
900 руб.
Программирование графических процессоров Лабораторная 2
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти.
3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000).
4. Проанализируйте, реал
200 руб.
Программирование графических процессоров Лабораторная 3
svladislav987
: 28 августа 2023
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером
200 руб.
Программирование графических процессоров Лабораторная 1
svladislav987
: 28 августа 2023
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельный алгоритм умножения Ax
200 руб.
Другие работы
Групповая динамика в организации формальные и неформальные группы
Lokard
: 31 марта 2014
Группу принято считать важной единицей социологического анализа при изучении организационного поведения. Групповая динамика изучает взаимосвязи и силы, действующие между членами группы в рамках социальной ситуации. При изучении организационного поведения, исходя из этого представления, акцент делается на динамике членов формальных и неформальных рабочих групп, а теперь и команд в организации.
Существует несколько точек зрения на определение «группа». С точки зрения восприятия - основой группы яв
5 руб.
ГОСТ Р ЕН 1296-2011 Материалы кровельные и гидроизоляционные гибкие битумосодержащие и полимерные (термопластичные или эластомерные). Метод искусственного термического старения
Lokard
: 28 июня 2013
Ключевые слова кровельные и гидроизоляционные гибкие битумосодержащие и полимерные (термопластичные или эластомерные) материалы, термическое старение
11 стр.
Настоящий стандарт распространяется на кровельные и гидроизоляционные гибкие битумосодержащие и полимерные (термопластичные или эластомерные) материалы (далее - материалы) и устанавливает требования к процедуре их искусственного термического старения и средствам испытаний.
Настоящий стандарт предназначен для определения характеристик матер
10 руб.
Аудиторський висновок по підприємству ПАТ "АрселорМіттал Кривий Ріг"
GnobYTEL
: 25 августа 2012
Загальна інформація про підприємтсво ПАТ "АрселорМіттал Кривий Ріг"
Коротка історична довідка
Опис обраної облікової політики
Опис теперішнього стану підприємства
Розрахунок фінансового стану підприємства ПАТ "АрселорМіттал Кривий Ріг"
Аудиторський висновок по підприємству
Історія народження i розвитку Криворiзького металургiйного комбiнату "Криворіжсталь" - це історія поетапного будiвництва, введення в експлуатацiю й освоєння надпотужних доменних печей, сталеплавильних агрегатiв, прокатних с
20 руб.
Реконструкция шиномонтажного участка ОАО ПАТП-2 г. Омска с разработкой подъемника
Рики-Тики-Та
: 8 декабря 2015
ВВЕДЕНИЕ 4
1 ТЕХНИКО-ЭКОНОМИЧЕСКОЕ ОБОСНОВАНИЕ 6
2 ТЕХНОЛОГИЧЕСКИЙ РАСЧЕТ 15
2.1 Характеристика АТП 15
2.2 Исходные данные 15
2.3 Расчет производственной программы по техническому обслуживанию и ремонту автомобилей 15
2.4 Расчет годовой и суточной производственной программы 19
2.5 Расчет годовых объёмов работ по ТО и ТР 23
2.6 Определение годового объёма вспомогательных работ 24
2.7 Распределение объёма работ по производственным зонам
и участкам предприятия 24
2.8 Годовой объем работ по самообс
825 руб.