Страницу Назад
Поискать другие аналоги этой работы
1500 Контрольная и Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15ID: 225756Дата закачки: 14 Мая 2022 Продавец: IT-STUDHELP (Напишите, если есть вопросы) Посмотреть другие работы этого продавца Тип работы: Работа Лабораторная Форматы файлов: Microsoft Word Сдано в учебном заведении: СибГУТИ Описание: Контрольная работа по курсу «Программирование графических процессоров» Вариант №15 Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 64 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 32768 7. Размер разделяемой памяти блока (байт): 24576 Параметры запускаемой программы: 1. Размер блока: 312 2. Разделяемая память на блок (байт): 5500 1. 32-х битных регистров на нить: 60 Рассчитайте теоретическую заполняемость? Чем она ограничена? Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается. Номер нити Номер слова 0 28 1 62 2 125 3 252 4 1 5 31 6 61 7 92 8 126 9 157 10 189 11 222 12 28 13 60 14 125 15 252 16 28 17 61 18 124 19 252 20 509 21 1020 22 2044 23 4093 24 253 25 285 26 318 27 349 28 381 29 414 30 445 31 477 Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти? Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием разделяемой памяти, который подразумевает, что вторая матрица в глобальной памяти хранится в транспонированном виде. Реализуйте последовательный алгоритм умножения матриц. Сравните время выполнения алгоритмов, рассчитайте коэффициент ускорения. Лабораторная работа №1 Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельный алгоритм умножения AxV, где A – матрица, V – вектор. 3. Реализуйте параллельный алгоритм умножения VxA, где A – матрица, V – вектор. 4. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 5. Прочитайте главу "Профилирование программ", ответьте на контрольные вопросы в конце главы (ответы на контрольные вопросы не нужно включать в отчёт по лаборатор-ной работе). 6. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффек-тивность доступа к глобальной памяти. Лабораторная работа №2 Задание 1. Прочитайте главу из теоретического материала "Разделяемая память" и ответьте на контрольные вопросы (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Оптимизируйте алгоритмы, реализованные в лабораторной работе №1 при помощи разделяемой памяти. 3. Постройте графики зависимости времени выполнения алгоритма от размера матрицы и вектора (Размеры матрицы 1000x500, 1000x1000, 1500x1000, 2000x1000, 2000x1500, 2500x1500, 2500x2000). 4. Проанализируйте, реализованные алгоритмы при помощи утилиты nvprof на эффективность доступа к глобальной памяти. Лабораторная работа №3 Задание 1. Прочитайте главы теоретического материала под названиями "Pinnedmemory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов. Комментарии: Оценка: Зачет Дата оценки: 14.05.2022 Помогу с вашим онлайн тестом, другой работой или дисциплиной. E-mail: sneroy20@gmail.com E-mail: ego178@mail.ru Размер файла: 105,4 Кбайт Фаил: ![]() ------------------- Обратите внимание, что преподаватели часто переставляют варианты и меняют исходные данные! Если вы хотите, чтобы работа точно соответствовала, смотрите исходные данные. Если их нет, обратитесь к продавцу или к нам в тех. поддержку. Имейте ввиду, что согласно гарантии возврата средств, мы не возвращаем деньги если вариант окажется не тот. -------------------
Скачано: 1 Коментариев: 0 |
||||
Есть вопросы? Посмотри часто задаваемые вопросы и ответы на них. Опять не то? Мы можем помочь сделать!
К сожалению, точных предложений нет. Рекомендуем воспользоваться поиском по базе. |
||||
Не можешь найти то что нужно? Мы можем помочь сделать! От 350 руб. за реферат, низкие цены. Спеши, предложение ограничено ! |
Вход в аккаунт:
Страницу Назад
Cодержание / Программирование графических процессоров / Контрольная и Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15