Программирование графических процессоров Лабораторная 3

Состав работы

D08ED27F-4F44-4AB0-892A-7DBC286C3D46.rar [ 249 KB ]

Lab3

kernel.cu [ 8 KB ]

Lab3.exe [ 745 KB ]

Документ Microsoft Word.docx [ 97 KB ]

Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:

Microsoft Word

Что делать, если файл не открывается

Описание

Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.

Дополнительная информация

зачет

Программирование графических процессоров. Лабораторная работа №3

Тема: Работа с потоками CUDA Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.

Программирование графических процессоров ДО СИБГУТИ Работа Лабораторная

pleze : 20 марта 2022

300 руб.

Программирование графических процессоров. Лабораторная работа №3. Вариант общий

Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA» Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгори

Программирование графических процессоров Работа Лабораторная

Damovoy : 25 апреля 2021

500 руб.

Лабораторные работы №1-3 по курсу «Программирование графических процессоров»

Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью» Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные за-дания, предложенные в конце этих глав (ответы на кон

Программирование графических процессоров ДО СИБГУТИ Работа Лабораторная

Леший : 23 апреля 2022

777 руб.

Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров

Лабораторная работа 1 Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельны

Программирование графических процессоров СибГУТИ Работа Лабораторная

IT-STUDHELP : 3 декабря 2021

900 руб.

Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год

2023 год СибГУТИ Сибирский государственный университет телекоммуникаций и информатики Милешко Антон Владимирович Тема: Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год Задания Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA» Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под на

Программирование графических процессоров ДО СИБГУТИ Работа Лабораторная

SibSUTTI : 1 сентября 2023

198 руб.

Лабораторные работы №1-3 по дисциплине: Программирование графических процессоров. Вариант общий

Лабораторная работа №1 «Работа с глобальной памятью» Задание лабораторной работы 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт

Программирование графических процессоров ДО СИБГУТИ Работа Лабораторная

Roma967 : 20 июля 2024

900 руб.

Лабораторные работы №1-3 по курсу «Программирование графических процессоров». Вариант общий

Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью» Задание Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы н

Программирование графических процессоров ДО СИБГУТИ Работа Лабораторная

teacher-sib : 13 июня 2022

600 руб.

Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15

Лабораторная работа №1 Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте паралле

Программирование графических процессоров СибГУТИ Работа Лабораторная

IT-STUDHELP : 14 мая 2022

900 руб.

Бруй Л.П. Техническая термодинамика и теплопередача ТОГУ Задача 7 Вариант 07

Определить коэффициент теплоотдачи при поперечном омывании потоком дымовых газов, имеющих температуру tг (табл. 5), трубы диаметром 100 мм. Скорость движения потока газов ω, угол атаки φ (табл. 5). Физические характеристики дымовых газов см. приложение 3. В конце задачи следует ответить письменно на следующий вопрос: 1. Как влияют на коэффициент теплоотдачи величина скорости потока, угол атаки потока газов, а также диаметр трубы?

Задачи Теплотехника

Z24 : 14 января 2026

180 руб.

Основы расчетов на прочность и жесткость типовых элементов конструкций ВолгГТУ 2019 Задача 6 Вариант 17

Подобрать размеры круглых поперечных сечений двух участков стального бруса с ломаной геометрической осью (рис. 12.4, в).

Задачи Сопротивление материалов

Z24 : 5 ноября 2025

300 руб.

Другие планетные системы

Планета Плутон находится в нашей Солнечной системе, но видна в виде точки и лишь в самые мощные телескопы. Другие планетные системы, даже ближайшие к нам, расположены в десятки тысяч раз дальше. Поэтому рассмотреть их невозможно. На таком расстоянии видны только звёзды, да и те - в виде точек. Поэтому о наличии планет у этих звёзд мы можем судить только по влиянию этих планет на звёзды. Крупные планеты, проходя по диску звезды, могут на какие-то доли процента ослаблять яркость звезды (но это дол

Астрономия Рефераты

Lokard : 10 августа 2013

5 руб.

Тепломассообмен СЗТУ Задача 13 Вариант 48

Определить, какое количество сухого насыщенного пара давлением р конденсируется в стальном горизонтальном паропроводе диаметром d, длиною l, если он находится в кирпичном канале (0,7×0,7) м, температура стенок которого t; степень черноты стали εст=0,8, кирпича εк=0,9.

Задачи Теплотехника

Z24 : 25 февраля 2026

200 руб.

Программирование графических процессоров Лабораторная 3

Состав работы

Описание

Дополнительная информация

Похожие материалы

Другие работы

Вход