Программирование графических процессоров Лабораторная 3

Состав работы

material.view.file_icon
material.view.file_icon
material.view.file_icon kernel.cu
material.view.file_icon Lab3.exe
material.view.file_icon Документ Microsoft Word.docx
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
  • Microsoft Word

Описание

Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.

Дополнительная информация

зачет
Программирование графических процессоров. Лабораторная работа №3
Тема: Работа с потоками CUDA Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгоритмов реализованные в лабораторной работе №1. 3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
User pleze : 20 марта 2022
300 руб.
Программирование графических процессоров. Лабораторная работа №3. Вариант общий
Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA» Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Примените потоки для алгори
User Damovoy : 25 апреля 2021
500 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров»
Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью» Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные за-дания, предложенные в конце этих глав (ответы на кон
User Леший : 23 апреля 2022
777 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
Лабораторная работа 1 Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте параллельны
User IT-STUDHELP : 3 декабря 2021
900 руб.
promo
Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
2023 год СибГУТИ Сибирский государственный университет телекоммуникаций и информатики Милешко Антон Владимирович Тема: Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год Задания Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA» Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы. Задание 1. Прочитайте главы теоретического материала под на
User SibSUTTI : 1 сентября 2023
198 руб.
promo
Лабораторные работы №1-3 по дисциплине: Программирование графических процессоров. Вариант общий
Лабораторная работа №1 «Работа с глобальной памятью» Задание лабораторной работы 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт
User Roma967 : 20 июля 2024
900 руб.
promo
Лабораторные работы №1-3 по курсу «Программирование графических процессоров». Вариант общий
Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью» Задание Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы н
User teacher-sib : 13 июня 2022
600 руб.
promo
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
Лабораторная работа №1 Задание 1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе). 2. Реализуйте паралле
User IT-STUDHELP : 14 мая 2022
900 руб.
promo
Проблемы развития связной речи
Содержание Введение…………………………………………………………………………...3 Глава 1. Теоретический аспект изучения проблемы развития связной речи у детей старшего дошкольного возраста в семье 1.1. Исследование проблемы развития связной речи у детей старшего дошкольного возраста в семье в трудах отечественных специалистов………6 1.2. Старший дошкольный возраст как сензитивный период развития связной речи ребенка……………………………………………………………………...21 1.3.Способы и приемы развития связной речи у детей старшего дошкольного во
User GAGARIN : 2 августа 2012
250 руб.
Решетка вентилятора Solidworks 2020
Защитная решетка, изготовленная из проволоки, представляет собой ряд концентрических кругов, образующих сферическую поверхность. Решетка крепится по периметру корпуса вентилятора помощью саморезов. Габаритные размеры решетки таковы: - диаметр проволоки – 2 мм; - расстояние между соседними отверстиями – 68 мм; - высота решетки – 9 мм; - расстояние между концентрическими кругами – 9 мм; - количество кругов – 4; - диаметр крепежной скобы – 6 мм.
User belial2003 : 12 ноября 2021
50 руб.
Решетка вентилятора Solidworks 2020
Инженерная графика. Вариант №1. Задание №5. Ломаный разрез
Всё выполнено в программе КОМПАС 3D v16 Задание СФУ Вариант №1. Задание №5. На месте главного вида выполнить ломаный разрез. В состав работы входят три файла: - 3D модель детали; - ассоциативный чертеж с необходимым разрезом; - аналогичный обычный чертеж. Помогу с другими вариантами, пишите в ЛС.
User Чертежи : 6 апреля 2020
60 руб.
Инженерная графика. Вариант №1. Задание №5. Ломаный разрез
Вал 04.03.01
Вал 04.03.01 Выполнить три вынесенных сечения А-А, Б-Б, В-В. Наименование детали - Вал. Материал - Ст.4 ГОСТ 380-2005. Чертеж выполнен на формате А3+PDF (все на скриншотах показано и присутствует в архиве) выполнены в КОМПАС 3D. Также открывать и просматривать, печатать чертежи и 3D-модели, выполненные в КОМПАСЕ можно просмоторщиком КОМПАС-3D Viewer. По другим вариантам и всем вопросам пишите в Л/С. Отвечу и помогу.
User coolns : 18 мая 2024
80 руб.
Вал 04.03.01
up Наверх