Программирование графических процессоров Лабораторная 3
Состав работы
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Дополнительная информация
зачет
Похожие материалы
Программирование графических процессоров. Лабораторная работа №3
pleze
: 20 марта 2022
Тема: Работа с потоками CUDA
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
300 руб.
Программирование графических процессоров. Лабораторная работа №3. Вариант общий
Damovoy
: 25 апреля 2021
Лабораторная работа №3 по курсу
«Программирование графических процессоров»
на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгори
500 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров»
Леший
: 23 апреля 2022
Лабораторная работа №1
по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные за-дания, предложенные в конце этих глав (ответы на кон
777 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
IT-STUDHELP
: 3 декабря 2021
Лабораторная работа 1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельны
900 руб.
Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
SibSUTTI
: 1 сентября 2023
2023 год
СибГУТИ
Сибирский государственный университет телекоммуникаций и информатики
Милешко Антон Владимирович
Тема: Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
Задания
Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под на
198 руб.
Лабораторные работы №1-3 по дисциплине: Программирование графических процессоров. Вариант общий
Roma967
: 20 июля 2024
Лабораторная работа №1
«Работа с глобальной памятью»
Задание лабораторной работы
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт
900 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров». Вариант общий
teacher-sib
: 13 июня 2022
Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы н
600 руб.
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте паралле
900 руб.
Другие работы
Блок секция средней этажности со стенами из кирпича рядовая 4-этажная 11-квартирная
DocentMark
: 30 сентября 2011
Тема проекта: блок - секции средней этажности со стенами из кирпича, блок- секция рядовая 4-этажная 11- квартирная (для строительства в уральской зоне россии)
Район строительства: г. Екатеринбург
Грунт: суглинок
Температура внутреннего воздуха: +18 oС
Температура наружного воздуха: -37 oС
Ветровая нагрузка: 0,3
Снеговая нагрузка (расчетная) – 1.8 кПа
Степень долговечности – 2
Степень огнестойкости – 2
Класс здания II
Здание кирпичное, перекрытие и покрытие из сборных железобетонных плит, кровл
45 руб.
Цилиндр пневматический МЧ00.12.00.00 СБ. Деталирование
HelpStud
: 24 августа 2019
В автоматизации металлообрабатывающих станков, прессов и т. п. широко применяются пневматические (воздушные) приводы.
Основным звеном пневмопривода является пневматический цилиндр, в котором движение поршня поз. 4 происходит под давлением воздуха, подаваемого в цилиндр с одной или с другой стороны поршня поз. 4, через распределительный золотник (на чертеже не показан). Воздух поступает по гибким шлангам, ввинчиваемым в резьбовые отверстия крышек поз. 2 и 3.
Поршень поз. 4 крепится на штоке поз.
250 руб.
Совершенствование технического обслуживания автомобилей в ОАО "..." с разработкой канавного сьемника
Рики-Тики-Та
: 20 декабря 2015
РЕФЕРАТ
Выпускная квалификационная работа с., рис., табл., источника, 3 прил., 8 л. графич. материала.
АВТОМОБИЛИ, МАСТЕРСКАЯ, ТЕХНОЛОГИЯ, ТЕХНИЧЕСКОЕ ОБСЛУЖИВАНИЕ, ЗОНА, ТО-2, КАНАВНЫЙ СЪЁМНИК
Объектом работы является подвижной состав предприятия.
Цель работы – совершенствование технического обслуживания автомобилей.
В результате работы разработаны мероприятия по совершенствованию технического обслуживания автомобилей.
Выпускная квалификационная работа выполнена в текстовом редакторе Microsoft
825 руб.
Экзамен. Планирование на предприятии. Билет 1
sanco25
: 22 февраля 2012
Перечень вопросов к экзамену по дисциплине «Планирование на предприятии» включает 19 вопросов и возможных вариантов ответов на них.
Вам необходимо занести в следующую таблицу ответ (ответы) на вопросы.
Вопросы:
1. На основании какой информации принимается решение о снятии изделия с выпуска?
2. Составление какого из разделов портфеля заказов является наиболее трудоемким?
3. Создание и реализация какой продукции сопряжены с наибольшим риском?
4. Исследование конъюнктуры рынка предполагает анализ:
60 руб.