Программирование графических процессоров Лабораторная 3
Состав работы
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Дополнительная информация
зачет
Похожие материалы
Программирование графических процессоров. Лабораторная работа №3
pleze
: 20 марта 2022
Тема: Работа с потоками CUDA
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
300 руб.
Программирование графических процессоров. Лабораторная работа №3. Вариант общий
Damovoy
: 25 апреля 2021
Лабораторная работа №3 по курсу
«Программирование графических процессоров»
на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгори
500 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров»
Леший
: 23 апреля 2022
Лабораторная работа №1
по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные за-дания, предложенные в конце этих глав (ответы на кон
777 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
IT-STUDHELP
: 3 декабря 2021
Лабораторная работа 1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельны
900 руб.
Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
SibSUTTI
: 1 сентября 2023
2023 год
СибГУТИ
Сибирский государственный университет телекоммуникаций и информатики
Милешко Антон Владимирович
Тема: Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
Задания
Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под на
198 руб.
Лабораторные работы №1-3 по дисциплине: Программирование графических процессоров. Вариант общий
Roma967
: 20 июля 2024
Лабораторная работа №1
«Работа с глобальной памятью»
Задание лабораторной работы
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт
900 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров». Вариант общий
teacher-sib
: 13 июня 2022
Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы н
600 руб.
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте паралле
900 руб.
Другие работы
Отчет по практике в Анапском таможенном посту
Elfa254
: 2 августа 2013
Введение
Летом 2009 года я приступил к прохождению практики в Анапском таможенном посту Новороссийской таможни. Длительность практики составляла три недели.
Итак, 18 го числа я прибыл в отдел кадров Новороссийской таможни для регистрации и выбора таможенного поста (в подчинении Новороссийской таможни), в котором должна была проходить практика.
Для того чтобы приступить к практике от меня требовалось пройти инструктаж по правилам пожарной безопасности, ознакомление с техникой безопасности и изуче
30 руб.
Корпус в сборе - Задание 3
.Инженер.
: 26 октября 2022
ИНЖЕНЕРНАЯ ГРАФИКА. ПРАКТИКУМ ПО ЧЕРТЕЖАМ СБОРОЧНЫХ ЕДИНИЦ. Под редакцией П.В. Зеленого. Задание 3 - Корпус в сборе.
Сборочная единица "Корпус в сборе" содержит четыре детали. Пластина 1 крепится к фланцам 2 и 4 четырьмя винтами 5 (М6х12 ГОСТ 17473-80). Затем эти три детали в сборе вкладываются в корпус 3 и соединяются винтом 6 (М8х10 ГОСТ 17475-80).
Состав работы:
-3D модели всех деталей
-3D сборка
-3D сборка с разносом компонентов
-Сборочный чертеж
-Спецификация
-Чертежи всех деталей (детали
250 руб.
Регламентирование содержания примесей в водоемах и нормирование химических веществ в атмосфере
Qiwir
: 19 марта 2013
Содержание
1. Регламентирование содержания примесей в воде водоемов
2. Гигиеническое нормирование химических веществ в атмосферном воздухе населенных мест
3. Тесты
4. Задача
Список использованной литературы
1. Регламентирование содержания примесей в воде водоемов
Регламентирование содержания примесей в воде водоемов зависит от отнесения их к различным категориям водопользования. Различают две категории водопользования. К первой относят:
· Для централизованного и нецентрализованного питьевого с
10 руб.
Проектирование и расчет ДВС
Aronitue9
: 5 октября 2012
Тепловым расчётом рабочего цикла двигателя внутреннего сгорания называется комплекс вычислений, преимущественно термодинамического характера, позволяющий установить мощностные и экономические показатели проектируемого двигателя. 1.1. Состав топлива, потребный для сгорания воздух, продукты сгорания и теплота сгорания Топливом для проектируемого двигателя внутреннего сгорания служит бензин. Это топливо содержит углерод С, водород Н, а также незначительное количество серы, золы и воды, которыми в т
42 руб.