Программирование графических процессоров Лабораторная 3
Состав работы
|
|
|
|
|
|
|
|
|
|
Работа представляет собой rar архив с файлами (распаковать онлайн), которые открываются в программах:
- Microsoft Word
Описание
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
Методические указания
Для выполнения лабораторной работы требуется модифицировать код, выполняемый на хосте таким образом, чтобы данные передавались на устройство частями асинхронно, после этого выполнялось функция-ядро над переданной частью, после завершения вычислений часть ответа асинхронно должна копироваться на хост.
На хосте создайте и проинициализируйте матрицу и вектор, которые будут умножаться. Затем выделите память на хосте под результирующий вектор и проинициализируйте его нулями. Выделите память под матрицу и вектора на устройстве, создайте нужное количество потоков (начните с двух потоков).
Теперь нужно определиться какие части данных передавать в каждый поток. Разделение нужно произвести таким образом, чтобы результатом работы функции-ядра была часть конечного результата, не требующая дальнейшей обработки. В таком случае имеет смысл в каждом потоке передавать на устройство часть строк матрицы, а вектор передать сразу полностью, потому что для вычислений, каждой нитью используется одна строка из матрицы и вектор. Результатом работы нити будет один элемент результирующего вектора.
Для того чтобы определить размер порции данных нужно количество строк матрицы поделить на количество потоков, и результат умножить на длину строки. После этого полностью скопируйте значения вектора на устройство. И для каждого потока асинхронно скопируйте часть данных на устройство, используя функцию cudaMemcpyAsync, запустите вычисления над порцией данных, асинхронно скопируйте результат на хост. В конце синхронизируйте все потоки вызовом функции cudaDeviceSynchronize() – эта функция будет ожидать завершения всех запущенных потоков.
Проведите исследование зависимости времени работы алгоритма от количества потоков. Начните с двух потоков и увеличивайте их количество до тех пор, пока время, затраченное на вычисления, не перестанет уменьшаться. Замеры времени следует проводить, включая асинхронные пересылки данных.
Дополнительная информация
зачет
Похожие материалы
Программирование графических процессоров. Лабораторная работа №3
pleze
: 20 марта 2022
Тема: Работа с потоками CUDA
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгоритмов реализованные в лабораторной работе №1.
3. Определите оптимальное количество потоков для матрицы размером 2500x2500 элементов и вектора размером 2500 элементов.
300 руб.
Программирование графических процессоров. Лабораторная работа №3. Вариант общий
Damovoy
: 25 апреля 2021
Лабораторная работа №3 по курсу
«Программирование графических процессоров»
на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под названиями "Pinned memory" и "Потоки (streams) в CUDA". Ответьте на контрольные вопросы в конце глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Примените потоки для алгори
500 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров»
Леший
: 23 апреля 2022
Лабораторная работа №1
по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные за-дания, предложенные в конце этих глав (ответы на кон
777 руб.
Лабораторные работы №№1-3 по дисциплине: Программирование графических процессоров
IT-STUDHELP
: 3 декабря 2021
Лабораторная работа 1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение ин-формации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте параллельны
900 руб.
Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
SibSUTTI
: 1 сентября 2023
2023 год
СибГУТИ
Сибирский государственный университет телекоммуникаций и информатики
Милешко Антон Владимирович
Тема: Лабораторная работа 3 Программирование графических процессоров Все варианты 2023 год
Задания
Лабораторная работа №3 по курсу «Программирование графических процессоров» на тему «Работа с потоками CUDA»
Выполнение лабораторной работы поможет получить навыки требующиеся для выполнения третьего задания контрольной работы.
Задание
1. Прочитайте главы теоретического материала под на
198 руб.
Лабораторные работы №1-3 по дисциплине: Программирование графических процессоров. Вариант общий
Roma967
: 20 июля 2024
Лабораторная работа №1
«Работа с глобальной памятью»
Задание лабораторной работы
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт
900 руб.
Лабораторные работы №1-3 по курсу «Программирование графических процессоров». Вариант общий
teacher-sib
: 13 июня 2022
Лабораторная работа №1 по курсу «Программирование графических процессоров» на тему «Работа с глобальной памятью»
Задание
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDA C", "Алгоритм сложения двух векторов на GPU", "События, обработка ошибок и получение информации об устройстве", "Глобальная, локальная и константная память". Ответьте на контрольные вопросы и выполните контрольные задания, предложенные в конце этих глав (ответы н
600 руб.
Лабораторная работа 1-3 по дисциплине: Программирование графических процессоров. Вариант 15
IT-STUDHELP
: 14 мая 2022
Лабораторная работа №1
Задание
1. Прочитайте главы теоретического материала под названиями "Отличия GPU от CPU", "Первая программа на CUDAC", "Алгоритм сложения двух векторов на GPU", "Собы-тия, обработка ошибок и получение информации об устройстве", "Глобальная, локаль-ная и константная память". Ответьте на контрольные вопросы и выполните контроль-ные задания, предложенные в конце этих глав (ответы на контрольные вопросы не нужно включать в отчёт по лабораторной работе).
2. Реализуйте паралле
900 руб.
Другие работы
Расчетно-графическое задание №2. Транзисторы. Вариант № 9
xtrail
: 17 марта 2013
Задача №1.
Тип транзистора: КП312А
Uси = 6 В
Uзи = -3,6 В
Цель работы: По выходным характеристикам полевого транзистора построить передаточную характеристику при указанном напряжении стока. Определить дифференциальные параметры S, Ri, полевого транзистора и построить их зависимости от напряжения на затворе.
Задача №2
Тип транзистора: КТ902А
Uкэ = 15 В
Цель работы: Используя характеристики заданного биполярного транзистора определить
h – параметры биполярного транзистора и построить зависимости
200 руб.
Современные тенденции развития семьи и домохозяйства в России
Lokard
: 9 февраля 2014
Оглавление
Введение
1. Основные понятия
2. Фазы формирования семьи
3. О социальном капитале семьи
Заключение
Используемая литература
Введение
Семья представляет собой социальный институт, основанный на брачных отношениях между мужчиной и женщиной и порождающий права и обязанности между супругами, между детьми и родителями.
Семья и домохозяйство выступают в качестве предмета изучения таких наук, как статистика, демография, экономика, право, социология, педагогика, медицина, геронтология и т.д.
С
5 руб.
Кран пневматический МЧ00.72.00.00.СБ. деталировка
Laguz
: 6 февраля 2015
Кран пневматический МЧ00.72.00.00.СБ, он же кран пневматический НГи Г 00.20.000 СБ
Кран взят из альбома Боголюбова.
Есть только деталировка, сборки и спецификации нет.
Есть рабочие чертежи деталей: 1,2,3,4,5, 6,7. Детали 1 и 5, дополнительно начерчены в аксонометрии.
Сделано в Компас 14+ сохранено в jpg
60 руб.
Экзаменационная работа по дисциплине: Математический анализ (часть 2). Билет №6
Roma967
: 18 августа 2019
Билет №6
1. Приложения тройного интеграла: объем, масса тела.
2. Найти градиент функции z=f(x,y) в точке M(1;1):
z=x/(x^(2)+y^(2))
3. Изменить порядок интегрирования. Область интегрирования изобразить на чертеже (см. скрин).
4. Исследуйте ряд на абсолютную сходимость (см. скрин).
5. Данную функцию разложить в ряд Тейлора по степеням х:
f(x)=x^(3)e^(-x^(2))
6. Решить уравнение:
y+корень(x^(2)+y^(2))-xy'=0
7. Найти частное решение дифференциального уравнения при данных начальных условиях:
650 руб.