Параллельные вычисления общего назначения на графических процессорах

ВведениеСтруктура и возможности вычислительной системы с графическим процессоромЗадача компьютерной визуализации трехмерных сценАрхитектура графического процессора (GPU)Распараллеливание вычислений поданнымВзаимодействие графического и центрального процессоровИерархия памяти, доступной центральному и графическому процессорамКонвейерная обработка данныхУровни управления графическим процессором и основные системы программирования GPUУровни управления графическим процессоромДрайвер графического процессораИнтерфейсы программирования приложенийПользовательское приложениеПрограммно-аппаратная платформа NVIDIA CUDAВыбор платформы программирования GPUОбласти применения графических процессоровНеобходимое аппаратное и программное обеспечениеСредства программированияПоточно-параллельное программирование GPUРаспараллеливание расчетовРаспараллеливание по задачамРаспараллеливание по инструкциямРаспараллеливание по даннымПреимущества графических процессоров при параллельных расчетахПринцип программирования SIMD на примере пиксельного шейдераПример сложения матрицРаспараллеливание независимых вычисленийСложение матриц в рамках шейдерной модели 3Структура программы для центрального процессораРеализация программы для центрального процессора на С#Программа для графического процессораВычислительные шейдеры модели 5Программирование графических процессоров на CUDAМодель программирования графических процессоров как универсальных вычислительных системВзаимодействие параллельных вычислительных процессовКонцепция универсального вычислительного устройства CUDAИерархия вычислительных процессов и памяти CUDAВозможности и ограничения процессоров архитектуры CUDAКонвейерная обработка данных в архитектуре CUDAОсобенности программирования на CUDAИдентификация вычислительного потокаСовместимость с шейдерными моделямиЯзык программирования CUDAСтруктура программы на CUDAАнализ алгоритма параллельного перемножения матрицАлгоритм перемножения матрицПроцедура перемножения матриц на CUDAОптимизация доступа к памяти при умножении матрицДинамика N тел на CUDA. Пример ускорения программы за счет скорости GPUРаспараллеливание алгоритмов сортировки. Пример ускорения программы за счет скорости GPUЗаключение>Перемножение матриц на CUDA. Программа, исполняемая центральным процессоромВычисление скалярного произведения векторов на CUDAКомпиляция программ на CUDAПрофайлерБиблиографический список
 
  РЕЗЮМЕ   След >