Розпаралелювання задач, розв’язуваних методом скінченних елементів на GPU NVIDIA
Вантажиться...
Файли
Дата
2015
Автори
Мясіщев, Олександр Анатолійович
Боряк, Костянтин Федорович
Ноянчук, Володимир Володимирович
Myasischev, A.A.
Borjak, K.F.
Noyanchuk, V.V.
Назва журналу
Номер ISSN
Назва тому
Видавець
Військовій інститут Київського національного університету імені Тараса Шевченка
Анотація
У статті проведено аналіз швидкості та продуктивності обчислень добутку двох
розріджених матриць в послідовному варіанті та за допомогою технологій CUDA і OpenMP. До даного типу матриць зводяться задачі, що розраховуються методом скінченних елементів. Описано методи зберігання даного типу матриць та наведено алгоритм за яким виконуються розрахунки. Отримані результати дають можливість провести узагальнену оцінку покращення швидкості обчислень при використанні графічних процесорів.
Програмно-апаратна архітектура CUDA від компанії NVIDIA для паралельних розрахунків на графічних процесорах, добре підходить для вирішення завдань, що потребують високопродуктивних паралельних обчислень для чисел з одинарною точністю, оскільки результати дослідження показали, що використовуючи, навіть, не досить потужний графічний процесор, можна отримати систему більш продуктивну, ніж при використанні декількох процесорів.
В статье проведен анализ скорости и производительности вычислений произведения двух разреженных матриц в последовательном варианте, с помощью технологий CUDA и OpenMP. К этому типу матриц сводятся задачи, которые рассчитываются методом конечных элементов. Описаны методы хранения данного типа матриц и приведен алгоритм по которому выполняются расчеты. Полученные результаты дают возможность провести обобщенную оценку улучшения скорости вычислений при использовании графических процессоров. Программно-аппаратная архитектура CUDA от компании NVIDIA для параллельных расчетов на графических процессорах, хорошо подходит для решения задач, требующих высокопроизводительных параллельных вычислений для чисел с одинарной точностью, поскольку результаты исследования показали, что используя даже недостаточно мощный графический процессор, можно получить систему более производительную, чем при использовании нескольких процессоров.
The paper analyzes the speed and efficiency of computing the product of two sparse matrices in a sequential version and using technology CUDA and OpenMP. Such matrix types are used to solve problems by finite element method. Introduced methods for storing of such matrix types and calculation algorithm. Received results allow estimation of calculating speed with usage of GPU. Software and hardware architecture NVIDIA CUDA from the company for parallel calculations on the graphics processor is well suited for solving problems that require high-performance parallel computing for numbers with single precision, since the results showed that using even not powerful enough graphics processor available system more productive than using multiple processorss.
В статье проведен анализ скорости и производительности вычислений произведения двух разреженных матриц в последовательном варианте, с помощью технологий CUDA и OpenMP. К этому типу матриц сводятся задачи, которые рассчитываются методом конечных элементов. Описаны методы хранения данного типа матриц и приведен алгоритм по которому выполняются расчеты. Полученные результаты дают возможность провести обобщенную оценку улучшения скорости вычислений при использовании графических процессоров. Программно-аппаратная архитектура CUDA от компании NVIDIA для параллельных расчетов на графических процессорах, хорошо подходит для решения задач, требующих высокопроизводительных параллельных вычислений для чисел с одинарной точностью, поскольку результаты исследования показали, что используя даже недостаточно мощный графический процессор, можно получить систему более производительную, чем при использовании нескольких процессоров.
The paper analyzes the speed and efficiency of computing the product of two sparse matrices in a sequential version and using technology CUDA and OpenMP. Such matrix types are used to solve problems by finite element method. Introduced methods for storing of such matrix types and calculation algorithm. Received results allow estimation of calculating speed with usage of GPU. Software and hardware architecture NVIDIA CUDA from the company for parallel calculations on the graphics processor is well suited for solving problems that require high-performance parallel computing for numbers with single precision, since the results showed that using even not powerful enough graphics processor available system more productive than using multiple processorss.
Опис
Ключові слова
матриці, обчислення, МСЕ, CUDA, продуктивність, OpenMP, матрицы, вычисление, МКЭ, производительность, matrix calculation, ITU, performance
Бібліографічний опис
Боряк К. Ф. Розпаралелювання задач, розв’язуваних методом скінченних елементів на GPU NVIDIA / К. Ф. Боряк, О. А. Мясіщев, В. В. Ноянчук // Збірник наукових праць Військового інституту Київського національного університету імені Тараса Шевченка. – Київ : ВІКНУ, 2015. – Вип. 49. – С. 154-158.