Реализация метода переменных направлений с использованием технологии CUDA

1. Введение

В настоящей заметке демонстрируется возможность выполнения расчетов на видеокартах (с применением технологии CUDA) при моделировании физических процессов и явлений на примере решения трехмерного уравнения теплопроводности. Приведен сравнительный анализ скорости расчетов на центральном (CPU) и графическом (GPU) процессорах.

2. Описание схемы Дугласа-Рекфорда

При математическом моделировании распространения тепла с учетом фильтрации и фазовых превращений применяется следующее уравнение теплопроводности:

(1)   \begin{equation*}  C_{ev}\frac{\partial T}{\partial t}+\bigtriangledown{(-k\bigtriangledown{T})}+C_w\vec{v}\bigtriangledown{T}-Q=0 \end{equation*}

Физический смысл коэффициентов, участвующих в уравнении (1), приведен в таблице 1.

Читать далее

Эффективность параллельных вычислений Abaqus, Ansys и Simmakers

В настоящее время всё большую популярность в области высокопроизводительных вычислений приобретают аппаратные средства, основанные на архитектурах для параллельных вычислений.

Эффективность использования аппаратных средств с параллельной архитектурой в решении инженерных задачах, таких, как компьютерное моделирование физических процессов, не имеет линейной зависимости от количества процессоров. Ошибочно полагать, что при решении сложных инженерных задач перенос расчета с одного ядра CPU на четыре ядра даст четырехкратный прирост скорости. Аналогично, перенос вычислений на графические ускорители с сотнями ядер не дает стократного прироста в скорости.

В первую очередь ограничение в приросте скорости при использовании параллельных расчетов налагают вычислительные алгоритмы. Алгоритмы, обладающие низкой степенью параллелизации, нерационально использовать на суперкомпьютерах и высокопроизводительных рабочих станциях. Понятие «эффективность параллелизации» поясняется законом Амдала, согласно которому если хотя бы 1/10 часть программы исполняется последовательно, то невозможно получить более 10 кратного ускорения вне зависимости от числа используемых вычислительных ядер.

Яркими примерами ограниченности эффективности распараллеливания алгоритмов для решения инженерных задач являются относительно слабые результаты мировых лидеров в области программного обеспечения для инженерного анализа (CAE) – компаний Abaqus и Ansys.

Читать далее