Система ускоренного электромагнитного 3D-моделирования EMPIRE XPU 7.5: возможности и применение

№ 1’2016
PDF версия
EMPIRE XPU — это система трехмерного электромагнитного СВЧ-моделирования, основанная на методе конечных разностей во временной области (FDTD), предназначенная для проектирования антенн, микроволновых цепей, СВЧ-микросхем и т. д. Вследствие увеличения сложности, повышения плотности проектов и растущих требований к учету внешних факторов растут и требования к моделированию устройств, поэтому технологии, позволяющие радикально ускорить процесс моделирования, становятся все более востребованными.

Традиционные решения, основанные на применении графических ускорителей (GPU), крайне дороги и ограничены в использовании памяти, т. к. в таких системах можно использовать только память, находящуюся непосредственно на плате ускорителя GPU. В отличие от технологий GPU, более перспективными с точки зрения эффективности вычислений, скорости моделирования и возможности использования всей памяти компьютера можно назвать технологию XPU, которая использует внутренние ресурсы всех ядер центрального процессора (ЦПУ архитектуры Intel). Новый релиз решающего алгоритма электромагнитного (ЭМ) 3D-моделирования Empire XPU 7.5 стал еще более оптимизированным для новых архитектур Intel CPU, что позволило увеличить производительность до уникальной величины 8 млрд ячеек в секунду.

Эта статья описывает технологию XPU, которая эффективно реализует алгоритм FDTD на архитектуре современных ЦПУ. Она может на порядок сократить время моделирования, при этом обеспечивая полный доступ ко всей доступной процессору памяти, что будет продемонстрировано с помощью примеров типового применения системы моделирования.

 

Метод ускорения вычислений XPU

 Широко известный метод ЭМ-моделирования FDTD работает следующим образом: на каждую единичную ячейку моделируемой системы в памяти компьютера хранятся три электрические (E) и три магнитные (H) компоненты поля. Поля вычисляются в зависимости от времени, и на каждом шаге вычислений в память перезаписываются новые вычисленные значения полей E и H. Реализация алгоритма в виде серии последовательных вычислений требует чтения и записи всех значений E и H в память на каждом шаге вычислений. На современном процессоре (Intel Core i7, clock 3 ГГц, 8 ядер, DDR4 RAM) скорость обмена с памятью составляет 68 Гбайт/с, что обеспечивает максимальную производительность всего лишь около 900 млн ячеек в секунду. Производительность же самого ЦПУ примерно в восемь раз выше. Это означает, что узким местом («бутылочным горлышком») для алгоритма моделирования FDTD является низкая скорость доступа к памяти. С другой стороны, скорость доступа к встроенной кэш-памяти процессора составляет 768 Гбайт/с, что на порядок выше, чем скорость доступа к внешней RAM. Система моделирования Empire реализует уникальный алгоритм XPU, который может использовать высокую скорость вычислений ЦПУ за счет выполнения нескольких шагов моделирования с использованием внутренней кэш-памяти уровня L3 перед тем, как выполнять обмен с внешней памятью. Оптимальная стратегия вычислений определяется при выполнении начальной фазы симуляции Empire XPU.

В многопроцессорных компьютерах особое внимание надо уделять ситуациям, когда данные должны быть записаны в участки памяти, ассоциированные с другими ЦПУ. За счет реализации архитектуры неоднородной памяти (NUMA) и оптимизации кода система Empire XPU обеспечивает максимальную производительность алгоритма моделирования FDTD.

На рис. 1 показаны графики зависимости скорости моделирования от размера модели, полученные на различных процессорах. Для сравнения зеленой штриховой линией показана производительность конкурирующих систем моделирования на графическом ускорителе Tesla. Эта линия сильно зависит от размера моделируемой системы и обрывается из-за ограничений, связанных с небольшим размером доступной памяти карты ускорителя. Остальные кривые показывают производительность системы Empire XPU на обычных потребительских компьютерах (Intel core i7) и рабочих станциях (Intel dual Xeon, в данном случае E5–2697 V3). Как можно увидеть, для любых размеров моделируемой системы в алгоритме XPU обеспечивается высокая производительность, а также могут быть решены проблемы моделирования значительно больших по размеру систем за счет доступа ко всей установленной на компьютере памяти (приблизительно 6 млрд ячеек по сравнению с 200 млн ячеек на карте графического ускорителя).

Производительность моделирования FDTD в зависимости от размера моделируемой системы для различных процессоров

Рис. 1. Производительность моделирования FDTD в зависимости от размера моделируемой системы для различных процессоров

 

Сравнение производительности: антенны с обтекателями

Чтобы получить точный расчет характеристик антенны, алгоритм электромагнитного моделирования должен учитывать внешнюю среду, в которой находится антенна. В частности, наличие обтекателя (защитного купола) может изменить усиление и ширину луча антенны и увеличить боковые лепестки. Рассмотрим пример на рис. 2, в котором параболический отражатель (серый цвет) облучается раструбом волновода (синий цвет), и оба они расположены внутри обтекателя (желтый цвет, диэлектрическая проницаемость — 5, толщина — 7 мм). Рабочая частота — 15–25 ГГц, размер области моделирования составляет около 750x750x400 мм. Использование максимального разрешения в 15 ячеек на минимальную длину волны дает нам сетку моделирования, содержащую 5 млрд ячеек. Система Empire XPU использует интеллектуальный алгоритм кэширования коэффициентов моделирования, чтобы минимизировать количество обращений к памяти. Размер требуемой памяти превышает 114 Гбайт, что делает невозможным использование графических ускорителей. В этом примере система Empire XPU достигает производительности 3,6 Гигаячеек в секунду на рабочей станции Dual Xeon E5–2690, и после выполнения 11 000 шагов моделирования по времени, через 4 ч 20 мин, вычисления достигают требуемого порога затухания энергии 30 дБ. На рис. 2 показаны ближнее и дальнее поле на частоте 25 ГГц. Как можно увидеть, обтекатель вносит заметные искажения в картину как ближнего, так и дальнего поля, и обязательно должен приниматься во внимание для выполнения корректного проектирования таких СВЧ-систем.

Пример результатов расчета в системе Empire XPU. Ближнее и дальнее поле рефлекторной антенны с обтекателем на частоте 25 ГГц

Рис. 2. Пример результатов расчета в системе Empire XPU. Ближнее и дальнее поле рефлекторной антенны с обтекателем на частоте 25 ГГц

 

Сравнение производительности: радиосвязь между двумя автомобилями

Радиосвязь между автомобилями (Car-to-Car, C2C) — это европейский проект, который подразумевает разработку протокола обмена данными между транспортными средствами с целью повышения безопасности движения и оптимизации потоков транспорта. Рабочая частота — 5,6 ГГц. С помощью системы Empire XPU выполнено прецизионное моделирование канала передачи информации между автомобилями. На рис. 3 показан сценарий обмена, в котором два автомобиля передают сигналы, а два других — принимают сигналы. Все детали автомобилей, включая корпус, стекла, детали интерьера и колеса, были учтены в симуляции. Это моделирование требует около 4 млрд ячеек и использует 96 Гбайт памяти для записи результатов вычисления ближнего и дальнего поля. Моделирование в Empire XPU заняло около 5 ч на рабочей станции Intel dual Xeon E5–2697 V3, была достигнута производительность 5 Гигаячеек в секунду. Было рассчитано 25 000 шагов по времени с достижением требуемого спада энергии 30 дБ.

Пример результатов расчета в системе Empire XPU. Электрическое поле в системе радиосвязи между автомобилями на частоте 5,6 ГГц

Рис. 3. Пример результатов расчета в системе Empire XPU. Электрическое поле в системе радиосвязи между автомобилями на частоте 5,6 ГГц

 

Выводы

Представленная технология ускорения вычислений, реализованная в системе моделирования Empire XPU, позволяет выполнять на порядок более быстрое и эффективное FDTD-моделирование СВЧ-систем, чем конкурирующие системы, на современных ЦПУ с архитектурой Intel. Интеллектуальный алгоритм определения шага вычислений по времени позволяет вычислять одновременно несколько временных шагов прямо в кэш-памяти ЦПУ. Это радикально повышает скорость вычислений, так как она становится независимой от ограничений, связанных с длительным временем доступа к основной памяти компьютера. При этом вся память компьютера доступна для выполнения электромагнитного моделирования. Система Empire XPU прекрасно подходит для моделирования таких сложных систем, как рефлекторная антенна, работающая на частоте 25 ГГц и размещенная в обтекателе, а также, например, для моделирования радиосвязи между автомобилями. Такие приложения, требующие огромного объема памяти, могут быть легко промоделированы с помощью технологии XPU на обычных рабочих станциях, а конкурирующие решения с использованием графических ускорителей могут оказаться непригодными для этой цели вследствие ограниченного размера доступной памяти.

Дополнительные примеры использования САПР Empire XPU для моделирования СВЧ-систем можно найти по адресу: http://www.empire.de/. Там же можно загрузить демонстрационную версию программы для более полного ознакомления с ее возможностями.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *