Обосновывается важность, и описываются проблемы создания прототипов проектируемых микропроцессоров с использованием программируемых логических интегральных схем. Выработанные компанией решения представлены на примере ее передовой разработки – системы на кристалле «Эльбрус-2S».
Дано краткое описание архитектуры процессора Эльбрус, рассмотрено применение его особенностей для реализации быстрого преобразования Фурье (БПФ). Предложен алгоритм реализации БПФ для данной архитектуры. Подробно рассмотрена оптимизация алгоритма для 32-разрядных данных с плавающей точкой. Произведен сравнительный анализ предложенного алгоритма с алгоритмом FFTW и представлены результаты работы алгоритма на разных размерах.
Рассматривается общая схема работы двоичного транслятора, многоуровневая система оптимизаций, технологии сокращения накладных расходов на трансляцию (долговременное хранение кодов и параллельная трансляция).
Рассматриваются проблемы, возникающие при передаче данных между доменами с разными частотами, и стандартная схема, используемая для их решения.
Описаны особенности поддержки NUMA в ядре ОС Linux для архитектуры «Эльбрус». Рассматриваются изменения в архитектурно-независимой и архитектурно-зависимой частях ядра, связанные с NUMA и реализацией библиотеки libnuma. Перечислены разработанные авторами методы оптимизации подсистемы памяти ядра, эффективные для NUMA платформ. Описан алгоритм оптимизации, суть которой – создание копий исполняемого кода и константных данных ядра на каждом узле NUMA машины с целью минимизации времени вызова функций ядра на всех узлах.
| Назад 1 2 3 4 5 Дальше |