Рассматриваются проблемы пропускной способности в кэшах современных микропроцессоров. Приводится обзор устройства выходного потока данных кэша L2 системы на кристалле «Эльбрус-2S». Излагается алгоритм управления потоком.
Рассматривается проблема упорядоченного выполнения DMA-операций. Описывается механизм предварительного кэширования как один из способов решения проблемы. Приводятся подробности реализации данного механизма в СнК «Эльбрус-4С+». Описываемый метод сравнивается с другими известными методами решения проблемы.
Приводятся общие характеристики и принципы работы кэша третьего уровня микропроцессора «Эльбрус-4С+». Дается описание особенностей структурной схемы: раздельные конвейеры тэгов и данных, буфер обрабатываемых запросов, буфер вытесненных модифицированных строк. Описываются протоколы локального справочника и обработки запросов. Сравнивается время доступа в кэш-память разработанного микропроцессора и зарубежных аналогов.
Описана оптимизация межпроцессорного когерентного протокола с использованием справочника, которая позволяет перейти от широковещательного принципа опроса процессоров к индивидуальному опросу в том случае, если это необходимо с точки зрения выполнения протокола когерентности. Рассмотрена оптимизация устройства справочника, позволяющая повысить объём покрываемой им кэш-памяти.
Описаны структура и характеристики распределенного коммутатора общего кэша третьего уровня микропроцессора «Эльбрус‑4С+» – буферизующего двунаправленного кольца, соединяющего процессорные ядра с банками L3-кэша. Рассмотрены оптимизации, примененные для уменьшения времени доступа в кэш и числа конфликтов в кольце. Приведены результаты моделирования различных вариантов топологии коммутатора.
| Назад 1 2 3 4 5 Дальше |