Jak działa pamięć podręczna L2 na procesorach GPU z architekturą Keplera pod względem lokalizacji referencji? Na przykład, jeśli wątek uzyskuje dostęp do adresu w pamięci globalnej, zakładając, że wartość tego adresu nie znajduje się w pamięci podręcznej L2, w jaki sposób buforowana jest wartość? Czy to czasowe? Czy są też inne wartości w pobliżu tego adresu wprowadzone do pamięci podręcznej L2 zbyt (przestrzenne)?Pamięć podręczna L2 w Kepler
Poniższe zdjęcie pochodzi z białej księgi firmy NVIDIA.
cache L2 został wprowadzony ze zdolności obliczeniowej 2.0 i wyższej i nadal być wspierane na architekturze Kepler. Zastosowana polityka buforowania to LRU (ostatnio używana), której głównym zamiarem było uniknięcie wąskiego gardła globalnej przepustowości pamięci. Przeczytałem to z książki "Projektowanie i rozwój aplikacji Cuda". Nie jestem pewien, czy to odpowie na twoje pytanie. –
Pamięć podręczna L1 ma rozmiar pamięci podręcznej o długości 128 bajtów. Pamięć podręczna L2 ma wielkość pamięci podręcznej o wielkości 32 bajtów. Tak więc brak L2 wyzwala ładunek 32-bajtowy. Kepler zwykle nie ma włączonej L1 dla zwykłych globalnych obciążeń. –