Nie jest niczym niezwykłym, że mam program, którego wydajność zależy w dużej mierze od kilku funkcji i chcę być w stanie zmierzyć prędkość pojedynczej pętli lub segmentu kodu do pojedynczej taktowania, aby wiedzieć, czy moje zmiany rzeczywiście poprawiają się wydajność lub czy po prostu przychodzę do placebo "zoptymalizowanego" kodu.Jakie jest twoje ulubione narzędzie do profilowania niskiego poziomu?
Osobiście używam ffmpeg'a "bench.h", zestawu makr C, które używają rdtsc do pomiaru czasu zegara i automatycznie kompensuje przełączniki kontekstowe i podobne. Oczywiście takie podejście ma swoje słabości; jakie inne metody profilowania niskopoziomowego robią użytkownicy StackOverflow?