Linki wprowadzające znalazłem podczas poszukiwania: 6.59.14 Loop-Specific Pragmas 2.100 Pragma Loop_Optimize How to give hint to gcc about loop count Tell gcc to specifically unroll a loop How to Forc
Próbuję ocenić różnice wydajności między OpenCL dla procesorów graficznych AMD i Nvidia. Mam jądro, które wykonuje mnożenie macierzy-wektora. Obecnie uruchamiam jądro w dwóch różnych systemach, mój la