powolna wydajność inicjatora wielowymiarowych macierzy

Mam pewne dziwne wyniki, których nie mogę wyjaśnić. Wydaje się, że ta liniapowolna wydajność inicjatora wielowymiarowych macierzy

d = new double[4, 4]{{1, 0, 0, 0}, 
        {0, 1, 0, 0}, 
        {0, 0, 1, 0}, 
        {0, 0, 0, 1},};

jest 4 razy wolniej niż ten jeden

d = new double[4, 4]; 
d[0, 0] = 1; d[0, 1] = 0; d[0, 2] = 0; d[0, 3] = 0; 
d[1, 0] = 0; d[1, 1] = 1; d[1, 2] = 0; d[1, 3] = 0; 
d[2, 0] = 0; d[2, 1] = 0; d[2, 2] = 1; d[2, 3] = 0; 
d[3, 0] = 0; d[3, 1] = 0; d[3, 2] = 0; d[3, 3] = 1;

(i to nie jest nawet biorąc pod uwagę fakt, że w tym przykładzie mogę pominąć te wszystkie = 0 przypisania)

Wiem, że zapętlenie wielowymiarowej tablicy w języku C# może być wolne ze względu na sprawdzanie granic. Ale nie ma tu pętli, nie są wymagane kontrole graniczne, a cała linia inicjalizująca tablicę może zostać rozwiązana podczas kompilacji.

Drugi blok kodu musi jednak najpierw zainicjować tablicę na zero, a następnie nadpisać każdą wartość osobno.
Więc jaki jest problem?

Jaki byłby najlepszy sposób zainicjowania tej tablicy, jeśli wydajność jest problemem?

Użyłem następujący kod do pomiaru wydajności:

using System; 
using System.Diagnostics; 
class Program 
{ 
    public static double[,] d; // global static variable to prevent the JIT optimizing it away 

    static void Main(string[] args) 
    { 
     Stopwatch watch; 
     int numIter = 10000000; // repeat all tests this often 

     double[,] d2 = new double[4, 4]{{1, 0, 0, 0}, 
             {0, 1, 0, 0}, 
             {0, 0, 1, 0}, 
             {0, 0, 0, 1},}; 

     // ================================================================ 
     // use arrayInitializer: slowest 
     watch = Stopwatch.StartNew(); 
     for (int i = 0; i < numIter; i++) 
     { 
      d = new double[4, 4]{{1, 0, 0, 0}, 
           {0, 1, 0, 0}, 
           {0, 0, 1, 0}, 
           {0, 0, 0, 1},}; 
     } 
     Console.WriteLine("ArrayInitializer: \t{0:0.##########}ms", watch.ElapsedMilliseconds * 1.0/numIter); 

     // ================================================================ 
     // use Array.Copy: faster 
     watch = Stopwatch.StartNew(); 
     for (int i = 0; i < numIter; i++) 
     { 
      d = new double[4, 4]; 
      Array.Copy(d2, d, d2.Length); 
     } 
     Console.WriteLine("new + Array.Copy: \t{0:0.##########}ms", watch.ElapsedMilliseconds * 1.0/numIter); 

     // ================================================================ 
     // direct assignment: fastest 
     watch = Stopwatch.StartNew(); 
     for (int i = 0; i < numIter; i++) 
     { 
      d = new double[4, 4]; 
      d[0, 0] = 1; d[0, 1] = 0; d[0, 2] = 0; d[0, 3] = 0; 
      d[1, 0] = 0; d[1, 1] = 1; d[1, 2] = 0; d[1, 3] = 0; 
      d[2, 0] = 0; d[2, 1] = 0; d[2, 2] = 1; d[2, 3] = 0; 
      d[3, 0] = 0; d[3, 1] = 0; d[3, 2] = 0; d[3, 3] = 1; 
     } 
     Console.WriteLine("direct assignment: \t{0:0.##########}ms", watch.ElapsedMilliseconds * 1.0/numIter); 
    } 
}

Efekty:

ArrayInitializer:  0,0007917ms 
new + Array.Copy:  0,0002739ms 
direct assignment:  0,0002281ms

Źródło

2013-04-15 HugoRune

Przyjrzenie się skompilowanej IL kodu jest bardzo różne. ArrayInitializer używa metody RuntimeHelpers.InitializeArray. Ale to jest najlepsze, co mogę zrobić ... Ciekawe pytanie! – Aron

Nigdy nie używasz utworzonej tablicy, więc czy cała alokacja tablicy nie zostanie zoptymalizowana przez kompilator? – Servy

Dlatego ustawiłem tablicę jako statyczną. Jeśli jest to tylko zmienna lokalna, to faktycznie jest zoptymalizowana, ale tylko dla pierwszego przypadku testowego z inicjatorem macierzy. Ale jeśli 'd' jest zmienną statyczną, nie powinno być takiej optymalizacji, ponieważ inny wątek mógłby uzyskać do niej dostęp; a testy czasowe zdają się to potwierdzać. – HugoRune

Oto dobre wyjaśnienie inicjalizatorów tablicy i dlaczego widzisz takie różne wyniki : http://bartdesmet.net/blogs/bart/archive/2008/08/21/how-c-array-initializers-work.aspx

Zasadniczo inicjator tablicowy polega na tworzeniu niestandardowych struktur, a bezpośrednie przypisywanie każdego elementu jest po prostu bezpośrednim przypisaniem do stosu i choć jest szybsze.

Źródło

2013-04-16 15:00:44 Lanorkin

powolna wydajność inicjatora wielowymiarowych macierzy

Odpowiedz

Powiązane problemy