2011-09-01 5 views
6

Uczę się indeksu Column Store (funkcja Denali CTP3) i dowiaduję się, że do kompresji danych wykorzystuje architekturę VertiPaq. Zainteresowałem się tym, co to jest, jak to działa, to jest architektura. Sprawdziłem w Google, ale nie ma zadowalającego wyniku. Mógłby ktoś proszę dać mi znać w szczegółach, co to jest, jak to zadziała, algo/architektura za ten itpCo to jest VertiPaq i jak działa

i jak to pomaga w kompresji danych

+1

teraz, że SQL Server 2012 jest oficjalnie zwolniony z tej funkcji jest oficjalnie nazywany [xVelocity] (http://blogs.msdn.com/b/analysisservices/archive/2012/03/09 /xvelocity-and-analysis-services.aspx). Może to pomoże ci znaleźć informacje na temat wyszukiwarek. –

Odpowiedz

1

i jak to pomaga w kompresji danych

Część kompresja działa tak dobrze, ponieważ bardzo często dane w tej samej kolumnie nie różnią się znacznie. Wyobraźmy sobie na przykład (uproszczenie) kolumnę, która przechowuje wartości z wielu wejść (4) wyboru. W kolumnie przechowywania będą tylko 4 unikalne wartości, nawet jeśli w tabeli jest 8 milionów rekordów. To sprawia, że ​​wartości kolumn są łatwiejsze do skompresowania. To z kolei ułatwia dopasowanie indeksu do pamięci, a tym samym przyspieszenie wyszukiwania.

Gdy dane są przechowywane w Kolumnowa sposób, że dane mogą być często sprężonego skuteczniej niż w przypadku przechowywania w wierszami sposób. Zazwyczaj w kolumnie jest więcej redundancji niż w wierszu, , co zwykle oznacza, że ​​dane mogą być skompresowane w większym stopniu. Gdy dane są bardziej skompresowane, do wywołania danych potrzeba mniej iloczynu IO. Ponadto większa część danych może znajdować się w podanej wielkości pamięci. Zmniejszenie zamówienia może znacznie przyspieszyć czas odpowiedzi na zapytanie . Przechowywanie większej ilości roboczego zbioru danych w pamięci przyspieszy czas odpowiedzi dla kolejnych zapytań uzyskujących dostęp do tych samych danych w postaci .

Źródło: More details on columnstore technology