z danych ekspresji genów (40000 genów (zmiennych) x 30 obserwacji) Chcę utworzyć macierz kowariancji 40000 x 40000. To zdecydowanie jest większe niż moja pamięć RAM. W pakiecie "ff" udało mi się wstępnie przydzielić pustą matrycę 40000x40000 dla korelacji. Jednak funkcja "cov" lub "cor" będzie zarządzać tylko macierzą kowariancji 5000x5000 w moim systemie, więc muszę wykonać blokowe obliczenia 1: 5000, 5001: 10000 itd. I wypełnić wstępnie przydzieloną macierz wzdłuż przekątnej. Czy ktoś wie o algorytmie wypełniania "brakujących łat" w macierzy, tj. Kowariancji (lub korelacji pomiędzy) 1 i 22000. Wiem, że potrafię wykonywać wszystkie kombinacje par i wypełniać macierz jeden po drugim, ale "cor "jest dość szybki ... Czy istnieje sposób obliczenia cov (lub cor) z 1/22000 przy użyciu już obliczonych kowariancji?DUŻA macierz kowariancji w R
Z góry dziękuję!
Hmm, która stałaby 64 kombinacji z 5000 kolumny bloków ... – anspiess
Wydaje mi się, że pytanie jest o macierzy korelacji i odpowiedź jest o współczynnik korelacji. Są to powiązane, ale różne koncepcje. –