Próbuję obliczyć, jak obliczyć kowariancję za pomocą funkcji Covarian Python Numpy. Kiedy przekazuję mu dwie tablice jedno-wymiarowe, otrzymuję wynik 2x2 macierzy. Nie wiem, co z tym zrobić. Nie jestem świetny w statystykach, ale uważam, że kowariancja w takiej sytuacji powinna być pojedynczą liczbą. This jest tym, czego szukam. Napisałem własne:Obliczanie kowariancji za pomocą Pythona i Numpy
def cov(a, b):
if len(a) != len(b):
return
a_mean = np.mean(a)
b_mean = np.mean(b)
sum = 0
for i in range(0, len(a)):
sum += ((a[i] - a_mean) * (b[i] - b_mean))
return sum/(len(a)-1)
To działa, ale sądzę, że wersja Numpy jest znacznie wydajniejsza, gdybym mogła wymyślić, jak jej użyć.
Czy ktoś wie, jak sprawić, by funkcja Numpy cov działała jak ta, którą napisałem?
Dzięki,
Dave
Minor uwagą, ale można skorzystać z numpy do obliczania sumy: 'sum = ((a - a_mean) * (b - b-średnia)) .sum()' – PlasmaBinturong