W jaki sposób zaimplementowano funkcję numpy.cov()?

mam własną implementację funkcji kowariancji na podstawie równania:W jaki sposób zaimplementowano funkcję numpy.cov()?

enter image description here

''' 
Calculate the covariance coefficient between two variables. 
''' 

import numpy as np 

X = np.array([171, 184, 210, 198, 166, 167]) 
Y = np.array([78, 77, 98, 110, 80, 69]) 

# Expected value function. 
def E(X, P): 
    expectedValue = 0 
    for i in np.arange(0, np.size(X)): 
     expectedValue += X[i] * (P[i]/np.size(X)) 
    return expectedValue 

# Covariance coefficient function. 
def covariance(X, Y): 
    ''' 
    Calculate the product of the multiplication for each pair of variables 
    values. 
    ''' 
    XY = X * Y 

    # Calculate the expected values for each variable and for the XY. 
    EX = E(X, np.ones(np.size(X))) 
    EY = E(Y, np.ones(np.size(Y))) 
    EXY = E(XY, np.ones(np.size(XY))) 

    # Calculate the covariance coefficient. 
    return EXY - (EX * EY) 

# Display matrix of the covariance coefficient values. 
covMatrix = np.array([[covariance(X, X), covariance(X, Y)], 
[covariance(Y, X), covariance(Y, Y)]]) 
print("My function:", covMatrix) 

# Display standard numpy.cov() covariance coefficient matrix. 
print("Numpy.cov() function:", np.cov([X, Y]))

Ale problemem jest to, że ja dostaję różne wartości z mojej funkcji i od numpy.cov(), tj:

My function: [[ 273.88888889 190.61111111] 
[ 190.61111111 197.88888889]] 
Numpy.cov() function: [[ 328.66666667 228.73333333] 
[ 228.73333333 237.46666667]]

Dlaczego tak jest? W jaki sposób zaimplementowano funkcję numpy.cov()? Jeśli funkcja numpy.cov() jest dobrze zaimplementowana, co robię źle? Powiem tylko, że wyniki mojej funkcji covariance() są zgodne z wynikami z paper przykładów w Internecie do obliczania współczynnika kowariancji, np. http://www.naukowiec.org/wzory/statystyka/kowariancja_11.html.

Źródło

2014-12-12 bluevoxel

Funkcja numpy ma inną normalizację niż domyślna. Spróbuj zamiast

>>> np.cov([X, Y], ddof=0) 
array([[ 273.88888889, 190.61111111], 
     [ 190.61111111, 197.88888889]])

Referencje:

Źródło

2014-12-12 16:56:35 YXD

sprawdziłem, dlatego poprosiłem powyższe pytanie. 'ddof' oznacza' stopnie swobody'? – bluevoxel

Tak, to prawda. – YXD

Aaah, wszystko jest jasne. Wielkie dzięki. – bluevoxel

W jaki sposób zaimplementowano funkcję numpy.cov()?

Odpowiedz

Powiązane problemy