Próbuję znaleźć distance correlation między kolumnami, spójrz na poniższy kod. Większość czasu zwraca wynik wyższy niż 1, co nie jest możliwe, ponieważ korelacja odległości wynosi od 0 do 1. Można przeczytać o korelacji odległości scipy here.Scipy: korelacja odległości jest większa niż 1
import numpy as np
from scipy.spatial import distance
x = np.random.uniform(-1, 1, 10000)
print distance.correlation(x, x**2)
1,00210811815
Co tu jest źle i jak mogę go zmierzyć?
upd1:Link to issue na github
To wygląda dziwnie. Próbowałem go w R używając pakietu energetycznego i zawsze kończyłem z wartościami około 0.49, więc wydaje się, że brakuje współczynnika 0,5. Nie ma pojęcia ... może warto otworzyć problem na ich stronie github. – Cleb
@Cleb, Pewnie, otworzę numer – Rocketq
@Rocketq: dlaczego myślisz, że funkcja ma obliczać korelację odległości --- dokumentacja mówi, że oblicza odległość korelacji --- która może jest zupełnie inna? –