Próbuję zawinąć funkcję LAPACK dgtsv
(solver dla tridiagonal systemów równań) przy użyciu Cython.Owijanie funkcji LAPACKE za pomocą Cython
Natknąłem się na this previous answer, ale ponieważ dgtsv
nie jest jedną z funkcji LAPACK owiniętych w scipy.linalg
, nie sądzę, żebym mógł użyć tego konkretnego podejścia. Zamiast tego próbuję podążać za this example.
Oto treść mojego lapacke.pxd
pliku:
ctypedef int lapack_int
cdef extern from "lapacke.h" nogil:
int LAPACK_ROW_MAJOR
int LAPACK_COL_MAJOR
lapack_int LAPACKE_dgtsv(int matrix_order,
lapack_int n,
lapack_int nrhs,
double * dl,
double * d,
double * du,
double * b,
lapack_int ldb)
... oto mój cienki Cython wrapper w _solvers.pyx
:
#!python
cimport cython
from lapacke cimport *
cpdef TDMA_lapacke(double[::1] DL, double[::1] D, double[::1] DU,
double[:, ::1] B):
cdef:
lapack_int n = D.shape[0]
lapack_int nrhs = B.shape[1]
lapack_int ldb = B.shape[0]
double * dl = &DL[0]
double * d = &D[0]
double * du = &DU[0]
double * b = &B[0, 0]
lapack_int info
info = LAPACKE_dgtsv(LAPACK_ROW_MAJOR, n, nrhs, dl, d, du, b, ldb)
return info
... i oto skrypt otoki Python i testy:
import numpy as np
from scipy import sparse
from cymodules import _solvers
def trisolve_lapacke(dl, d, du, b, inplace=False):
if (dl.shape[0] != du.shape[0] or dl.shape[0] != d.shape[0] - 1
or b.shape != d.shape):
raise ValueError('Invalid diagonal shapes')
if b.ndim == 1:
# b is (LDB, NRHS)
b = b[:, None]
# be sure to force a copy of d and b if we're not solving in place
if not inplace:
d = d.copy()
b = b.copy()
# this may also force copies if arrays are improperly typed/noncontiguous
dl, d, du, b = (np.ascontiguousarray(v, dtype=np.float64)
for v in (dl, d, du, b))
# b will now be modified in place to contain the solution
info = _solvers.TDMA_lapacke(dl, d, du, b)
print info
return b.ravel()
def test_trisolve(n=20000):
dl = np.random.randn(n - 1)
d = np.random.randn(n)
du = np.random.randn(n - 1)
M = sparse.diags((dl, d, du), (-1, 0, 1), format='csc')
x = np.random.randn(n)
b = M.dot(x)
x_hat = trisolve_lapacke(dl, d, du, b)
print "||x - x_hat|| = ", np.linalg.norm(x - x_hat)
Niestety, test_trisolve
tylko se gfaults na połączenie z _solvers.TDMA_lapacke
. Jestem prawie pewien, że moja setup.py
jest poprawna - pokazuje, że _solvers.so
jest połączone z poprawnymi bibliotekami współdzielonymi w środowisku wykonawczym.
Nie jestem pewien, jak przejść dalej - jakiekolwiek pomysły?
Krótka aktualizacja:
dla mniejszych wartości n
ja zwykle nie od razu się naruszenia ochrony pamięci, ale nie dostać wyniki nonsensowne (|| x - x_hat || powinien być bardzo bliski 0):
In [28]: test_trisolve2.test_trisolve(10)
0
||x - x_hat|| = 6.23202576396
In [29]: test_trisolve2.test_trisolve(10)
-7
||x - x_hat|| = 3.88623414288
In [30]: test_trisolve2.test_trisolve(10)
0
||x - x_hat|| = 2.60190676562
In [31]: test_trisolve2.test_trisolve(10)
0
||x - x_hat|| = 3.86631743386
In [32]: test_trisolve2.test_trisolve(10)
Segmentation fault
Zazwyczaj LAPACKE_dgtsv
powraca z kodem 0
(który powinien wskazywać sukces), ale od czasu do czasu otrzymuję -7
, co oznacza, że argument 7 (b
) miał nieprawidłową wartość. To, co się dzieje, to faktyczna modyfikacja tylko pierwszej wartości b
. Jeśli nadal dzwonię pod numer test_trisolve
, w końcu trafię na segment, nawet jeśli n
jest mały.