Owijanie funkcji LAPACKE za pomocą Cython

Próbuję zawinąć funkcję LAPACK dgtsv (solver dla tridiagonal systemów równań) przy użyciu Cython.Owijanie funkcji LAPACKE za pomocą Cython

Natknąłem się na this previous answer, ale ponieważ dgtsv nie jest jedną z funkcji LAPACK owiniętych w scipy.linalg, nie sądzę, żebym mógł użyć tego konkretnego podejścia. Zamiast tego próbuję podążać za this example.

Oto treść mojego lapacke.pxd pliku:

ctypedef int lapack_int 

cdef extern from "lapacke.h" nogil: 

    int LAPACK_ROW_MAJOR 
    int LAPACK_COL_MAJOR 

    lapack_int LAPACKE_dgtsv(int matrix_order, 
          lapack_int n, 
          lapack_int nrhs, 
          double * dl, 
          double * d, 
          double * du, 
          double * b, 
          lapack_int ldb)

... oto mój cienki Cython wrapper w _solvers.pyx:

#!python 

cimport cython 
from lapacke cimport * 

cpdef TDMA_lapacke(double[::1] DL, double[::1] D, double[::1] DU, 
        double[:, ::1] B): 

    cdef: 
     lapack_int n = D.shape[0] 
     lapack_int nrhs = B.shape[1] 
     lapack_int ldb = B.shape[0] 
     double * dl = &DL[0] 
     double * d = &D[0] 
     double * du = &DU[0] 
     double * b = &B[0, 0] 
     lapack_int info 

    info = LAPACKE_dgtsv(LAPACK_ROW_MAJOR, n, nrhs, dl, d, du, b, ldb) 

    return info

... i oto skrypt otoki Python i testy:

import numpy as np 
from scipy import sparse 
from cymodules import _solvers 


def trisolve_lapacke(dl, d, du, b, inplace=False): 

    if (dl.shape[0] != du.shape[0] or dl.shape[0] != d.shape[0] - 1 
      or b.shape != d.shape): 
     raise ValueError('Invalid diagonal shapes') 

    if b.ndim == 1: 
     # b is (LDB, NRHS) 
     b = b[:, None] 

    # be sure to force a copy of d and b if we're not solving in place 
    if not inplace: 
     d = d.copy() 
     b = b.copy() 

    # this may also force copies if arrays are improperly typed/noncontiguous 
    dl, d, du, b = (np.ascontiguousarray(v, dtype=np.float64) 
        for v in (dl, d, du, b)) 

    # b will now be modified in place to contain the solution 
    info = _solvers.TDMA_lapacke(dl, d, du, b) 
    print info 

    return b.ravel() 


def test_trisolve(n=20000): 

    dl = np.random.randn(n - 1) 
    d = np.random.randn(n) 
    du = np.random.randn(n - 1) 

    M = sparse.diags((dl, d, du), (-1, 0, 1), format='csc') 
    x = np.random.randn(n) 
    b = M.dot(x) 

    x_hat = trisolve_lapacke(dl, d, du, b) 

    print "||x - x_hat|| = ", np.linalg.norm(x - x_hat)

Niestety, test_trisolve tylko se gfaults na połączenie z _solvers.TDMA_lapacke. Jestem prawie pewien, że moja setup.py jest poprawna - pokazuje, że _solvers.so jest połączone z poprawnymi bibliotekami współdzielonymi w środowisku wykonawczym.

Nie jestem pewien, jak przejść dalej - jakiekolwiek pomysły?

Krótka aktualizacja:

dla mniejszych wartości n ja zwykle nie od razu się naruszenia ochrony pamięci, ale nie dostać wyniki nonsensowne (|| x - x_hat || powinien być bardzo bliski 0):

In [28]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 6.23202576396 

In [29]: test_trisolve2.test_trisolve(10) 
-7 
||x - x_hat|| = 3.88623414288 

In [30]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 2.60190676562 

In [31]: test_trisolve2.test_trisolve(10) 
0 
||x - x_hat|| = 3.86631743386 

In [32]: test_trisolve2.test_trisolve(10) 
Segmentation fault

Zazwyczaj LAPACKE_dgtsv powraca z kodem 0 (który powinien wskazywać sukces), ale od czasu do czasu otrzymuję -7, co oznacza, że argument 7 (b) miał nieprawidłową wartość. To, co się dzieje, to faktyczna modyfikacja tylko pierwszej wartości b. Jeśli nadal dzwonię pod numer test_trisolve, w końcu trafię na segment, nawet jeśli n jest mały.

Źródło

2014-04-21 ali_m

OK, doszedłem do tego w końcu - wydaje mi się, że źle zrozumiałem, o czym w tym przypadku mówi wiersz i kolumna-major.

Ponieważ tablice sąsiadujące z C podążają za rzędem-głównym porządkiem, założyłem, że powinienem podać LAPACK_ROW_MAJOR jako pierwszy argument dla LAPACKE_dgtsv.

W rzeczywistości, jeśli zmienię

info = LAPACKE_dgtsv(LAPACK_ROW_MAJOR, ...)

info = LAPACKE_dgtsv(LAPACK_COL_MAJOR, ...)

wtedy moja funkcja działa:

test_trisolve2.test_trisolve() 
0 
||x - x_hat|| = 6.67064747632e-12

To wydaje się dość intuicyjne do mnie - może ktoś wyjaśnić, dlaczego to jest przypadek?

Źródło

2014-04-21 17:14:24

Mimo że pytanie jest dość stare, wydaje się, że nadal jest ono istotne. Obserwowane zachowanie się jest wynikiem błędnej parametru LDB:

Fortran tablice są kol głównym a głównym wymiar tablicy B odpowiada N. Zatem LDB> = max (1, Y).
Z głównym wierszem LDB odpowiada NRHS i dlatego warunek LDB> = max (1, NRHS) musi być spełniony.

Komentarz # B oznacza (LDB, NRHS) nie jest prawidłowe, ponieważ b ma wymiar (LDB, N) i LDB powinien wynosić 1 w tym przypadku.

Przejście z LAPACK_ROW_MAJOR na LAPACK_COL_MAJOR rozwiązuje problem, o ile NRHS jest równe 1. Układ pamięci col-dur (N, 1) jest taki sam, jak wiersz główny (1, N). Jednak zawiedzie, jeśli NRHS jest większa niż 1.

Źródło

2017-07-01 19:36:40 user2105367

Owijanie funkcji LAPACKE za pomocą Cython

Odpowiedz

Powiązane problemy