2012-07-25 28 views
7

Mam statyw Dell Precision z systemem Ubuntu Precise i wyposażony w dwa Tesla C2075 plus Quadro 600, który jest urządzeniem wyświetlającym. Niedawno zakończyłem testy na moim komputerze stacjonarnym, a teraz próbowałem przenosić pliki na stację roboczą.Przykłady CUDA SDK rzucają różne błędy w systemie multi-gpu.

Ponieważ CUDA nie było, zainstalowałem go zgodnie z this guide i zaadaptowałem plik Makefile SDK zgodnie z this suggestions.

Obecnie stoję przed tym, że nie działa pojedyncza próbka (testowałem jak 10 różnych). Są to błędy Dostaję:


[deviceQuery] starting... 

./deviceQuery Starting... 

CUDA Device Query (Runtime API) version (CUDART static linking) 

cudaGetDeviceCount returned 10 
-> invalid device ordinal 
[deviceQuery] test results... 
FAILED 

> exiting in 3 seconds: 3...2...1...done! 

[MonteCarloMultiGPU] starting... 

CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU 
================== 
Parallelization method = threaded 
Problem scaling   = weak 
Number of GPUs   = 0 
Total number of options = 0 
Number of paths   = 262144 
main(): generating input data... 
main(): starting 0 host threads... 
Floating point exception (core dumped) 

[reduction] starting... 

reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal. 

[simplePrintf] starting... 

simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal. 

jak można se e większość błędów jest skierowana problem z wezwaniem cudaGetDeviceCount które zwracają kod błędu 10. Zgodnie z instrukcją problemu jest:

cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device. 

Niestety, jedynym rozwiązaniem udało mi się znaleźć zasugerował sprawdzenie urządzeń wtyczki zasilania. Zrobiłem to i nie było w tym nic złego. Ponowne uruchomienie stacji roboczej również nie pomaga.

Chętnie przedstawię więcej informacji na temat mojej konfiguracji. Po prostu zostaw komentarz!

+1

To jest nietypowe dla StackOveflow. Polecam sprawdzenie, czy masz pliki urządzeń '/ dev/nvidia *'. Jeśli tego nie zrobisz, przeczytaj instrukcje z podręcznika uruchamiania systemu Linux, dotyczące ręcznego ich tworzenia. – talonmies

+0

@talonmies W moim dev są 'nvidia0' i' nvidiactl'. Ile plików powinno być? –

+1

Powinien być jeden na GPU, więc trzy dla twojego systemu. – talonmies

Odpowiedz

2

Ze względu na komentarze do mojego pierwotnego pytania udało mi się rozwiązać problem z find. Poszłam za numerem this guide, aby dowiedzieć się, jak poprawnie skonfigurować rc.local (nie zapomnij o tym, że skrypt jest chmod).