Mam statyw Dell Precision z systemem Ubuntu Precise i wyposażony w dwa Tesla C2075 plus Quadro 600, który jest urządzeniem wyświetlającym. Niedawno zakończyłem testy na moim komputerze stacjonarnym, a teraz próbowałem przenosić pliki na stację roboczą.Przykłady CUDA SDK rzucają różne błędy w systemie multi-gpu.
Ponieważ CUDA nie było, zainstalowałem go zgodnie z this guide i zaadaptowałem plik Makefile SDK zgodnie z this suggestions.
Obecnie stoję przed tym, że nie działa pojedyncza próbka (testowałem jak 10 różnych). Są to błędy Dostaję:
[deviceQuery] starting...
./deviceQuery Starting...
CUDA Device Query (Runtime API) version (CUDART static linking)
cudaGetDeviceCount returned 10
-> invalid device ordinal
[deviceQuery] test results...
FAILED
> exiting in 3 seconds: 3...2...1...done!
[MonteCarloMultiGPU] starting...
CUDA error at MonteCarloMultiGPU.cpp:235 code=23510 (cudaErrorInvalidDevice) "cudaGetDeviceCount(&GPU_N)"MonteCarloMultiGPU
==================
Parallelization method = threaded
Problem scaling = weak
Number of GPUs = 0
Total number of options = 0
Number of paths = 262144
main(): generating input data...
main(): starting 0 host threads...
Floating point exception (core dumped)
[reduction] starting...
reduction.cpp(124) : cudaSafeCallNoSync() Runtime API error 10 : invalid device ordinal.
[simplePrintf] starting...
simplePrintf.cu(193) : CUDA Runtime API error 10: invalid device ordinal.
jak można se e większość błędów jest skierowana problem z wezwaniem cudaGetDeviceCount które zwracają kod błędu 10. Zgodnie z instrukcją problemu jest:
cudaErrorInvalidDevice: This indicates that the device ordinal supplied by the user does not correspond to a valid CUDA device.
Niestety, jedynym rozwiązaniem udało mi się znaleźć zasugerował sprawdzenie urządzeń wtyczki zasilania. Zrobiłem to i nie było w tym nic złego. Ponowne uruchomienie stacji roboczej również nie pomaga.
Chętnie przedstawię więcej informacji na temat mojej konfiguracji. Po prostu zostaw komentarz!
To jest nietypowe dla StackOveflow. Polecam sprawdzenie, czy masz pliki urządzeń '/ dev/nvidia *'. Jeśli tego nie zrobisz, przeczytaj instrukcje z podręcznika uruchamiania systemu Linux, dotyczące ręcznego ich tworzenia. – talonmies
@talonmies W moim dev są 'nvidia0' i' nvidiactl'. Ile plików powinno być? –
Powinien być jeden na GPU, więc trzy dla twojego systemu. – talonmies