2017-01-05 43 views
7

Jestem na Ubuntu 14.04, pakiet narzędzi CUDA 8, wersja sterownika 367.48.Proces nvidia-smi wisi i nie można go zabić przy pomocy SIGKILL albo

Po wydaniu polecenia nvidia-smi po prostu zawiesza się na czas nieokreślony. Po ponownym zalogowaniu się i próbie zabicia tego procesu nvidia-smi, na przykład na kill -9 <PID>, to po prostu nie zostanie zabite. Jeśli podam kolejną komendę nvidia-smi, oba procesy będą działać - oczywiście podczas logowania z innej powłoki, ponieważ utknie ona tak jak poprzednio.

Czy może to być problem związany ze sterownikiem? To nie jest najnowszy, ale wciąż całkiem nowy ..

+1

To nie jest prawdziwa odpowiedź, ale dobrze jest wiedzieć, że problem zniknął, usuwając sterownik 367 i instalując go ponownie za pomocą pakietu 'apt', który jest dostarczany w wersji ** 361.93.02 ** sterownika Nvidia. – bio

+0

To też mi się przydarzyło. Zastanawiam się, w jaki sposób proces w stanie działania nie może zostać zabity przy pomocy SIGKILL? – Reith

+1

@Jest pewne specjalne stany procesowe, których jądro nie może zakończyć: proces init, procesy zombie i nieprzerwanie procesy spania (te budzą się tylko wtedy, gdy dostępny jest określony zasób IO). Mogą one zostać zabite tylko przez zamknięcie/ponowne uruchomienie. –

Odpowiedz

0

Biorąc pod uwagę twoją szczególną sytuację, spróbowałbym ją przeinstalować, zgodnie z propozycją bio.

Czy próbowałeś już robić sudo kill -9 <PID>? Prawdopodobnie nadal go tam wstawiałeś. Lub, być może, robisz sudo kill -15 <PID>, aby to zakończyć. Wydaje się, że twój sterownik utknął w zawieszeniu signal 1, biorąc pod uwagę to, co nam powiedziałeś.

Wydaje się dziwne, że nvidia-smi zawiesił się spontanicznie po uruchomieniu, ale problem może nie być poprawnie zainstalowany lub nie być uruchamiany z dostępem administratora.

Czy próbowałeś użyć:

service nvidia-smi status pgrep nvidia-smi ps -aux | grep nvidia-smi

aby uzyskać jego obecny stan?

W każdym razie, miej nadzieję, że to pomaga. Chciałbym spróbować odinstalować i ponownie zainstalować lub użyć sudo apt --fix-broken, aby spróbować naprawić uszkodzone pakiety/sterowniki.

Pozdrawiam!