2016-06-28 40 views
5

Mam zmniejszonym mój program do następującego przykładu:Dlaczego MPI_Barrier powodować usterki segmentacji w C++

#include <mpi.h> 

int main(int argc, char * argv[]) { 
    int rank, size; 

    MPI_Init(&argc, &argv); 
    MPI_Comm_rank(MPI_COMM_WORLD, &rank); 
    MPI_Comm_size(MPI_COMM_WORLD, &size); 
    MPI_Barrier(MPI_COMM_WORLD); 
    MPI_Finalize(); 
    return 0; 
} 

skompilować i uruchomić kod i uzyskać następujący wynik:

My-MacBook-Pro-2:xCode_TrapSim user$ mpicxx -g -O0 -Wall barrierTest.cpp -o barrierTestExec 
My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec -n 2 ./barrierTestExec 

================================================================================== = 
= BAD TERMINATION OF ONE OF YOUR APPLICATION PROCESSES 
= PID 21633 RUNNING AT My-MacBook-Pro-2.local 
= EXIT CODE: 11 
= CLEANING UP REMAINING PROCESSES 
= YOU CAN IGNORE THE BELOW CLEANUP MESSAGES 
=================================================================================== 
YOUR APPLICATION TERMINATED WITH THE EXIT STRING: Segmentation fault: 11 (signal 11) 
This typically refers to a problem with your application. 
Please see the FAQ page for debugging suggestions 

Jeśli Komentuję MPI_Barrier lub uruchamiam program tylko na jednym węźle, kod działa poprawnie. Korzystam z następujących kompilatorów:

My-MacBook-Pro-2:xCode_TrapSim user$ mpiexec --version 
HYDRA build details: 
Version:         3.2 
Release Date:       Wed Nov 11 22:06:48 CST 2015 
CC:        clang  
CXX:        clang++  
F77:        /usr/local/bin/gfortran 
F90:        /usr/local/bin/gfortran 
Configure options:      '--disable-option-checking' '--prefix=/usr/local/Cellar/mpich/3.2_1' '--disable-dependency-tracking' '--disable-silent-rules' '--mandir=/usr/local/Cellar/mpich/3.2_1/share/man' 'CC=clang' 'CXX=clang++' 'FC=/usr/local/bin/gfortran' 'F77=/usr/local/bin/gfortran' '--cache-file=/dev/null' '--srcdir=.' 'CFLAGS= -O2' 'LDFLAGS=' 'LIBS=-lpthread ' 'CPPFLAGS= -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpl/include -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/openpa/src -D_REENTRANT -I/private/tmp/mpich-20160606-48824-1qsaqn8/mpich-3.2/src/mpi/romio/include' 
Process Manager:       pmi 
Launchers available:      ssh rsh fork slurm ll lsf sge manual persist 
Topology libraries available:   hwloc 
Resource management kernels available: user slurm ll lsf sge pbs cobalt 
Checkpointing libraries available:  
Demux engines available:     poll select 


My-MacBook-Pro-2:xCode_TrapSim user$ clang --version 
Apple LLVM version 7.3.0 (clang-703.0.31) 
Target: x86_64-apple-darwin15.5.0 
Thread model: posix 
InstalledDir:  /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin 

Wydaje się, że powinien to być trywialny problem, ale nie mogę tego zrozumieć. Dlaczego MPI_Barrier powodowałby ten prosty kod w celu usunięcia błędu?

+0

Nie mogę się rozmnażać. Twój kod działa tutaj bez awarii. – amaurea

+0

Nie jestem zaskoczony, to prawie trywialny przykład MPI, a jednak jakakolwiek kombinacja kompilacji, którą mam, lub coś po prostu nie współpracuje. Po prostu mam nadzieję, że ktoś już to widział. – jboss

+0

Witamy w SO. Podczas gdy twoje pytanie jest dobrze zadawane, nadal trudno jest je odtworzyć, aby zrozumieć twój problem. Prawdopodobną odpowiedzią jest * coś jest nie tak z twoją instalacją MPI *, ale to nie jest zbyt pomocne. Czy mógłbyś dodać jakieś szczegóły na temat instalacji MPI? Ostatecznie raport o błędzie do dostawcy pakietu (zakładając, że pochodzi z repozytorium) może być bardziej obiecujący. – Zulan

Odpowiedz

0

Trudno jest zdecydować, co jest nie tak z twoją instalacją. Jednakże, jeśli można użyć dowolnego z smakach MPI, może można spróbować tego:

http://www.owsiak.org/?p=3492

Wszystko, co mogę powiedzieć, to działa z Open MPI

~/opt/usr/local/bin/mpicxx -g -O0 -Wall barrierTestExec.cpp -o barrierTestExec 
~/opt/usr/local/bin/mpiexec -n 2 ./barrierTestExec 

i nie jest wyjątkiem w moim walizka. To naprawdę wydaje się być specyficzne dla środowiska.