E
ehaas
Hallo,
ich habe ein MPI-Problem mit OpenSuse 10.3 Workstations.
Ich habe auf einem Cluster (NEC Hardware, Scientific Linux) mehrere MPI Versionen laufen und das funktioniert prima.
Die Entwickler sollen aber lokal an Ihren Workstation Ihre Software testen, so dass dort die identischen MPI Versionen installiert sein müssen. Alle MPI Versionen (MPI-CH und LAM-MPI) werden jeweils mit dem Intel und dem Portland Compiler als RPM gebaut.
Die lokalen Workstations laufen jetzt alle unter OpenSuse 10.3 (eine Vorgabe meiner zentralen IT) und nach dem Update laufen die lokalen MPI-Anwendungen nicht mehr:
MPI-CH 1.2.7 Portland F90 7.07
stdout der einzelnen processoren istwas :
Der Code läuft ohne MPI auf der OpenSuse Workstation, sowie unter OpenMP parallel auf der Workstation. Mit MPI läuft der Code auf unserem Cluster...
Alle MPI Test examples bringen diesen oder ähnlichen Fehler, funktionieren also alle nicht
Passwordless login ist gegeben, Firewall ist abgeschalten, mehr hab ich bei den alten 10.2 Clients auch nicht gemacht und die liefen alle problemlos...
Kann es sein dass OpneSuse da eine krumme Einstellung hat, die ich nicht finde???
ich habe ein MPI-Problem mit OpenSuse 10.3 Workstations.
Ich habe auf einem Cluster (NEC Hardware, Scientific Linux) mehrere MPI Versionen laufen und das funktioniert prima.
Die Entwickler sollen aber lokal an Ihren Workstation Ihre Software testen, so dass dort die identischen MPI Versionen installiert sein müssen. Alle MPI Versionen (MPI-CH und LAM-MPI) werden jeweils mit dem Intel und dem Portland Compiler als RPM gebaut.
Die lokalen Workstations laufen jetzt alle unter OpenSuse 10.3 (eine Vorgabe meiner zentralen IT) und nach dem Update laufen die lokalen MPI-Anwendungen nicht mehr:
MPI-CH 1.2.7 Portland F90 7.07
Code:
mpirun -np 4 -machinefile hostfile xy.exe
tukan -- rsl_nproc_all 4, rsl_myproc 3
tukan -- rsl_nproc_all 4, rsl_myproc 1
tukan -- rsl_nproc_all 4, rsl_myproc 0
tukan -- rsl_nproc_all 4, rsl_myproc 2
rm_l_1_11285: (0.667969) net_send: could not write to fd=5, errno = 32
rm_l_3_11342: (0.015625) net_send: could not write to fd=5, errno = 32
stdout der einzelnen processoren istwas :
Code:
p1_11283: p4_error: interrupt SIGSEGV: 11
p3_11341: p4_error: net_recv read: probable EOF on socket: 1
Der Code läuft ohne MPI auf der OpenSuse Workstation, sowie unter OpenMP parallel auf der Workstation. Mit MPI läuft der Code auf unserem Cluster...
Alle MPI Test examples bringen diesen oder ähnlichen Fehler, funktionieren also alle nicht
Passwordless login ist gegeben, Firewall ist abgeschalten, mehr hab ich bei den alten 10.2 Clients auch nicht gemacht und die liefen alle problemlos...
Kann es sein dass OpneSuse da eine krumme Einstellung hat, die ich nicht finde???