HDF5_USE_FILE_LOCKING="FALSE" mpirun -n 4 -mca btl ^openib python train.py
HDF5_USE_FILE_LOCKING="FALSE"
为了防止多进程打开hdf5文件互锁。
-mca btl ^openib
是为了解决
Set MCA parameter “orte_base_help_aggregate“ to 0 to see all help/error messages 这个报错.
HDF5_USE_FILE_LOCKING="FALSE" mpirun -n 4 -mca btl ^openib python train.py
HDF5_USE_FILE_LOCKING="FALSE"
为了防止多进程打开hdf5文件互锁。
-mca btl ^openib
是为了解决
Set MCA parameter “orte_base_help_aggregate“ to 0 to see all help/error messages 这个报错.