如果我需要实施许多“平行”的系列方案(由于问题很简单,但耗费时间——我需要用许多不同的数据组阅读同一方案),解决办法是简单的,如果我只使用一个。 所有的我都是在每次指挥后,如职务说明中,与安插人一起定期提交工作:
./program1 &
./program2 &
./program3 &
./program4
通常由不同的处理器操作每个序列程序。 这在日志服务器或独立工作站运作良好,当然是要求只提一分点的批量工作。
但是,如果我需要将同一方案的110个不同事例改为110个不同的数据集? 如果我向多个节点(第14节)提交一个呈报110 /program#指挥部的文字,批量系统是否在不同节点对不同的处理者进行每一项工作,或者是否试图将所有这些工作推向同一节点,8 核心节点?
我尝试使用简单的MPI代码读取不同的数据,但各种错误导致110个进程中约有100个成功,而另一些则坠毁。 我也考虑了工作阵列,但我不清楚我的制度是否支持。
我在个人数据集上广泛测试了序列程序——没有时间错误,我没有超过每个节点的现有记忆。