• 为什么4gpu的iter只是1gpu的 1 / 2 而不是 1 / 4
  • 训练速度:每过三四个iter会有停顿,什么影响了此处的速度?是否会成为训练速度瓶颈?