使用多卡或者单卡训练baseline时,占用的显存很小,6张卡,batchsize使用的是12,每张占用900M,再稍改大batchsize就会显示out of memory,而且训练速度也不快。这种情况怎么解决呢?
您好,请问您使用的系统环境、硬件型号是什么呢?能提供一下 import jittor后的运行log 和 nvidia smi 的结果吗?
使用多卡或者单卡训练baseline时,占用的显存很小,6张卡,batchsize使用的是12,每张占用900M,再稍改大batchsize就会显示out of memory,而且训练速度也不快。这种情况怎么解决呢?
您好,请问您使用的系统环境、硬件型号是什么呢?能提供一下 import jittor后的运行log 和 nvidia smi 的结果吗?