趣旨
GPUを交換した場合の学習時間の変化を試算したい。
今回は学習時間の試算を行う指標とするため、chainerのMNIST学習サンプルプログラムを使用して学習時間を求めた。
以下プログラムのtrain_mnist.pyを使用。
chainer/examples/mnist at master · pfnet/chainer · GitHub
学習結果(時間)
手持ちのCPU,GPUを使って学習させた結果を以下に示す。
GPU(CPU) | 理論上のFLOPS(TFLOPS) | サンプルプログラム計算時間(min) |
---|---|---|
core i7 4720 | 0.23 | 11 |
tx1 | 0.5 | 5.583333333 |
gtx970M | 2.657 | 1.583333333 |
gtx960 | 3.213 | 1.5 |
gtx1070 | 6.5 | 1.4 |
考察
2.5TFLOPS程度まではGPUカタログスペックと計算時間は反比例しているが、それ以降はGPUカタログスペックが上がっても計算時間は頭打ち。
→頭打ちしているGPUの使用率を見ると100パーセント全てを使い切っていない。
このことから、GPUメモリへの画像のロード時間がボトルネックになっていると考えられる。
結果からの知見
AI
detection時の計算時間も測定して評価しておく必要あり。