使用CUDA Runtime API测耗时

NoSuchKey