用Nsight Compute测试remote端的CUDA性能(windows测linux)

网上没找到简易的教程,记录一下。挺好用的。

(1)点击connect

(2)输入必要信息 

 

(3)选择测试内容

具体的含义和nvprof的metrics一样,other选项卡里面可以配置特定的metrics,见 https://s0docs0nvidia0com.icopy.site/cuda/profiler-users-guide/index.html#metrics-reference

 

 (4)点击connect测试

有内存使用情况、资源情况的图表等,还有添加baseline对比、评价等功能

 注意事项:需要使用ROOT连接remote,remote需要root可以ssh

 参考文档:

https://devblogs.nvidia.com/using-nsight-compute-to-inspect-your-kernels/

原文地址:https://www.cnblogs.com/iwanna/p/12546685.html