NSight Compute 用户手册(中)

NSight Compute 用户手册(中)

NVIDIA Nsight Compute支持密码和私钥身份验证方法。在此对话框中,选择身份验证方法并输入以下信息:             

密码             

IP/主机名:目标设备的IP地址或主机名。             

用户名:用于SSH连接的用户名。             

Password:用于SSH连接的用户密码。             

端口:用于SSH连接的端口。(默认值为22。)              

部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。             

私钥

 

 IP/主机名:目标设备的IP地址或主机名。             

用户名:用于SSH连接的用户名。             

SSH私钥:用于向SSH服务器进行身份验证的私钥。             

SSH-Key-Passphrase:您的私钥的密码短语。             

部署目录:目标设备上用于部署支持文件的目录。指定的用户必须对此位置具有写入权限。             

输入所有信息后,单击“添加”按钮以使用此新连接。             

当在连接对话框中选择远程连接时,应用程序可执行文件浏览器将使用配置的SSH连接浏览远程文件系统,允许用户选择远程设备上的目标应用程序。             

在远程设备上启动“活动”时,将执行以下步骤:             

命令行探查器和支持文件将复制到远程设备上的部署目录中。(仅复制不存在或过期的文件。)             

应用程序可执行文件在远程设备上执行。             

对于交互式概要文件活动,将建立到远程应用程序的连接,并开始分析会话。              

对于非交互式概要文件活动,远程应用程序在命令行探查器下执行,并生成指定的报告文件。             

对于非交互式分析活动,生成的报告文件将复制回主机并打开。             

每个步骤的进度都显示在进度日志中。             

进度日志

请注意,一旦远程启动了任一活动类型,就可以在远程设备上的部署目录中找到进一步分析会话所需的工具。             

交互式配置文件活动             

交互式概要文件活动允许您启动控制目标应用程序执行的会话,类似于调试器。您可以单步执行API调用和工作负载(CUDA内核),暂停和恢复,并以交互方式选择感兴趣的内核和要收集的度量。             

此活动当前不支持分析或附加到子进程。             

支持NVTX             

收集应用程序或其库提供的NVTX信息。需要支持单步执行到特定的NVTX上下文。             

禁用分析启动/停止             

忽略应用程序对cu(da)ProfilerStart或cu(da)ProfilerStop的调用。             

从一开始启用分析             

从应用程序启动时启用分析。如果应用程序在第一次调用此API之前调用cu(da)ProfilerStart和内核,则禁用此选项非常有用。请注意,禁用此选项不会阻止您手动分析内核。              

缓存控制

控制分析期间GPU缓存的行为。允许的值:对于Flush All,在评测期间的每个内核重播迭代之前,都会刷新所有GPU缓存。虽然应用程序的执行环境中的度量值可能稍有不同而不会使缓存失效,但此模式在重播过程中以及在目标应用程序的多个运行中提供了最可复制的度量结果。             

对于Flush None,在分析期间不刷新GPU缓存。如果度量收集只需要一个内核重播过程,这可以提高性能并更好地复制应用程序行为。然而,一些度量结果将根据先前的GPU工作以及在重放迭代之间变化。这可能导致度量值不一致和越界。             

时钟控制             

控制分析期间GPU时钟的行为。允许值:对于基频,GPC和内存时钟在配置期间被锁定到各自的基频。这对热节流没有影响。对于None,在分析期间不会更改GPC或内存频率。             

配置文件活动             

Profile活动提供了一个传统的、可预先配置的profiler。在配置了要评测的内核、要收集的度量等之后,应用程序将在分析器下运行,而无需交互控制。一旦应用程序终止,活动即完成。对于通常不会自行终止的应用程序,例如交互式用户界面,您可以在分析完所有预期的内核之后取消该活动。             

此活动不支持附加到以前通过NVIDIA Nsight Compute启动的进程。这些进程将在“附加”选项卡中显示为灰色。

输出文件             

应存储收集的配置文件的报表文件的路径。如果不存在,则自动添加报表扩展名.ncu rep。文件名组件支持占位符%i。它被一个按顺序递增的数字替换,以创建一个唯一的文件名。这将映射到--export命令行选项。             

强制覆盖             

如果设置,则覆盖现有报告文件。这将映射到--force overwrite命令行选项。             

目标流程             

选择要分析的进程。仅在应用程序模式下,只分析根应用程序进程。在模式all中,将分析根应用程序进程及其所有子进程。这将映射到--target processes命令行选项。             

重播模式             

选择多次重放内核启动的方法。在模式内核中,单个内核的启动在目标应用程序的单个执行期间被透明地回放。在模式应用程序中,整个目标应用程序将被多次重新启动。在每次迭代中,为目标内核启动收集额外的数据。应用程序回放要求程序的执行是确定性的。这将映射到--replay模式命令行选项。有关重播模式的更多详细信息,请参阅内核评测指南。             

其他选项             

所有剩余的选项都映射到它们的等效命令行探查器。有关详细信息,请参阅NVIDIA Nsight Compute CLI文档中的“命令行选项”部分。             

重置             

“连接”对话框中的条目将保存为当前项目的一部分。在自定义项目中工作时,只需关闭项目即可重置对话框。             

不在自定义项目中工作时,条目将作为默认项目的一部分存储。通过关闭NVIDIA Nsight Compute,然后从磁盘中删除项目文件,可以从默认项目中删除所有信息。

人工智能芯片与自动驾驶
原文地址:https://www.cnblogs.com/wujianming-110117/p/13944962.html