CUDA笔记(七)

今天集中时间找程序的问题。于是发现:

首先,程序里的kernel想要调试,必须用nsight。

于是一堆找。http://www.nvidia.com/object/nsight.html

http://blog.chinaunix.net/uid-20620288-id-4808400.html

貌似Nsight需要双机调试?晕中。

不过这篇文章提了,在需要监视的核函数里面打断点

http://wenku.baidu.com/link?url=eFI-HX4IaSurijpp_UcU_pLNHhvRaDHVcKkT0eN4zTwAbcJBNAODON69hVbmJKTtmGvVir4eWBgdE4ok09bndOmdwKMNFDjVgXNwPxeQz8_

吃晚饭前遇到一个大问题:nsight只能进入kernel一次。

目前只是绕过这个问题。

****

目前的问题是,我算法看懂了,但是不知道怎么实现。于是翻了一下魏老师给我曾经发的邮件,这才发现原来自己完全还没有深入到对CUDA的研究。仅仅写程序只是一小部分任务。

用gpgpu-sim去评估运行一个应用需要的时钟周期数。http://www.cnblogs.com/LitLeo/p/3521833.html

http://blog.sciencenet.cn/blog-1067211-726653.html

http://blog.sina.com.cn/s/blog_69e4088d0102v8gb.html

特别是在linux环境下安装的时候,居然还需要git

原文地址:https://www.cnblogs.com/ubiwind/p/5067027.html