CUDA C编程,GPU编程,GPU优化计算

CUDA C编程,GPU编程,GPU优化计算

CUDA编程套路格式

根据《GPU编程与优化》的学习有:

1.获取配置GPU设备

1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。

2.分配GPU显存大小

1 cudaMalloc((void**) &d_a, sizeof(float) *n); //分配显存

3.Host2Device数据传输

1 cudaMemcpy(d_a,a,sizeof(float) *n,cudaMemcpyHostToDevice); //数据传输,主机到设备

4.调用kernel function

1 gpu_kernel<<<blocks,threads>>>(***);  //kernel function调用

5.Device2Host数据传输

1 cudaMemcpy(a,d_a,sizeof(float) *n, cudaMemcpyDeviceToHost);
2 //D2H数据传输,GPU结果返回CPU

6.释放显存

1 cudaFree(d_a) //释放显存空间,每个变量是一个显存空间,所以每个变量都要释放

7.释放设备

1 cudaDeviceReset(); //重置设备,可以省略
原文地址:https://www.cnblogs.com/nanmi/p/12617524.html