第一个CUDA程序

开始学CUDA 先写一个简单的

#include<iostream>
__global__ void add( int a, int b, int *c ) {
*c = a + b;
}
int main()
{
int c;
int * dev_c;
cudaMalloc((void**)&dev_c,sizeof(int));//在显存开辟空间
add<<<1,1>>>(10,11,dev_c);//为函数分配一个block,每个block分配一个线程
cudaMemcpy(&c,dev_c,sizeof(int),cudaMemcpyDeviceToHost);//讲显存数据拷贝到内存交给cpu处理
printf("%d",c);
return 0;
}

原文地址:https://www.cnblogs.com/fengyuehan/p/3585388.html