cudaMalloc((void**)&nanFlags_dev, N*sizeof(int));
getNANpts << <fullBlocksPerGrid, blockSize >> >(N, z_dev, nanFlags_dev);
cudaDeviceSynchronize();
thrust::device_ptr<int> thrust_nanflags(nanFlags_dev);
//int num_of_nan = thrust::reduce(thrust_nanflags, thrust_nanflags + N, (int)0, thrust::plus <int >());  //统计有多少个NAN点
int num_of_nan = thrust::count(thrust_nanflags, thrust_nanflags + N, 1);  //统计有多少个NAN点
cudaDeviceSynchronize();

出现错误：

原因：核函数getNANpts写错了。只对nanFlags_dev中的一个位置进行初始化，其他位置没有赋值，所以进行计算时会错误。

2021-01-17

编程 / cuda

1 分钟读完 (大约 112 个字)

CUDA知识片段

线程模型适合用于OpenMP。进程模型适用于MPI

在GPU环境下：CUDA使用一个线程块（block）构成网格（grid）。这可以看成是一个进程（即线程块）组成的队列（即网格），而进程之间没有通信。每一个线程块内部有很多线程以批处理的方式运行，称为线程束（warp）

2020-07-13

编程 / STL

几秒读完 (大约 1 个字)

C++ STL1

2020-07-13

编程 / Memory Management

几秒读完 (大约 1 个字)

C++ 内存管理1

2020-07-13

编程 / Generic Programming

几秒读完 (大约 1 个字)

C++ 泛型编程

2020-07-05

编程 / 编程知识与VS错误

14 分钟读完 (大约 2074 个字)

编程知识与VS错误

[TOC]

2019-12-16

编程 / 算法与数据结构

5 分钟读完 (大约 775 个字)

生成随机数

打乱数组中的内容

SSE coding

CUDA basic knowledge

HashMap

cuda code error

thrust

CUDA知识片段

C++ STL1

C++ 内存管理1

C++ 泛型编程

编程知识与VS错误

生成随机数

链接

分类

标签云

最新文章

归档

标签

最新文章

归档

标签

Your browser is out-of-date!