https://blog.csdn.net/qq_34204991/article/details/140180261
https://zhuanlan.zhihu.com/p/12661298743
五、实战项目推荐
- 基础项目:
- 并行向量加法 / 乘法
- 并行前缀和(Scan)算法
- 进阶项目:
- 基于共享内存优化的矩阵乘法
- CUDA 实现快速傅里叶变换(FFT)
- 高级项目:
- 多 GPU 协作的粒子模拟
- 基于 CUDA 的深度学习算子开发(如卷积、BatchNorm)
- 基础项目:
- 实现矩阵乘法、快速傅里叶变换(FFT)等算法,对比 CPU 和 GPU 性能差异。
- 图像滤波(如高斯模糊),利用 GPU 并行处理像素。
- 进阶项目:
- 基于 CUDA 实现简单的神经网络(如 MNIST 分类)。
- 优化深度学习框架中的算子(如卷积、Softmax)。