https://blog.csdn.net/qq_34204991/article/details/140180261

https://zhuanlan.zhihu.com/p/12661298743

五、实战项目推荐

  1. 基础项目
    • 并行向量加法 / 乘法
    • 并行前缀和(Scan)算法
  2. 进阶项目
    • 基于共享内存优化的矩阵乘法
    • CUDA 实现快速傅里叶变换(FFT)
  3. 高级项目
    • 多 GPU 协作的粒子模拟
    • 基于 CUDA 的深度学习算子开发(如卷积、BatchNorm)
  • 基础项目
    • 实现矩阵乘法、快速傅里叶变换(FFT)等算法,对比 CPU 和 GPU 性能差异。
    • 图像滤波(如高斯模糊),利用 GPU 并行处理像素。
  • 进阶项目
    • 基于 CUDA 实现简单的神经网络(如 MNIST 分类)。
    • 优化深度学习框架中的算子(如卷积、Softmax)。