Skip to content

Balance

字数
282 字
阅读时间
2 分钟

Love Story

今天被璇宝鼓励去工作了,感觉真的很有动力,得让她多鼓励鼓励我。 但是我感觉我总是三分钟热度,希望能改善改善吧。

CUDA Challenge

我把课程的md文件塞到我们的网站里面去了,里面的高亮显示比github网页版本的好看一点。

第10和11讲 讲解的是shared memory和 sync threads的用法,这俩好像我之前早就用熟练了。

第12讲 讲的是bank conflict

声明共享内存 __shared__ float sData[32][32],那么 sData[0][0]sData[1][0]...sData[31][0] 位于 Bank[0]sData[31][0]sData[31][1]...sData[31][31] 位于 Bank[31]

以下两种情况不会发生 Bank conflict:

  • half-warp/warp 内所有线程访问不同 banks;
  • half-warp/warp 内所有线程读取同一地址。 这个应该可以用shuffle同步,一个线程去拿就可以

可以用padding或者shuffle的操作来避免bank conflict

最后做实验下来确实慢了不少

贡献者

文件历史

撰写