切换主题
可以看出,L2 cache去device memory中读取了两倍的内存,导致乱序的时间也是顺序时间的两倍。问题是L1 cahe到L2 cache多读了8倍,这个是为啥?
L2 cache
device memory
L1 cahe
97658