10701 平行程式

  • 平行程式
  • 第20講 CUDA優化:全域和區域記憶體 / 共享記憶體

第20講 CUDA優化:全域和區域記憶體 / 共享記憶體

課程影音

 
L20A
      Optimization for CUDA: Coalesced Memory Access
       將合併記憶體的方式用於CUDA之優化
 
 
L20B
      Optimization for CUDA: Tiled Algorithm / Bank Conflict &
      Memory Padding
      CUDA的優化:區塊型演算法 / 記憶庫衝突以及記憶體留白