開放式課程>>工程學群>>平行程式>>第20講 CUDA優化:全域和區域記憶體 / 共享記憶體

第20講 CUDA優化:全域和區域記憶體 / 共享記憶體

 
L20A
      Optimization for CUDA: Coalesced Memory Access
       將合併記憶體的方式用於CUDA之優化
 
 
L20B
      Optimization for CUDA: Tiled Algorithm / Bank Conflict &
      Memory Padding
      CUDA的優化:區塊型演算法 / 記憶庫衝突以及記憶體留白

 

課程影音

圖片上傳中...