L20A Optimization for CUDA: Coalesced Memory Access 將合併記憶體的方式用於CUDA之優化 L20B Optimization for CUDA: Tiled Algorithm / Bank Conflict & Memory Padding CUDA的優化:區塊型演算法 / 記憶庫衝突以及記憶體留白