線程塊是CUDA中的一種抽象編程,它表示一組可以串行或並行執行的線程。線程塊中的線程數量曾經受架構限制,每個線程塊最多只有512個線程,但從2019年7月開始,線程塊可以最多包含1024個線程[1][2]。同一線程塊中的線程運行在同一個流處理器上。同一線塊中的線程可以通過共享內存、同步屏障相互通信。
多個線程塊組合成一個網格(grid)。同一網格中的所有線程塊的線程數量相同。