上節的向量相加是一維數組的并行運算,比較好理解。這節我們來看個4 X 4二維數組并行運算:矩陣轉置。 4X4矩陣我們采用二維數組進行存儲,在程序設計上,轉置過程是16個數同時轉置完成。注意這裡的OpenCL的工作維數是二維。
1、transposition.cl代碼2、main.cpp代碼
運行結果:
,
上節的向量相加是一維數組的并行運算,比較好理解。這節我們來看個4 X 4二維數組并行運算:矩陣轉置。 4X4矩陣我們采用二維數組進行存儲,在程序設計上,轉置過程是16個數同時轉置完成。注意這裡的OpenCL的工作維數是二維。
1、transposition.cl代碼2、main.cpp代碼
運行結果:
,