gpucoder.stridedMatrixMultiplyAdd
向的优化GPU实现,成批的矩阵乘法和加法运算
语法
描述
执行向一批矩阵的矩阵与矩阵的乘法和添加。输入矩阵D
= gpucoder.stridedMatrixMultiplyAdd (一个
,B
,C
)一个
,B
,C
对批处理的每个实例位于固定地址偏移量从他们的地址在前面的实例。的gpucoder.stridedMatrixMultiplyAdd
函数执行矩阵与矩阵乘法的形式:
在哪里
和
标量乘法因素,一个
,B
,C
,D
与维矩阵米
——- - - - - -k
,k
——- - - - - -n
,米
——- - - - - -n
,米
——- - - - - -n
分别。一个
和B
可以调换或hermitian-conjugated。默认情况下,
和
将一个矩阵的转置。指定一个不同的标量乘法因子和执行对输入矩阵转置操作,使用名称,值
对参数。
所有的批次传递到gpucoder.stridedMatrixMultiplyAdd
函数必须是统一的。也就是说,所有实例必须有相同的尺寸m, n, k
。
例子
输入参数
输出参数
另请参阅
应用程序
功能
codegen
|coder.gpu.kernel
|coder.gpu.kernelfun
|gpucoder.stridedMatrixMultiply
|gpucoder.batchedMatrixMultiply
|gpucoder.batchedMatrixMultiplyAdd
对象
介绍了R2020a