您可以对MATLAB生成的MEX函数的执行时间进行分析®编码器™使用MATLAB Profiler。生成的代码的概要文件显示了调用的数量和对应的MATLAB函数的每一行所花费的时间。使用Profiler来识别产生耗时最多的生成代码的MATLAB代码行。这些信息可以帮助您在开发周期的早期识别和纠正性能问题。有关MATLAB分析器的更多信息,请参见配置文件
和剖析代码以提高性能.
中不支持分析器的图形界面金宝appMATLAB在线™.
您可以使用MATLAB Profiler生成一个MEX函数。或者,如果您有一个调用MATLAB函数的测试文件,那么您可以生成MEX函数并在一个步骤中对其进行分析。您可以在命令行或MATLAB编码器应用程序中执行这些操作。
使用Profiler和生成的MEX函数:
通过设置配置对象属性来启用MEX分析EnableMexProfiling
来真正的
.
或者,您可以使用codegen
与配置文件
选择。
在MATLAB编码器应用程序中的等效设置是使执行分析在生成的一步。
生成MEX文件MyFunction_mex
.
运行MATLAB分析器并查看概要报告,它将在一个单独的窗口中打开。
配置文件在;MyFunction_mex;配置文件查看器;
确保您没有更改或移动原始MATLAB文件MyFunction.m
.否则,分析器不会考虑MyFunction_mex
剖析。
如果你有一个测试文件MyFunctionTest.m
调用MATLAB函数,你可以:
通过使用生成MEX函数并对其进行分析codegen
与以及
和配置文件
选项。如果之前打开了MATLAB Profiler,那么在同时使用这两个选项之前先将其关闭。
codegenMyFunction以及MyFunctionTest配置文件
通过选择配置MEX功能使执行分析在验证如果你之前打开了MATLAB Profiler,在你执行这个动作之前关闭它。
您可以使用Profiler来识别MATLAB代码中的函数或代码行,这些函数或代码行生成的代码花费的时间最多。下面是一个MATLAB函数的例子,它转换其输入矩阵的表示形式一个
和B
从行为主的布局到列为主的布局。对于大型矩阵,这种转换的执行时间很长。通过修改特定的行来避免转换可以使函数更高效。
考虑MATLAB函数:
函数[y] = MyFunction (A, B)% # codegen% Generated代码使用矩阵A和B的行为主表示法coder.rowMajor;长度=大小(1);通过遍历A和B的所有元素的绝对值%矩阵一行一行sum_abs = 0;为行= 1:长度为col = 1:length sum_abs = sum_abs + abs(A(row,col)) + abs(B(row,col)));结束结束调用外部C函数'foo.c',返回所有元素的和A和B的%金额= 0;和= coder.ceval (“foo”coder.ref (A), coder.ref (B),长度);%返回sum_abs和sum的差值Y = sum_abs - sum;结束
为该函数生成的代码使用方阵的行主表示一个
和B
.代码首先计算sum_abs
的所有元素的绝对值之和一个
和B
)通过逐行遍历矩阵。该算法针对以行为主布局表示的矩阵进行了优化。然后代码使用coder.ceval
调用外部C函数foo.c
:
#include#include #include "foo.h" double foo(double *A, double *B, double length) {int i,j,s;Double sum = 0;s = (int)长度;*/ for(i=0;i
对应的C头文件foo。
是:
#include "rtwtypes.h" double foo(double *A, double *B, double length);
foo.c
返回变量总和
的所有元素的和一个
和B
.函数的性能foo.c
是否独立于矩阵一个
和B
以行为主或列为主的布局表示。MyFunction
返回差值sum_abs
和总和
.
你可以测量的性能MyFunction
对于大的输入矩阵一个
和B
,然后进一步优化:
启用MEX分析并生成MEX代码MyFunction
.运行MyFunction_mex
两个大的随机矩阵一个
和B
.查看配置文件汇总报表。
一个=兰德(20000);B =兰德(20000);codegenMyFunctionarg游戏{A、B}foo.cfoo。配置文件配置文件在;MyFunction_mex (A, B);配置文件查看器;
将打开一个单独的窗口,显示概要摘要报告。
Profile Summary Report显示了MEX文件及其子文件的总时间和自我时间,这是为原始MATLAB函数生成的代码。
在“函数名”下,单击第一个链接以查看生成的代码的概要详细报告MyFunction
.你可以看到花费时间最多的线条:
行调用coder.ceval
需要大量时间(16.914 s)。这一行的执行时间相当长,因为coder.ceval
转换矩阵的表示形式一个
和B
从行为主布局到列为主布局,然后将它们传递给外部C函数。您可以通过使用附加参数来避免这种转换布局:rowMajor
在coder.ceval
:
和= coder.ceval (“布局:rowMajor”,“foo”coder.ref (A), coder.ref (B),长度);
使用修改后的文件再次生成MEX函数和配置文件MyFunction
.
一个=兰德(20000);B =兰德(20000);codegenMyFunctionarg游戏{A、B}foo.cfoo。配置文件配置文件在;MyFunction_mex (A, B);配置文件查看器;
MyFunction
显示线路呼叫coder.ceval
现在只需要0.653秒:
当你使用coder.const
将表达式折叠成常数,这将导致MATLAB函数和MEX函数之间的代码覆盖率不同。例如,考虑函数:
函数y = MyFoldFunction% # codegen= 1;b = 2;C = a + b;Y = 5 + codeer .const(c);结束
分析MATLAB函数MyFoldFunction
在概要详细报告中显示此代码覆盖率:
然而,分析MEX函数MyFoldFunction_mex
显示不同的代码覆盖率:
第2、3和4行没有在生成的代码中执行,因为您已经折叠了表达式C = a + b
转换为用于代码生成的常量。
这个例子使用用户定义的表达式折叠。代码生成器有时会自动折叠某些表达式以优化所生成代码的性能。这样的优化也导致了MEX函数的覆盖范围不同于MATLAB函数。
配置文件
|codegen
|编码器。MexCodeConfig
|coder.rowMajor
|coder.ceval
|coder.const