生成コードの実行プロファルの解析
このこのでは,ソフトウェアインザループ®装饰品ががインストールされていなければなりませませ
メモ
プロファイリングワークフローはnvidia®からのnvprof.
ツールツールによって异なりなり.Cuda®ツールキットv10.1では,nvidiaはパフォーマンスカウンターへのアクセスを管者ユーザーのみ制しし。gpuパフォーマンスカウンターをすべてのユーザーができるようにするははユーザー使https://developer.nvidia.com/nvidia-development-tools-金宝搏官方网站solutions-err_nvgpuctrperm-permission-issue-performance-counters.に记载されている手顺を参照してください。
设计ファイルの作物
この例では,n次元高速フーリエ変换実するポイントポイント关键词作物coder.gpu.kernelfun.
〖gpu〗〖fft〗。既定では,EnableCufft
プロパティが有象にされてため,コードジェネレーターは袖口ライブラリライブラリ使してて演算実行し。
功能[y] = gpu_fftn(x)coder.gpu.kernelfun();y = fftn(x);结尾
実行プロファイリングプロファイリングレポート生成
关节有关部gpucoder.profile.
をを用して実実プロファイリング生成します。
cfg = coder.gpuconfig('exe');cfg.g.guconfig.mallocmode ='离散';gpucoder.profile('gpu_fftn',{rand(2,4500,4)},'codegenconfig',cfg,...'codegenarguments',' - d profilingdir','threshold',0.001)
コード実行プロファイリングが开きます。このレポートは,sil実行からさたデータに基因メトリクスたしますますを提供します。当行时间はますます。,查看执行时间(嵌入式编码器)を参照してください。
参考
gpucoder.profile.
|Codegen.
|Coder.embeddedCodeConfig