主要内容

このページの翻訳は最新ではありませ。

生成コードの実行プロファルの解析

このこのでは,ソフトウェアインザループ®装饰品ががインストールされていなければなりませませ

メモ

プロファイリングワークフローはnvidia®からのnvprof.ツールツールによって异なりなり.Cuda®ツールキットv10.1では,nvidiaはパフォーマンスカウンターへのアクセスを管者ユーザーのみ制しし。gpuパフォーマンスカウンターをすべてのユーザーができるようにするははユーザー使https://developer.nvidia.com/nvidia-development-tools-金宝搏官方网站solutions-err_nvgpuctrperm-permission-issue-performance-counters.に记载されている手顺を参照してください。

设计ファイルの作物

この例では,n次元高速フーリエ変换実するポイントポイント关键词作物coder.gpu.kernelfun.〖gpu〗〖fft〗。既定では,EnableCufftプロパティが有象にされてため,コードジェネレーターは袖口ライブラリライブラリ使してて演算実行し。

功能[y] = gpu_fftn(x)coder.gpu.kernelfun();y = fftn(x);结尾

実行プロファイリングプロファイリングレポート生成

关节有关部gpucoder.profile.をを用して実実プロファイリング生成します。

cfg = coder.gpuconfig('exe');cfg.g.guconfig.mallocmode ='离散';gpucoder.profile('gpu_fftn',{rand(2,4500,4)},'codegenconfig',cfg,...'codegenarguments',' -  d profilingdir','threshold',0.001)

コード実行プロファイリングが开きます。このレポートは,sil実行からさたデータに基因メトリクスたしますますを提供します。当行时间はますます。,查看执行时间(嵌入式编码器)を参照してください。

参考

||

关键词する