深度学习:改造工程和科学
阿米特·高尔,英伟达
深入学习是将一组不同的工程和科学领域包括计算机视觉、视频分析、机器人、自动驾驶等等。深度学习可以达到最先进的精度对于许多任务考虑使用传统机器学习算法无法解决的。在这个演示,实际的例子是用来说明深度学习在一个多样化的应用程序实现。示威活动说明MATLAB®和英伟达®gpu使这些创新。
主题包括先进的人工智能计算通过NVIDIA杰森平台边缘,并自动生成高性能CUDA的能力®NVIDIA gpu从深度学习模型在MATLAB代码。
所以我Amit高尔。我是产品经理在NVIDIA智能机器。你听说过许多关于深入学习和人工智能。我会给你一个更广泛的概述在AI,专门为自治机器,角色NVIDIA与MATLAB加速,一起玩。
所以我们看到我们今天所做的计算方式的根本性转变。微处理器的时代已经逐渐减少,饱和尽管技术是推进。但是新的GPU计算的计算模型是加快数据处理速度,我们还没有见过的。
并结合具体深度学习的进步,和数据来自移动互联网,和处理能力所提供的gpu,我们现在有能力能解决问题之前被认为是无法解决的。和英伟达的心脏和中心整个人工智能革命和新的计算模型。我们的产品范围从下载188bet金宝搏数据中心到边缘,为人工智能和推论和培训。
所以给你一个概述的一些高层与人工智能问题正在解决previously-nobody甚至试图解决他们使用传统算法。这里有一些我想强调的。第一个是一个产品从NVIDIA我们使用人工智能和深度学习渲染图像将使用光线追踪过去。——如果你有与射线追踪,你知道和光线追踪渲染图像每一像素,试图找出每个光子的光的轨迹需要很长时间。使用深度学习,您现在可以呈现深度只有几个像素,让学习算法填写其余的像素。第二个是我们所说的逆唇读。所以你给它的文本,现在使用深度学习算法一直在训练视频,能够产生motion-your面部表情,你需要表达特定的文本。
这是像游戏引擎是非常重要的,你必须有很多的地方,你知道,文本和字符animating-speaking东西。第三个从合作伙伴带来称为wrnch,使用它的训练在2 d视频,现在它能够估计人类的姿势在3 d世界。你可以想象这是多么重要对VR和机器人技术,在那里你可以与机器人互动在二维世界,它可以估算你的姿势和教机器人。
第四个是爱丁堡大学的一个项目,他们教这个角色动画本身为了导航的障碍。所以不管你当场把什么障碍,这是培训视频,它知道这是一个非常狭窄的边缘,它需要tiptoe-if高块,它需要提高它的腿。所有这些已经完全被使用深度学习培训。
最后一个是一个机器人在伯克利分校教授在虚拟现实和教会机器人如何堆积方块。和模仿学习,很少数量的训练,他们可以训练这个机器人现在堆积方块模仿人类做了什么。这些都是非常,非常艰难的问题,不可能是解决如果你不使用人工智能和深度的学习。
特别是专注于智能机器,有一个巨大的,巨大的机遇摆在我们面前的,使用人工智能和深度学习,在这里我将突出一些。今天在工厂自动化工厂automation-only 10%的工作都由机器人完成。想象一下,如果我们可以创建协作,理解世界,理解任务的机器人,以及我们所做的。
我们可以极大的提高贡献和达到生产力水平,我们还没有见过的。最后一英里的交付,支持人类在老家里,农业金宝app检查和医疗操作的一些地方今天,AI和深度学习有巨大的机会来增加更多的价值。为了解决这些问题,你需要一个解决方案,有能力,性能,和一种形式因素,您可以将它部署在边缘。
所以我们创造了我们所说的杰森,TX2,信用卡大小模块,所有这些事情,你需要为你的设备。它有计算能力超过两个核心i7,它可以在不到10瓦。正如你所看到的,形式是信用卡大小的模块。
所以你可以真的释放了很多机会在你能做什么为你自动机器边上。这个模块提供了集成GPU, CPU。它有记忆,连接,视频encode-decode硬件加速器,相机,最重要的是形成因素,即50到87年,这是一个信用卡大小的模块。
我们你听说过无人驾驶汽车,但是,我们看到有很多采用人工智能与深度学习各个方面的行业,无论是制造业、农业、建设、库存管理、社会、交付、安全。所有这些都是看到一个巨大的价值的应用程序使用AI和深度学习。证明,我在这里玩下个视频。
所以你看到,杰森被部署为自治机器为许多不同的应用程序。并从财富500强企业初创企业,他们都能够使用这个平台。而且不只是行业。杰森也让学者和研究利用这些应用程序。
这里是一些例子的最近的事件研究人员和学生使用了摩登家族。亚马逊的机器人技术的挑战,这是一个目标应用程序自动化仓库拾起并定位明确,每一个团队在前10名使用GPU加速深度学习的解决方案,当然,获胜者也使用。一直到高中,第一个机器人竞争,有团队他们的机器人上使用杰森董事会为了实现第一机器人比赛的目标。
丰田创造了这个人类支持机器人提供两个不同的大学研究为了解决人金宝app口变老的问题,需要支持机器人。“机器人足球世界杯”,今年有几个团队使用的类人,他们改变了球,使用传统的解决方案的人不可能真正弄清楚。金宝搏官方网站但使用深度学习的人能够快速训练算法和部署他们的机器人。
所以从财富500强企业高中生,每个人都可以利用这个平台。而令可能是我们的软件堆栈。从GPU加速杰森平台底部,我们已经建立了广泛的堆栈可以支持所有这些你需要的各种应用程序自动机器。金宝app
它运行相同的CUDA架构,CUDA和深度学习库,您可以在您的分离式GPU上运行。相同的库运行在小杰森板形式因素。深度学习和我们有图书馆,计算机视觉、图形和媒体。
最重要的是,我们已经建立了多媒体api和工具的发展。所以整个堆栈是可用的,并且它是开源的。我们使它可供大家使用,这就是使公司,大或小,研究人员利用这个平台的潜力和发展的解决方案。金宝搏官方网站
今天,我们将讨论如何使用所有这些从在MATLAB中,由于GPU编码器的项目,你可以直接与所有通信,用整个软件栈,我们建立在杰森,和给你访问所有MATLAB。并进一步讨论,我会邀请Avi。
谢谢,阿米特。所以观众中你可能的问题是,我们如何目标这个神奇的硬件阿米特说过?与此同时,我想介绍一个新产品,只是与我们9月17 b释放产生CUDA代码使用NVIDIA GPU。和它的工作方式是你把MATLAB算法,使用GPU编码器时,新产品,给你CUDA的代码。
它不仅给你一个CUDA的代码,但它也给了你胶水C和c++代码来缝合在一起。和部署在平行的形式在不同的CUDA内核到GPU核心以及C和c++代码实际上运行在手臂上皮层部分这些出类拔萃。为什么使用GPU编码器吗?如果你做深度学习,GPU编码器的性能是七倍TensorFlow art-libraries的状态。
如果你做计算机视觉算法,传统的计算机视觉,我们认为速度UPS 700 x只使用常规MATLAB和C代码。和信号处理应用程序中,我们看到20 x加速。所以,一句话,为什么使用GPU编码器?的性能。
GPU编码器是多快?所以我们做了一些内部基准,基准测试一堆标准计算机视觉算法,比如冲浪功能拔牙、立体差异等等。我们发现数量级速度优化的C代码。
工作流是什么让这一切工作吗?所以你开始用MATLAB算法。这通常是一个功能参考。这是你的黄金参考。你设计算法使用MATLAB。我给你很多,在前面的谈话。
现在一旦你想要部署或测试部署,您可以测试您的部署桌面GPU。在这种情况下,它是一个特斯拉代GPU核心。然后您可以使用GPU编码器来创建独立的CUDA代码,然后测试它在MATLAB调用是一个墨西哥人,我将向您展示一个演示。
你可以单独的CUDA从MATLAB代码,将其集成在一个c++应用程序中,并做部署集成测试。当你满意,你可以把这段代码并将其部署到杰森平台,实际上在GPU上运行它。那么,工作流是什么样子呢?
所以鉴于深度学习是真正推动gpu背后的利益,我将向您展示深度学习的Hello World应用程序,这是做一个叫做AlexNet 1000类图像分类使用网络,这是一个受欢迎的研究网络,成立于2012年。让我让我玩视频。
所以你可以看到我们从相机拍摄快照。我们调整的方式得抱成一团将与AlexNet工作。我们是基准测试的速度运行。现在,这是运行在桌面GPU。你可以看到它的运行在大约200 FPS,这是相当快。
但是如果我们想生成代码,我们去应用画廊,我们选择GPU编码器应用。我们告诉它的函数来生成代码从AlexNet预测函数。现在由于MATLAB是松散类型,我们需要告诉它输入的大小,因为c++和CUDA并不松散类型。
所以我们说,好吧,这是一个单身,这是一个227年到227年,这是一个RGB图像,我们有三个渠道。当完成,我们点击下一步。再次点击下一步。问它来生成一个墨西哥人在MATLAB文件我们可以测试它。t willsay生成c++代码。当完成,你得到了这个漂亮的报告,你可以比较您的跟踪代码回到你的MATLAB代码。你可以看到有一个混合物CUDA的C代码,然后调用,所以你可以看到生成的CUDA的铜文件代码。
现在这一切都遵循相同的代码生成工作流,如果你使用MATLAB的编码器,它遵循相同的工作流。GPU编码器是基于MATLAB的编码器生成C和c++代码。你可以看到有一个墨西哥人我们只是生成文件。
现在让我们看看快速运行。所以我们换出墨西哥人生产函数的预测功能,运行整个脚本。你看到现在是快很多。现在可以在确实认为这支安打500帧每秒的峰值,这显然是两倍的速度,我们刚刚运行在桌面桌面GPU当连接到MATLAB。
现在前面的例子我给你们都是运行在桌面GPU,但你必须做什么如果你想目标阿米特谈到的杰森?所以你必须让两个非常小的变化。您需要更改您的构建类型从墨西哥人到一个静态库,你使用杰森交叉编译工具链。这些都是阿米特提到的优化库。
当你完成了,你可以看到,实际上是工作流将其部署到杰森。你可以看到这是运行在低功耗嵌入式30 FPS杰森。再一次,这是相同的AlexNet网络上运行的杰森。
所以我知道,我做了一些广泛宣称你使用GPU编码器使用MATLAB的性能,让我向你展示一些基准。为了东方你看什么。你看到在x轴上批大小。这是图片的数量,我们通过网络。
轴,吞吐量,帧每秒,图像网络的数量是每秒能够处理。现在如果你仔细看,有几件事情我想指出。首先,就绿色栏的MATLAB桌面运行速度显著提升,特别是在较高的批量大小,像咖啡和TensorFlow比其他库。
然而,GPU编码器的编译后的代码是在任何批大小显著快于其他框架。我们有同样的性能提升。现在因为我们是运行在嵌板,我们没有能够运行所有这些其他库的杰森。
然而,咖啡的c++版本有一个相当小的footprint-we杰森能够运行它。如果你看看基准,性能接近1的批量大小,但随着批量大小的增加,你通过网络传递更多的图片,甚至GPU编码器的速度显著快于c++咖啡。
需要注意的是,当我们做基准测试,他们都要求对相同的库。他们打电话到相同版本的cuDNN,等等,在黑板上。所以你可能会怀疑,你可能会问,为什么比这些开源深度学习框架有许多开发人员吗?
有几个原因。首先,开源深度学习框架,他们做很多不同的事情。他们做培训,对可视化的支持,不同的数据类型,等等。金宝app他们也有Python的开销。如果你使用TensorFlow, Python还运行开销。
生成的代码从MATLAB编码器或GPU编码器在这个例子只是部署特定的深层神经网络的数学操作非常特定的数据类型。这真的减少了开销,提高了效率,也就是给了我们得到的性能。我们得到性能的另一个原因,我们得到的是链接到所有最有效的图书馆,不仅阿米特谈到的软件堆栈。除了cuDNN,用于深度学习,我们也联系到优化库中fft算法,解决者,巴拉斯数学操作,等等。
现在GPU编码器是一个新产品,所以如果你还没有使用过,有大量的例子来帮助你学习如何使用GPU编码器进行基准测试,我们只显示你,融入模型以及执行许多不同的图像处理和计算机视觉的应用程序。金宝app最后,我们打开这个问题之前,我们想让你带走的是,17个b与GPU编码器的释放,与我们所做的工作与阿米特的团队,你可以很容易的目标杰森TX2 MATLAB。对于嵌入式部署,会给你深度学习的最佳性能。
现在我们有一些演示的深度学习。如果你想有更多的讨论如何将此工作流,以及如何将MATLAB代码转换为CUDA的代码,我们很乐意回答任何问题。们NVIDIA也同意放弃任何迹象Jetson TX2 50%的折扣。如果你看到有人在展台,就告诉他们你正在寻找的折扣代码,TX2,之后我们会发送给你。这是我们的最后一行。我认为我们有一个时间的问题。
您可以在欧什一张网站来自der folgenden Liste auswahlen:
所以erhalten您死bestmogliche Leistung der汪汪汪的网站
民意调查您毛皮死bestmogliche Website-Leistung死网站中国毛皮(auf Chinesisch奥得河Englisch)。安德利果汁landesspezifische网站冯MathWorks信德毛皮Besuche冯Ihrem Standort来自不optimiert。