从系列:基于MATLAB的深度学习
乔•Hicklin MathWorks
观看如何使用MATLAB的快速演示®一个简单的网络摄像头,以及一个用来识别周围物体的深度神经网络。这个演示使用AlexNet他是一个训练有素的人卷积神经网络(CNN或ConvNet)已经对超过一百万张图片进行了训练。
该示例包含两个部分:设置摄像机和执行对象识别。第一部分展示了如何使用网络摄像头
命令从相机获取图像。使用drawnow
命令,MATLAB能够不断更新和显示相机拍摄的图像。
第二部分说明了如何下载一个预先训练好的深度神经网络AlexNet,并使用MATLAB来持续处理相机图像。AlexNet将图像作为输入,并为图像中的对象提供一个标签。你可以用周围的物体做实验,看看AlexNet有多准确。
今天,你可以用MATLAB很容易地做到这一点,但即使是在几年前,它也会被认为是科幻小说。
了解更多关于基于MATLAB的深度学习或下载演示代码。
记录日期:2016年12月6日
嗨。我叫乔·希克林。我是MathWorks的高级开发人员。我一直在用MATLAB和神经网络工具箱实验深度学习。我写了一个简单的小程序,它能做一些很酷的事情。现在我想给你们展示一下。
我所做的是我把一个网络摄像头连接到一个神经网络上来识别图像。现在我可以把摄像头对准不同的物体,它就能识别。开塞钻,或者螺丝刀,或者左轮手枪,口琴,茶壶,铲子,诸如此类的东西。它并不完美,但它做得很好。
让我们来看看这样做的代码。这就是整个程序,对吧?只有11行。我们会讲一遍。但是我们要分三个阶段来做。
我们要清理一下工作空间。我们会让摄像头连接到网络摄像头,让摄像头拍照,最后,在屏幕上显示照片。所以当我们运行这个的时候我们会得到一张新的图片。这是我们刚拍的照片。
但那是一个静止的图像。我们希望这是一个连续的视频。所以我们要再加三行,让它进入一个循环。
我们会在拍照的代码周围放一个while循环。我们会添加一个drawnow,让MATLAB立即绘图。当我运行这个时,我们会得到同样的结果。但现在,它是一个实时视频。
最后,我们需要加入神经网络。我正在使用一个叫做AlexNet的网络。AlexNet是一个大型深度卷积神经网络。他们用超过一百万张图片训练这个网络。它可以识别大约1000种不同的物体。
我已经下载它。现在我们可以用它了。这条线要求网络对我们刚拍的照片进行分类。我们会把每一张图片传递给网络它会返回那个图片的标签。
在那之前,我们得把照片调整到AlexNet预期的大小。它是根据特定大小的图像进行训练的。最后,我将在我的图片标题中使用这个标签。我需要用这个命令把它转换成一个字符串。
好了,这些是直线。我们再运行一次。我们又开始跑了。
我能识别键盘,或者空格键。认出我的鼠标,或者是铲子。好了。
我希望这个程序的简单性能鼓励您尝试深度学习。下一步自然是尝试迁移学习。迁移学习是指你利用一个像AlexNet这样的网络,在你自己的特定图像上重新训练最后几层。这将导致一个网络甚至更好的AlexNet为您的特定图像。如果您有兴趣了解更多关于如何将深度学习应用于您的问题,请查看描述中的链接。
您也可以从以下列表中选择一个网站:
选择中国网站(中文或英文)以获得最佳的网站性能。其他MathWorks国家网站没有针对您所在位置的访问进行优化。