从系列中:用MATLAB进行深度学习
乔·希克林,MathWorks
观看如何使用MATLAB的快速演示®,一个简单的网络摄像头,和一个用来识别周围物体的深层神经网络阿列克斯内特,一种训练有素的深卷积神经网络(CNN或ConvNet)接受过超过一百万张图片的训练。
该示例包括两部分:设置摄像机和执行物体识别。第一部分展示了如何使用网络摄像头
命令从相机获取图像。使用刷新屏幕
命令,MATLAB能够连续更新和显示摄像机拍摄的图像。
第二部分介绍如何下载预先训练的深度神经网络AlexNet,并使用MATLAB对摄像机图像进行连续处理。AlexNet将图像作为输入,并为图像中的对象提供一个标签。你可以用你周围的物体做实验,看看AlexNet有多精确。
今天,你可以用MATLAB很容易地做到这一点,但就在几年前,这还被认为是科幻小说。
了解更多关于用MATLAB进行深度学习或下载演示代码.
记录日期:2016年12月6日
你好我叫乔·希克林。我是MathWorks的高级开发人员。我一直在用MATLAB和神经网络工具箱进行深度学习的实验。我已经写了一个简单的小程序,做了一些很酷的事情。我现在想给你看看。
我所做的就是把一个网络摄像头连接到一个能识别图像的神经网络上。现在我可以把摄像头对准不同的物体,它就能识别出来。开瓶器,螺丝刀,左轮手枪,口琴,茶壶,铲子,诸如此类的东西。它不是完美的,但它做得很好。
让我们看看实现这个的代码。这就是整个项目,对吧?只有11行。我们要过一遍。但我们要分三个阶段来做。
我们要清理工作空间。我们会让摄像头连接到网络摄像头,用摄像头拍照,最后,把照片显示在屏幕上。当我们运行这个时,我们会得到一个新的图像。这是我们刚拍的照片。
但这是一个静止的图像。我们希望这是一个连续的视频。所以我们要再增加三行,把它放在一个循环中。
我们将在拍摄图片的代码周围放置一个while循环。我们现在添加一个drawnow,这样MATLAB就会立即绘制。当我运行这个时,我们会得到相同的结果。但现在,这是一个现场视频。
最后,我们需要加入神经网络。我使用一个叫AlexNet的网络。AlexNet是一个大型的深度卷积神经网络。他们用上百万张图片训练网络。它能识别大约1000种不同的物体。
我已经下载了。现在我们可以使用它了。这一行将要求网络对我们刚刚拍摄的图片进行分类。因此,我们将把每张图片传递给网络,网络将返回该图片的标签。
在此之前,我们必须将图片调整到AlexNet所期望的大小。它被训练成一个特定大小的图像。最后,我将在图片的标题中使用这个标签。我需要用这个命令把它转换成一个字符串。
我们都准备好了。这些是直线。让我们再运行一次。我们又开始跑步了。
我能识别键盘,或者空格键。认出我的鼠标,或者是抹刀。好了。
我希望本课程的简单性鼓励您尝试深入学习。下一步自然是尝试迁移学习。转移学习是指你利用AlexNet这样的网络,在自己的特定图像上重新训练最后几层。对于您的特定图像,这将产生一个比AlexNet更好的网络。如果您有兴趣了解更多关于如何将深度学习应用于您的问题,请查看描述中的链接。
您还可以从以下列表中选择网站:
选择中国网站(中文或英文)以获得最佳网站性能。其他MathWorks国家站点没有针对您所在位置的访问进行优化。