深度学习

理解和使用深度学习网络

跳入深渊

你好,欢迎来到新MATLAB在深度学习中央的博客!在我24年的MATLAB工具箱开发和设计,我兴奋的解决这个新项目。

深度学习指的是一组机器学习技术,是基于神经网络有大量的层(因此“深度”)。通过培训这些网络标签数据集,他们可以使用图像达到最先进的精度分类任务,文本和声音作为输入。

因为我的背景在图像处理,我跟随着深度学习在过去的几年中迅速进步怀着极大的兴趣。有很多我想学和与你分享关于该地区,尤其是与MATLAB探索深度学习的想法。为此,一些开发人员自愿伸出援手与主题和代码和技术指导我们探索。他们正在建设深度学习能力尽可能快的产品,如:下载188bet金宝搏

  • 神经网络工具箱
  • 并行计算工具箱
  • 图像处理工具箱
  • 计算机视觉系统工具箱
  • 自动驾驶系统工具箱
  • GPU编码器

我将介绍给你当我们进入深度学习与MATLAB的细节。

如果你跟着我图像处理的博客文章,你可以期待一个类似的风格。主题将是一个混合的概念教程、例子和案例研究、功能的探索和建议。我想我们将讨论诸如性能、GPU硬件和网络数据集。也许我们会做一些事情只是为了好玩,像LSTM网络建立上个月MathWorks开发商壶嘴Shakespeare-like诗句。

使用电子邮件或RSS订阅,点击“订阅”链接在页面的顶部。

我将给你们一些基于AlexNet急转弯。我只是插入一个摄像头在MATLAB和连接到它。

c =网络摄像头
c =摄像头与属性:名称:“微软®LifeCam电影院(TM)的决议:“640 x480 AvailableResolutions:{1×11细胞}ExposureMode:“汽车”WhiteBal金宝搏官方网站anceMode:‘汽车’专注:33 BacklightCompensation: 5清晰度:25变焦:0 FocusMode:“汽车”倾斜:0亮度:143锅:0 WhiteBalance: 4500饱和度:83曝光:6对比:5

接下来,我装一个AlexNet网络已经pretrained一百万图像。网络可以将图像分成1000种不同的对象类。

nnet = alexnet
nnet = SeriesNetwork属性:层:[25×1 nnet.cnn.layer.Layer]

你也可以尝试其他网络。例如,升级到R2017b之后,你可以尝试GoogLeNet通过使用网= googlenet

这些25网络层是什么样子的呢?

nnet.Layers
ans x1 = 25层阵列层:227 x227x3图像数据的图像输入“zerocenter”正常化2 conv1卷积96年11 x11x3旋转步[4 4]和填充[0 0 0 0]3‘relu1 ReLU ReLU 4 norm1的横通道正常化横通道正常化与5频道/元素5“pool1”马克斯池3 x3马克斯池步(2 - 2)和填充[0 0 0 0]6 conv2卷积256 5 x5x48旋转步[1]和填充(2 2 2 2)7的relu2 ReLU ReLU 8 norm2的横通道正常化横通道正常化与5频道/元素9“pool2”马克斯池3 x3马克斯池步(2 - 2)和填充[0 0 0 0]384 3 x3x256 conv3的卷积运算与步幅[1]和填充[1 1 1 1]11的relu3 ReLU ReLU 12 conv4卷积384 3 x3x192旋转步[1]和填充[1 1 1 1]13的relu4 ReLU ReLU 14 conv5卷积256 3 x3x192旋转步[1]和填充[1 1 1 1]15 ' relu5 ReLU ReLU 16“pool5”马克斯池3 x3 Max池步(2 - 2)和填充[0 0 0 0]17 fc6完全连接4096完全连接层18“relu6”ReLU ReLU 19“drop6”辍学50%辍学20“fc7”完全连接4096完全连接层21 ' relu7 ReLU ReLU 22“drop7”辍学50%辍学23 fc8完全连接1000完全连接层24“概率”Softmax Softmax 25“输出”分类输出crossentropyex“鲤鱼”,“金鱼”,998其他的类

我碰巧知道“咖啡杯”是其中的一个类别。如何将网络与23岁的MATLAB从书架上“图片”杯吗?

这是我与我的网络摄像头使用快照照片=快照(c)

imshow(图片)

第一层接受输入。它将告诉我们网络接收的图像大小。

nnet.Layers (1)
ans = ImageInputLayer属性:名称:“数据”InputSize: [227 227 3] Hyperparameters DataAugmentation:“没有”正常化:“zerocenter”

所以我需要调整快照是227 x227之前喂给网络。

pic2 = imresize(图片,(227 227));imshow (pic2)

现在我可以对它进行分类。

标签=分类(nnet pic2)
标签=直言咖啡杯

好的!但是我不知道网络认为这可能是什么呢?的预测函数可以返回所有类别的分数。

p =预测(nnet pic2);情节(p)

有几个显著的预测高峰。我将使用maxkR2017b函数(新)找到他们,然后我会在列表中查找这些位置的分类标签网络的最后一层。

(p3, i3) = maxk (p, 3);
p3
p3 = 1 0.2469 0.1446 0.1377×3行向量
i3
i3 = 505 733 623
nnet.Layers(结束)
ans = ClassificationOutputLayer属性:名称:“输出”类名:{1000×1细胞}OutputSize: 1000 Hyperparameters LossFunction:“crossentropyex”
nnet.Layers(结束).ClassNames (i3)
ans = 3×1单元阵列{“咖啡杯”}{的宝丽来相机}{镜头盖的}

嗯。我很高兴咖啡杯上。我不能把咖啡倒进一个相机或镜头盖!

记住,选择跟随本新博客,点击“订阅”链接在页面的顶部。

最后,我的注意图像处理的博客读者:别担心,我将继续写博客,。




发表与MATLAB®R2017b

|
  • 打印
  • 发送电子邮件

评论

留下你的评论,请点击在这里MathWorks账户登录或创建一个新的。