詹姆斯·马丁,壳牌国际
Amjad Chaudry,壳牌国际
机器学习和深度学习可以用于自动化一系列任务。壳牌和高级卓越分析中心(AACoE)正在使用这些技术来加快流程,同时提高其可靠性。在测绘学中,利用丰富的带标记的卫星图像训练数据集可以改进地形分类。大型(全景)植物图像的自动标签检测也导致更有效的维护。
James和Amjad将展示MATLAB®使用这些技术轻松。使用最小的设置,Matlab Parallel Server™允许团队在云中的多个远程GPU上培训网络。Matlab Production Server™允许团队创建薄型Web客户端,该客户端可以使用现场运营商,具有最小的物理硬件,如智能手机。
壳牌利用了所有这些技术和工具,使其工程师可以轻松、轻松地使用最新的发现。
记录:2018年10月3日
在过去的四年左右的壳中,高级分析在我们做事的方式上发挥着越来越重要的作用。然而,今天,我想特别谈论深度学习,以及在Matlab中的方式,我们如何利用一些深入学习工具来改善我们的创新管道。有趣的是,Rick的主题演讲提到提到转移学习和语义细分。这正是一些例子,我今天会与你交谈。
当然,作为壳牌的一员,我们总是要发出警告。所以我把这个留五秒钟给那些想读的人。好的。
所以今天,我将这样组织我的演讲。下面我简单地向大家介绍一下壳牌公司,以及我们提供的一系列服务和产品。下载188bet金宝搏我还将谈到我们的创新和交付管道,我们如何尝试并将创新的想法,特别是在高级分析中,带到最终产品中,这些最终产品是由IT部门维护的。下载188bet金宝搏然后MATLAB适合于它。
然后我将讨论两个用例。正如我提到的,第一个是工业图像中的标签识别,然后是高光谱卫星图像中的地形识别。听起来很酷,所以我把它放进去了。最后是接下来的步骤,从那里我们要怎么做我们已经得到的结果。
好的。所以这是我们摘要幻灯片的最新化身。所以我们是一家非常广泛的公司。我们从我的初步加入到公司的初步加入,这是在上游勘探,试图识别碳氢化合物存款。然后通过开发我们尝试钻取井来提取那些,然后通过我们尝试处理和改进产品的更多下游活动,通过运输和交易,我们将这些产品送到各种最终用户,可以下载188bet金宝搏包括零售前院,航空和润滑油。
如果我们重新定义这些信息的用途,我们就可以强调分析在组织内部所带来的价值。哦,就是这样,我想让大家注意的是各种颜色的圆圈。这些都是分析在我们组织中发挥主导作用的活跃领域。我们最终可能会有相当大的改变,对当前的工作流程和工作方式产生相当大的影响。蓝色的两个圆圈是我要进一步研究的地方。
黄色的是我们的创新漏斗。上面有一系列的决策门,从D0到D4。基本上,我们试着从左到右收集想法和概念。
在底部,您可以看到我们有一个重叠的两个重叠三角形 - 我们从一个数字化团队移动,这是我目前坐在的地方,通过它。所以
我们尝试和做的是在范围和创新阶段,我们参与其中。我们生产POC概念,最低可行的产品,尝试证明价值。下载188bet金宝搏然后逐渐被带入,我们尝试和扫描完全部署解决方案以及维护策略,因此我们可以充分为业务提供价值。金宝搏官方网站
我想要注意的另一件事是所有的点。所以这是——把它想成是组织中思想数量的标准化指示。我想强调的是,我们完全可以接受在每一个决策门口都有很大的变动,所以这是关于确保你的范围完全在组织内。当你完成最后一项工作时,我们会把你的资源,集中在最有价值的解决方案上。金宝搏官方网站
MATLAB在哪里增加了价值?这是一个非常快的原型。我们与MathWorks Consulting有一个积极的协议,我们利用它来提高我们的生产力。
有大量的例子,文档,我们想要在MATLAB中维护。由于MathWorks在过去的一年中对集成一些深度学习技术给予了巨大的关注,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块储备。我们真的很喜欢web应用程序交付,所以我们绕过了许多关于安装MATLAB版本的问题来让我们的一些软件运行。
这里我们有两个我们制作的网络应用的例子。右上方是一个沥青测试的网页应用程序。在左下角,你还可以看到我稍后要讲的内容的预览,这是一个web应用程序的地形分类。
我们也用MDCS做了一些实验,也就是MATLAB分布式计算服务器。这让我们能够利用云上强大的gpu。我们主要用它来训练我们的一些深度学习模型。
就今年而言,我们在Shell和MATLAB之间有了很多里程碑。我们现在终于——因为壳牌有时会有一些管理方面的事情,要获得业务的不同部分的许可证是相当困难的。所以现在我们有了一个全企业范围的交易。所以这意味着任何聪明的人,无论他们来自哪里,加入这个组织,最终都可以很快地使用MATLAB进行生产,理论上。
我们有第二个MPS执照。正如我所说的,我认为MDCS将会成为一个越来越重要的特征。我们正在考虑将其与我们的战略更加一致。
正如我所说,Mathworks Consulting一直非常富有成效的时间。然后我们现在也希望利用我们在班加罗尔的一些资源来尝试,并允许我们进入时钟周围的项目。
好的。这是第一个例子。这就是标签识别。你在背景中看到的是一件工业设备。我想这是一个水泵。
但是在下面,我想让你们注意的是,这个标签。标签上有SAP代码。我们有这些遍布各处的图像——它们都有地理标记——都分布在工业环境中。我们要做的是提取那个标签,对它进行OCR处理,然后把它链接到我们的SAP系统,因为我们可以从SAP系统中提取很多元数据。
我们采用的最初方法是使用R-CNN,一种区域卷积神经网络。我们取图像。然后,由于图像非常大,我们首先需要从图像中提取一系列区域建议,然后将这些区域建议正确地输入到CNN中。
在我们的案例中,我们使用过 - 所以我认为瑞克谈到了AlexNet的榜样。所以我们使用了一个VGD 16网络,然后我们确实在最终三层上学习了我们的目的。最初在这里,我们刚刚有两类问题。我们刚刚标记或没有标签。
这是一些图像的样子。想想谷歌街景。在左边你可以看到这几乎是用鱼眼镜头拍摄的。首先,我们需要对图像应用失真校正,这是在MATLAB中完成的。然后想象一下,它的输出就像你站在一个盒子里,然后盒子有六个面向外的面。
我们倾倒顶部和底部投影,我们只是保持水平预测。然后我们喂给算法的区域提取部分。在这种情况下,我们略微修改它并使用称为Pdollar EdgeBox方法的东西。但重要的是,你可以看到这些区域很好地提取了可能在那里有一个标签的区域。
好的。然后将其传送到CNN。现在我们讨论的是训练。
所以,虽然你不需要太多的训练数据,但是,我们仍然有一些问题试图有足够的训练数据集让它以稳定的方式运行。所以我们把标签的定义扩展成了符号。所以我们也加入了符号,然后做了数据增强来进一步增加数据集以提供足够的数据来给你一个稳定的结果。
在右边,你可以看到在训练激活后。所以这是一个很好的指示,表明了网络在分类之前首先关注的地方。所以这个看起来很奇怪的图像告诉你它主要聚焦在紫色的区域。这是算法的输出。
所以你可以看到一个室内场景和一个外部场景,不同的照明条件。你得到的是一个包围框围绕着它认为是符号的东西,不好意思,是有关联概率的符号和标签。
如果你们有敏锐的眼光,你们可能会注意到这里有很多误报。我们想做的是找出所有可能的选项,然后我们依靠OCR来过滤掉很多错误的阳性结果。
好的。所以我刚刚给你们展示了转移学习被用来识别工业图像中的标签,然后它会在上面运行OCR来提取SAP代码。在运行时间方面,给你们一个概念,每张图片大约需要3到4分钟。在这个特定的用例中,我们可以处理这个,这很好,但显然,如果你想要实时反馈,这是不会发生的。
但是,如果您想下降实时路线,有技术可以显着提高此功能的速度。因此,例如,快速的R-CNN,这应该给您提高速度大约100倍。
我们也在寻找更多的GPU,在MDCS上使用更大的GPU,让我们能够增加图像的分辨率。接下来,我想,很酷的事情是一旦我们把这个连接到SAP系统,然后我们如何把这些信息带回来,比如说,给那些带着增强现实眼镜在网站上走动的人?我们如何共同可视化这些信息?这可能是我们一些客户感兴趣的一个令人兴奋的领域。
我们使用的数据来自欧洲的一个工业站点,我们现在得到了很多兴趣,特别是来自亚洲的一个业务部门。我们将继续这些活动。
好的。下一个例子是高光谱卫星数据中的地形识别。简单描述一下为什么这个问题值得解决,为什么我们要这么做。
所以在上游,在勘探中,地震数据是我们拥有的最重要的技术之一以便在地下寻找。举个例子,在下方这个未指明的中东地区,你可以看到它的广阔区域,对吧?而获取数据的成本,也就是把能量放到地下并接收它,是非常高的。所以我们说的是每年数千万,每次调查。这是非常高的成本。
例如,地形类型,平滑与粗糙,例如,可以影响高达50%的成本。因此,由于这一点,他们在我们的语言中具有标记数据的非常理想的情况,但在他们的语言中是一个真正效率低下的系统。因此,他们支付一个高度专业化的,付费的个人来看看卫星图像,手动绘制粗糙地形周围的多边形,他们认为是粗糙的地形。
然后他们必须用现场访问来证实。所以有人必须飞到这块特定地区的沙漠,然后在一辆卡车上开车。他们需要将旗帜放下以确认这是粗糙的地形。这是在调查之前。
所以在我们的情况下,因为我们现在有很多培训数据,我们认为,对。也许我们可以用更多的计算机密集型更换整个工作流程。所以我们决定尝试这种语义分割方法。
所以这是我们的数据。我们有三种类型的图像,航拍,雷达和深度表面模型,DSM图像。由于2017年的局限性,我们需要做三个频道,但在这种情况下就可以了。
现在使用2018年的A和b已经改进了。但是我们决定在这里把它放进三个通道来着色图像,我们这样做了。我们对航空摄影进行灰度化,把它放在红色通道,雷达在绿色通道,等等。然后你就得到了右边这些彩色的图像。这是算法中用到的。
所以segnet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的道路场景,网络所做的是,你通过它喂它,然后它将将每个像素映射到一个类。
所以在顶部的例子中,你有,说,路面类,道路类,树级等等。所以在我们的情况下,我们想把它重新重新用它并用它来用于崎岖的地形或平滑的地形。这就是我们所做的。
我们现在有3万个样本数据集,但我们只用了1000个样本。所以还有很大的改进空间。与上面的图相比,我们的网络结构稍微简单一些。
所以我们决定使用三个编码器和解码器部分。在1,000个测试例子上的培训方面,在4千兆字节的GPU上,这很小,这是训练时间大约八个小时。
这就是结果。我已经从颜色中移除并将其分解为原始图像。在上面,你可以看到,在左边,是航空摄影,然后是雷达和DSM。在左边的底部,你可以看到人的真实情况,或者在我们的例子中是地面的真实情况,然后是算法的预测。
在这两种情况下,你可以看到。为此选择了我所选择的数据的快照,那性能就相当不错了。现在的结果是定性的,而不是定量的,虽然我们要做的是产生混淆矩阵和所有这些东西。但是表演非常好。实际上,我们向终端客户展示了这一点,他们已经认为这种性能优于现有的工作流程。
我们允许客户通过网络应用与数据进行交互,这就是你所看到的。有了左边的图片,客户可以很容易地进入URL,上传各种图片和他们想看的感兴趣的区域。然后在右边的推理步骤之后,你可以浏览不同的输入和输出图像并覆盖地面真相,这样他们就能知道结果的意义,他们满意和不满意的是什么。
好的。就下一步而言,这很像初期工作。所以未来还有很多工作要做,假设我们能从内部获得良好的资金。我们首先要做的是参数调整。
我们将开始考虑增加训练数据的数量从我们现在的位置,也就是1000。我们还将添加更多的类。我们有一个设施类,还有一个城市类我们想要添加到数据中。你可以在右上角看到一个设施类的例子。
这个应用程序也是,我们很快——只花了两天时间就完成了这个web应用程序。所以这就是和MathWorks Consulting正确合作的真正力量。我们希望在web应用中添加更多的功能,并提供客户想要的内容。
对于这个特殊的例子,由于表现已经和人们非常兴奋,有一点担心如何影响现有的工作流程。这包括人们在做这项工作的人。所以这段时间在我们围绕我们试图拥有双重集成策略,在那里我们都提供了技术,同时也可以提高工作人员,以便他们更加了解工作流程,了解技术更多,然后也许也许是新的想法和更好的工作方式我们可以提出。我们的一些中东单位显然,对这项技术非常感兴趣。但我们也从一些东南亚企业单位上获得了兴趣。
好的,那么在未来的意思是什么意思?在shell中,它都是关于了解大师计划,然后如何适应大师计划。所以在我们的情况下,我们有这些数字主题。
因此,我们现在将确保我们推广这一点的方式与这些数字主题对齐,我们已经确定了其中三个。利用云端的一切,高性能与MDC计算,然后是高级分析。因此,例如,具有基于智能应用的技术。
就2018年的即时优先事项而言,我们希望继续部署MPS和MDC。而且现在我们已经证明了一些这些解决方案的技术方面,但我们现在需要看证明业务价值方面。金宝搏官方网站所以,正如我所说,我们将介绍地形识别的进一步进展,标签识别。
但是,不幸的是,我今天无法谈论的东西也在地震领域。所以我们目前正在寻求非常陡峭的学习技术来尝试和地震数据,因此只是通过简单的卷积来支付地下的地震数据的图像,通过简单的卷积来支付碳氢化合物分布,碳氢化合物属性分布。因此,这是我们公司中少数人的令人兴奋的区域也在看。
好的。所以这就是我要说的一切。我希望这是一个有趣的谈话。谢谢你。
你也可以从以下列表中选择一个网站:
请选择表现最佳的中国网站(中文或英文)。MathWorks的其他国家网站并没有针对您所在位置的访问进行优化。