詹姆斯·马丁,壳牌国际
Amjad Chaudry,Shell International
机器学习和深度学习可以用来自动化一系列任务。壳牌和高级卓越分析中心(AACoE)正在使用这些技术来加快流程,同时提高可靠性。在测绘学中,地形分类可以利用丰富的标记卫星图像训练数据集来改进。在大的(全景)植物图像中自动标记检测也导致更有效的维护。
James和Amjad将演示如何使用MATLAB®让这些技巧的使用变得简单。通过最小的设置,MATLAB并行服务器™允许团队在云中的多个远程gpu上训练网络。MATLAB Production Server™可以让团队创建一个瘦网络客户端,操作人员可以在现场使用,只需要最少的物理硬件,如智能手机。
壳牌利用所有这些技术和工具,使其工程师能够轻松轻松地使用最新的发现。
记录时间:2018年10月3日
在过去四年左右的时间里,高级分析在我们的工作方式中扮演着越来越重要的角色。但今天,我想特别谈谈深度学习,以及如何,特别是在MATLAB中,利用一些深度学习工具来改善我们的创新管道。有趣的是,Rick的主题演讲提到了迁移学习和语义分割。这正是我今天要讲的一些例子。
当然,作为壳牌,我们总是必须提出警示。所以我会把它留下五秒钟,左右,那些想要阅读的人。好的。
所以今天,我要把我的演讲结构如下。我将简单地向大家介绍壳牌以及我们所涵盖的服务和产品。下载188bet金宝搏我还将谈论我们的创新和交付管道,我们如何尝试并将创新的想法,特别是在高级分析,通过最终产品由IT适当地维护。下载188bet金宝搏然后用MATLAB来做。
然后我将讨论两个用例。正如我提到的,第一个是工业图像中的标签识别,然后是高光谱卫星图像中的地形识别。听起来很酷,所以我把它放在里面了。最后是下一步,我们将从那里得到我们已经得到的结果。
好的。所以这是我们摘要幻灯片的最新化身。所以我们是一家非常广泛的公司。我们从我的初步加入到公司的初步加入,这是在上游勘探,试图识别碳氢化合物存款。然后通过开发我们尝试钻取井来提取那些,然后通过我们尝试处理和改进产品的更多下游活动,通过运输和交易,我们将这些产品送到各种最终用户,可以下载188bet金宝搏包括零售前院,航空和润滑油。
如果我们重新利用这些信息,我们就可以突出分析在组织内部带来的价值。哦,对了,我想让大家注意的是所有不同颜色的圆圈。所以这些是活跃的领域,分析在我们的组织中发挥着领导作用。我们最终可能会有相当大的变化,对当前的工作流程和工作方式产生相当大的影响。这两个蓝色的圆圈是我将进一步探索的地方。
黄色的是我们的创新漏斗。在上面有一系列决策门,从D0到D4。基本上,我们试着从左到右把想法和概念。
在底部,您可以看到我们有一个重叠的两个重叠三角形 - 我们从一个数字化团队移动,这是我目前坐在的地方,通过它。所以
我们尝试做的是在确定范围和创新阶段,我们参与其中。我们生产POC概念,最小可行产品,尝试并证明其价值。下载188bet金宝搏然后逐渐引入IT,我们尝试全面部署解决方案和维护策略,这样我们就能完全交付业务价值。金宝搏官方网站
另一件事我要注意的是所有的点。所以它 - 想到它几乎就像左侧组织中的思想数量的正常指示。而且我想强调的是,每个决策门都有一个大的流失,所以它是关于确保你在组织内完全的范围。然后,当您到达最后,我们将您的资源集中在最高价值的解决方案上。金宝搏官方网站
Matlab在哪里增加价值?这是非常快的原型。我们与Mathworks Consulting有一项积极的协议,我们利用了提高生产力。
有大量的例子和文档,我们想在MATLAB中维护。由于MathWorks在集成一些深度学习技术方面投入了巨大的精力,例如,在去年,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块储备。我们真的很喜欢web应用程序交付,所以我们绕过了许多关于安装MATLAB版本的问题,以使我们的一些软件运行。
所以在这里,我们有两个我们生产的Web应用程序的示例。就在右上角是沥青测试的Web应用程序。在左下方,您还可以看到稍后会看到我讨论的潜行预览,这是一个作为Web应用程序的地形分类。
我们还对MDC进行了一些实验,因此使用了MATLAB分布式计算服务器。因此,这使我们能够利用云上相当强大的GPU。我们主要用它来训练我们的一些深度学习模型。
今年,我们在Shell和MATLAB之间有很多里程碑。我们现在终于,因为壳牌有时会有一些管理方面的事情,很难为不同的业务部门获得许可。所以现在我们有了一个全企业范围的交易。这意味着任何聪明的人,无论他们来自哪里,加入组织,最终可以快速地使用MATLAB,在理论上。
我们有第二个MPS许可证。正如我所说,我认为,MDC将成为一个越来越重要的功能。我们正在寻求更多地与我们的策略一起融为一体。
MathWorks咨询公司,正如我所说,非常有效地利用了我们的时间。然后我们现在也希望利用我们在班加罗尔的一些资源,让我们能够夜以继日地推进项目。
好的。所以这是第一个例子。这是标签识别。所以你在背景中看到的是一块工业设备。我认为这是一个泵。
但在下面,我想提请你们注意的是那个标签,那个标签。标签上有SAP代码。我们有这些图片,它们都是地理标记的,都是在工业环境中。我们要做的是提取标签,对其进行OCR,然后将其链接到我们的SAP系统,因为我们可以从SAP系统中提取大量元数据。
所以我们采用的最初方法是使用R-CNN,一种区域卷积神经网络。取图像。然后,由于图像非常大,我们需要首先从图像中提取一系列区域建议,然后将这些建议输入CNN本身。
在我们的案例中,我们使用过 - 所以我认为瑞克谈到了AlexNet的榜样。所以我们使用了一个VGD 16网络,然后我们确实在最终三层上学习了我们的目的。最初在这里,我们刚刚有两类问题。我们刚刚标记或没有标签。
这是一些图片的样子。想想谷歌街景。所以在左边你可以看到它几乎是用鱼眼镜头拍摄的。首先,我们需要对图像进行失真校正,这是在MATLAB中完成的。然后想一下,它的输出就像你站在一个盒子里,然后盒子的六个面向外。
我们倾倒顶部和底部投影,我们只是保持水平预测。然后我们喂给算法的区域提取部分。在这种情况下,我们略微修改它并使用称为Pdollar EdgeBox方法的东西。但重要的是,你可以看到这些区域很好地提取了可能在那里有一个标签的区域。
好啊然后通过有线电视新闻网进行报道。所以现在我们只是讨论一下这个的训练。
因此,尽管通过培训,您不需要太多的培训数据,但是,我们在尝试设置足够的培训数据以稳定地执行此操作时仍然存在一些问题。所以我们把标签的定义扩展到了符号。因此,我们还包括了符号,然后进行了数据扩充,以进一步增加数据集,从而提供足够的数据,为您提供稳定的结果。
在右边你可以看到训练后的激活。这很好地说明了在分类之前网络最初关注的地方。所以这个看起来很奇怪的图像告诉你它本质上是聚焦在紫色的斑块上。然后这是算法的输出。
因此,您可以看到内部场景和外部场景,以及不同的照明条件。你得到的是一个包围着它认为是符号的边界框——对不起——什么是符号和标签以及相关的概率。
对于你们当中敏锐的目光,你可能会注意到其中有很多误报。我们要做的是拿出所有可能的选项,然后我们依靠OCR在上面过滤掉很多误报。
好的。所以我刚刚显示你的转移学习用于识别工业图像中的标签,然后将OCR运行在顶部以提取SAP代码。在运行时,只是为了给你一个想法,它是每张图片的三到四分钟。现在在这个特殊用例中,我们可以用它来管理,没关系,但显然如果你想要实时反馈,这不会发生。
然而,如果您想沿着实时路线走下去,有一些技术可以显著地提高速度。例如,快速的r - cnn,它的速度可以提高大约100倍。
我们也在考虑在MDC上增加更多的GPU,大型GPU,以提高图像的分辨率。接下来,我想,很酷的事情是,一旦我们将其连接到SAP系统,我们如何将这些信息带回,比如说,带着增强现实护目镜在网站上走动的人?我们如何将这些信息可视化?这可能是我们的一些客户感兴趣的一个非常令人兴奋的领域。
我们使用的数据来自于欧洲的一个工业站点,我们现在已经得到了相当多的兴趣,特别是来自亚洲的一个业务部门。所以我们将继续这些活动。
好的。因此,下一个例子是超频卫星数据中的地形识别。因此,只需迅速描述为什么这个问题值得解决以及为什么我们打扰。
因此,在上游,在勘探中,地震数据是我们拥有的最重要的技术之一,以便在地下寻找地下。例如,在底部这个未指明的中东地区,你可以看到它的广阔,对吗?而且获取数据的成本非常高,因此将能量注入地面并接收数据的成本非常高。因此,根据调查,我们每年谈论数千万。这是非常高的成本。
例如,地形类型,平滑与粗糙,例如,可以影响高达50%的成本。因此,由于这一点,他们在我们的语言中具有标记数据的非常理想的情况,但在他们的语言中是一个真正效率低下的系统。因此,他们支付一个高度专业化的,付费的个人来看看卫星图像,手动绘制粗糙地形周围的多边形,他们认为是粗糙的地形。
然后他们必须通过实地考察来证实这一点。所以必须有人飞到这片沙漠的特定区域,然后开着卡车到处跑。他们需要放下旗帜来确认这确实是崎岖的地形。这是在调查之前。
所以在我们的情况下,因为我们现在有很多培训数据,我们认为,对。也许我们可以用更多的计算机密集型更换整个工作流程。所以我们决定尝试这种语义分割方法。
这是我们的数据。我们有三种图像,航空摄影,雷达,和深度表面模型,DSM图像。由于2017年B的限制,我们需要做三个渠道,但在这种情况下是可以的。
这在2018年的A和b中得到了改进。但是我们决定把它放进三个通道来给图像上色,我们是这样做的。我们灰度化了航拍照片,把它放在红色通道,雷达放在绿色通道,等等。然后你就得到了这些彩色图像,你可以在右边看到。这是用于算法的。
SegNet是什么?它通常用于自动驾驶汽车。想象左上角有一个道路场景,网络所做的是你把它传送过去,然后它基本上会把每个像素映射到一个类。
在上面的例子中,你有,人行道类,道路类,树类,等等。所以在我们的例子中,我们想要重新利用它,将它用于粗糙的地形或平滑的地形。这就是我们所做的。
目前我们实际上有一个30000个示例数据集,但我们仅在这项工作中使用了1000个示例。因此有很大的改进空间。与上面的图片相比,我们的网络结构稍微简单一些。
所以我们决定使用三个编码器和解码器部分。在1,000个测试例子上的培训方面,在4千兆字节的GPU上,这很小,这是训练时间大约八个小时。
所以这些是结果。我已经删除了 - 从颜色消失并将其分解回原始图像。所以在顶部,你可以看到,在左边,航空摄影,然后是雷达和DSM。然后在左侧的底部,您可以看到我们的案例中的人类或地面真相,然后预测的算法。
在这两种情况下,你都可以看到,好的。因为它选择了我选择的数据的快照,所以性能非常好。目前,结果是定性的,而不是定量的,尽管我们将要致力于产生混淆矩阵和所有这些类型的东西。但是性能非常好。事实上,我们向终端客户展示了这一点,他们已经基本上认为性能优于现有的工作流。
我们允许客户通过web应用程序与数据进行交互,因此您可以在此处看到这一点。有了左边的图片,客户可以很容易地进入URL,上传各种图片以及他们想要查看的感兴趣区域。然后在推理步骤的右边,你可以浏览不同的输入和输出图像,覆盖基本事实,这样他们就可以了解结果的含义,以及他们满意和不满意的内容。
好的。因此,就后续步骤而言,这非常像初始工作。所以要完成很多未来的工作,假设我们可以在内部获得良好的资金。所以我们要做的一些步骤是参数调整。
我们将开始查看从我们目前的培训数据的数量增加,这是1000。我们也将添加更多课程。所以我们有一个设施类,一个城市课程,我们也希望添加到数据中。你可以看到那里右上角的设施类的一个例子。
该应用程序也是很快 - 它只花了两天时间来制作那个网络应用程序。因此,在那里咨询Mathworks咨询的实际力量是合作的真正力量。我们希望将进一步的功能添加到该Web应用程序中,并究竟提供客户想要的内容。
对于这个特别的例子,由于它的性能已经很好了,而且人们对它很兴奋,所以有些人担心它会如何影响现有的工作流。这也包括工作人员。所以这次我们试图dual-integration策略,我们都提供这项技术同时也技能提升员工,这样他们就可以了解工作流程,了解这项技术,然后还可能想出新的想法和更好的工作方式,然后我们可以想出。我们的一些中东公司,显然,对这项技术非常感兴趣。但我们现在也收到了一些东南亚业务部门的兴趣。
好的,那么在未来的意思是什么意思?在shell中,它都是关于了解大师计划,然后如何适应大师计划。所以在我们的情况下,我们有这些数字主题。
因此,我们现在将确保我们推广这一点的方式与这些数字主题对齐,我们已经确定了其中三个。利用云端的一切,高性能与MDC计算,然后是高级分析。因此,例如,具有基于智能应用的技术。
就2018年当前的优先事项而言,我们希望继续部署MPS和MDCS。现在我们已经证明了一些解决方案的技术方面,但我们现在需要看看证明业务价值方面。金宝搏官方网站所以,就像我说的,我们要看看地形识别的进一步进展,标签识别。
但不幸的是,有一件事我今天不能讲,也是在地震领域。因此,我们目前正在寻找非常复杂的学习技术,试图绘制地震数据,通过简单的卷积,从地下图像到储层分布,油气分布,油气属性分布。所以这是一个非常令人兴奋的领域,我们公司也有不少人在关注。
好的。所以这就是我要说的一切。我希望这是一个有趣的谈话。谢谢你。
您还可以从以下列表中选择一个网站:
选择中国站点(中文或英文)以获得最佳站点性能。其他MathWorks国家/地区网站未针对您所在地的访问进行优化。
本网站使用cookie来改善您的用户体验,个性化内容和广告,并分析网站流量。通过继续使用本网站,您同意我们使用cookie。请看我们隐私政策要了解有关cookie的更多信息以及如何更改设置。