詹姆斯马丁,贝壳国际
Amjad Chaudry,壳牌国际
机器学习和深度学习可以用来自动化一系列任务。壳牌和高级卓越分析中心(AACoE)正在使用这些技术来加快流程,同时提高可靠性。在测绘学中,地形分类可以利用丰富的标记卫星图像训练数据集来改进。在大的(全景)植物图像中自动标记检测也导致更有效的维护。
James和Amjad将展示MATLAB®使用这些技术轻松。使用最小的设置,Matlab Parallel Server™允许团队在云中的多个远程GPU上培训网络。Matlab Production Server™允许团队创建薄型Web客户端,该客户端可以使用现场运营商,具有最小的物理硬件,如智能手机。
壳牌利用所有这些技术和工具,使其工程师能够轻松轻松地使用最新的发现。
记录日期:2018年10月3日
在过去四年左右的时间里,高级分析在我们做事的过程中扮演着越来越重要的角色。不过,今天我想特别跟大家谈谈深度学习,特别是在MATLAB中,我们如何利用一些深度学习工具来改进我们的创新管道。有趣的是,Rick的主题演讲提到了迁移学习和语义分割。这正是我今天要和你们讨论的一些例子。
当然,作为壳牌,我们总是要发出警告。我把这个留给那些想读的人5秒钟左右。好的。
所以今天,我要把我的演讲结构如下。我将简单地向大家介绍壳牌以及我们所涵盖的服务和产品。下载188bet金宝搏我还将谈论我们的创新和交付管道,我们如何尝试并将创新的想法,特别是在高级分析,通过最终产品由IT适当地维护。下载188bet金宝搏然后用MATLAB来做。
然后我会谈论两个用例。正如我所提到的那样,在工业图像中的标签识别中的第一个,然后在超光谱卫星图像中的地形识别。听起来很酷,所以我把它放在那里。然后最后的下一步,我们从那里开始,结果我们所拥有的结果。
好的。这是我们最新的商业总结幻灯片。我们是一家业务范围很广的公司。我们的工作范围很广,从我刚加入公司时开始,公司是在上游勘探,试图确定碳氢化合物矿床。然后通过发展我们尝试和钻井中提取,然后通过更多的下游活动,我们试着流程和改进产品,通过运输和交易,然后我们提供这些产品的各种终端用户,其中可能包括零售前院,航空、润滑剂。下载188bet金宝搏
如果我们重新利用这些信息,我们就可以突出分析在组织内部带来的价值。哦,对了,我想让大家注意的是所有不同颜色的圆圈。所以这些是活跃的领域,分析在我们的组织中发挥着领导作用。我们最终可能会有相当大的变化,对当前的工作流程和工作方式产生相当大的影响。这两个蓝色的圆圈是我将进一步探索的地方。
黄色的是我们的创新漏斗。在上面有一系列决策门,从D0到D4。基本上,我们试着从左到右把想法和概念。
在底部你可以看到两个重叠的三角形,我们有一个重叠的地方——我们从一个数字化团队,也就是我现在坐的地方,到IT部门。所以
我们尝试和做的是在范围界定和创新阶段,我们参与其中。我们生产POC概念、最低可行产品,并尝试证明其价值。然后,它逐渐被引入,我们尝试并确定全面部署解决方案和维护策略的范围,以便我们能够为业务提供全面的价值。金宝搏官方网站下载188bet金宝搏
我想让大家注意的另一件事是所有的点。可以把它想象成左边组织中想法数量的标准化表示。我想强调的是,我们完全可以接受每个决策门的大量变动,所以这是关于确保你在组织内充分考虑。当你完成最后阶段时,我们将你的资源集中在最有价值的解决方案上。金宝搏官方网站
MATLAB在哪里增加价值?这是非常快的原型。我们与MathWorks Consulting达成了积极的协议,我们利用该协议来提高我们的生产力。
有大量的例子和文档,我们想在MATLAB中维护。由于MathWorks在集成一些深度学习技术方面投入了巨大的精力,例如,在去年,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块储备。我们真的很喜欢web应用程序交付,所以我们绕过了许多关于安装MATLAB版本的问题,以使我们的一些软件运行。
这里有两个我们制作的网络应用的例子。右上角是一个关于沥青测试的网络应用程序。在左下角,你还可以看到一个预览我稍后会讲到的内容,那就是作为网页应用的地形分类。
我们还通过MDC进行了一点,因此Matlab分布式计算服务器。因此,允许我们利用云上的相当强大的GPU。我们主要使用它来培训我们的一些深入学习模式。
今年,我们在Shell和MATLAB之间有很多里程碑。我们现在终于,因为壳牌有时会有一些管理方面的事情,很难为不同的业务部门获得许可。所以现在我们有了一个全企业范围的交易。这意味着任何聪明的人,无论他们来自哪里,加入组织,最终可以快速地使用MATLAB,在理论上。
我们有第二张警司执照。正如我所说,MDCS,我认为,将会成为一个越来越重要的特征。我们正在考虑将其与我们的战略更加一致。
正如我所说的,MathWorks咨询公司一直在高效地利用我们的时间。然后,我们现在也希望利用班加罗尔的一些资源,尝试让我们能够24小时推进项目。
好的。这是第一个例子。这就是标签识别。你在背景中看到的是一件工业设备。我想这是一个泵。
但是在下面,我想引起你的注意,是标签,那个标签。在该标签上有一个SAP代码。我们有这些图像都点缀 - 他们都是地理标记 - 所有人都在工业环境中点缀。我们想要做的是提取标签,DO OCR上,然后链接到我们的SAP系统,因为我们可以从SAP系统中提取大量元数据。
所以我们采用的最初方法是使用R-CNN,一种区域卷积神经网络。取图像。然后,由于图像非常大,我们需要首先从图像中提取一系列区域建议,然后将这些建议输入CNN本身。
在我们的例子中,我们用。我想Rick讲过AlexNet的例子。所以我们改用vgd16网络,然后为了我们的目的,我们在最后三层进行了迁移学习。一开始我们有两个类问题。我们只知道有没有标签。
这是一些图片的样子。想想谷歌街景。所以在左边你可以看到它几乎是用鱼眼镜头拍摄的。首先,我们需要对图像进行失真校正,这是在MATLAB中完成的。然后想一下,它的输出就像你站在一个盒子里,然后盒子的六个面向外。
我们把顶部和底部的凸出部分去掉,只保留前面的水平凸出部分。然后我们将其输入到算法的区域提取部分。在本例中,我们稍微修改了它,并使用了Pdollar EdgeBox方法。但重要的是你可以看到这些区域很好地提取了可能有标签的区域。
好的。然后将进入CNN。所以现在这只是讨论了这一点。
因此,虽然培训您不需要太多的培训数据,但是,我们仍然有一些问题试图以稳定的方式为此进行足够的培训数据。所以我们将标签的定义扩展到更多标志。所以我们还包括迹象,然后对数据增强进行数据集,以便进一步增加数据,以提供足够的数据来为您提供稳定的结果。
在右边你可以看到训练后的激活。这很好地说明了在分类之前网络最初关注的地方。所以这个看起来很奇怪的图像告诉你它本质上是聚焦在紫色的斑块上。然后这是算法的输出。
因此,您可以看到内部场景,您可以看到外观场景,不同的照明条件。而你得到的是它认为是一个迹象的边界框 - 抱歉 - 什么是具有相关概率的迹象和标签。
对于敏锐的眼睛,你可能会注意到那里有很多误报。我们想要做的是实际上带出了所有可能的选择,然后我们依靠OCR,以筛选出很多那些误报。
好的。我刚刚向你们展示了转移学习被用来识别工业图像中的标签,然后在上面运行OCR来提取SAP代码。在运行时间方面,我给你们一个概念,每张图片大约需要三到四分钟。在这个特殊的用例中,我们可以用它来管理,这很好,但显然,如果你想要实时反馈,这是不可能发生的。
然而,如果你想走实时路线,有一些技术可以显著提高速度。例如,快速R-CNS,它可以使您的速度提高大约100倍。
我们也在查看MDC上的更多GPU,大GPU,让我们增加图像的分辨率大小。接下来,我猜,很酷的是,一旦我们通过它对SAP系统连接,我们如何将那些信息带回来,说,有人在网站上散步有一些增强的现实护目镜?我们如何共同可视化这些信息?这可能是我们一些客户感兴趣的令人兴奋的区域。
我们使用的数据来自于欧洲的一个工业站点,我们现在已经得到了相当多的兴趣,特别是来自亚洲的一个业务部门。所以我们将继续这些活动。
好的。下一个例子是高光谱卫星数据中的地形识别。快速描述一下为什么这个问题值得解决以及为什么我们这么麻烦。
所以在上游,在勘探中,地震数据是最重要的技术之一,我们可以通过它来观察地下。例如,在底部这个未指明的中东地区,你可以看到它的扩展,对吧?而获取数据的成本,也就是把能量放入地面并接收,是非常高的。所以我们说的是每年数千万的调查。这是非常高的成本。
地形类型,平滑与粗糙,例如,会影响高达50%的成本。因此,在我们的语言中,他们有一个非常理想的情况来标记数据,但在他们的语言中,这是一个非常低效的系统。所以他们花钱请了一个高度专业,高薪的人来查看卫星图像,然后在崎岖的地形周围手工绘制多边形,他们认为崎岖的地形。
然后他们必须通过实地考察来证实这一点。所以,必须有人飞到沙漠的这个特定区域,然后开着卡车到处走。他们需要放下旗帜,确认这确实是一个崎岖不平的地形。这是在调查之前。
在我们的例子中,因为我们现在有很多训练数据,我们认为,对。也许我们可以用一些更计算机密集的东西来代替整个工作流程。所以我们决定尝试这种语义分割方法。
这就是我们掌握的数据。我们有三种类型的图像,航空摄影,雷达和深度表面模型,DSM图像。由于2017 B的局限性,我们需要做三个渠道,但在这种情况下没关系。
这在2018年的A和b中得到了改进。但是我们决定把它放进三个通道来给图像上色,我们是这样做的。我们灰度化了航拍照片,把它放在红色通道,雷达放在绿色通道,等等。然后你就得到了这些彩色图像,你可以在右边看到。这是用于算法的。
那么SegNet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的一个道路场景,网络所做的就是你把它穿过,然后它将基本上把每个像素映射到一个类。
在上面的例子中,你有,比如,一个路面类,一个道路类,一个树木类,等等。因此,在我们的例子中,我们想重新调整它的用途,并将其用于崎岖或平坦的地形。我们就是这么做的。
我们实际上有一个30,000个示例数据设置,但我们只为此工作,使用1,000个示例。所以有很多改进的空间。我们还与顶部的图片相比,网络结构略微更简单。
所以我们决定使用三个编码器和解码器部分。对于1000个测试例子的训练,在4g的GPU上,这是相当小的,大约8个小时的训练时间。
这就是结果。我去掉了颜色,把它分解成原始图像。所以在上面你可以看到,在左边,航拍照片,然后是雷达和DSM。然后在左下方,你可以看到人类,或者我们的基本事实,然后是算法预测的。
在这两种情况下,你可以看到,好的。为此选择我选择的数据的快照,即性能非常好。目前,结果的质量小而不是定量,尽管我们将在制作混淆矩阵和所有这些东西的工作中。但表现非常好。我们展示了这一点,实际上是最终客户,并且已经他们本质上认为性能优于现有的工作流程。
我们允许客户通过Web应用程序与数据进行交互,所以这就是您可以在此处看到的。左侧图片,客户可以很轻松地进入URL,只需上传各种图像以及他们想要查看的感兴趣区域。然后在右侧推理步骤后,您可以通过不同的输入和输出图像轻弹并覆盖地面真相,以便他们可以了解结果的意义,以及他们对他们的满意和他们的感受。不满意。
好的。接下来的步骤和最初的工作很相似。因此,如果我们能从内部获得良好的资金支持,未来还有很多工作要做。我们要做的第一步是参数调整。
我们要开始增加训练数据的数量从我们现在的位置开始,也就是1000。我们还会添加更多的类。所以我们有一个设施等级,一个城市等级我们想要添加到数据中。你可以在右上角看到一个设施类的例子。
这个应用程序,我们只花了两天就制作了这个web应用程序,这就是与MathWorks咨询公司合作的真正力量。我们希望在web应用程序中添加更多的功能,并准确地提供客户想要的东西。
在这个特定的例子中,由于性能已经很好了,而且人们对它非常兴奋,因此有点担心这将如何影响现有的工作流。这包括做这项工作的人。因此,这次我们尝试采用双重集成策略,在提供技术的同时提高员工的技能,使他们能够更好地理解工作流程,更好地理解技术,然后还可能提出新的想法和更好的工作方式,然后我们可以提出来。显然,我们的一些中东单位对这项技术非常感兴趣。但我们现在也收到了一些东南亚业务单位的兴趣。
这对未来意味着什么呢?在壳牌,最重要的是了解总体规划以及如何融入总体规划。所以在我们的案例中,我们有这些数字主题。
所以我们现在要确保我们内部推广的方式与这些数字主题一致,我们已经确定了其中三个。利用云端的一切,使用MDCS进行高性能计算,然后进行高级分析。例如,基于智能应用程序的技术。
就2018年的当务之急而言,我们希望继续部署MPS和MDC。现在我们已经证明了其中一些解决方案的技术方面,但我们现在需要考虑证明业务价值方面。所以,正如我所说的,我们将研究地形识别和标签识别的进一步进展。金宝搏官方网站
但不幸的是,我今天不能谈论的东西也在地震领域。因此,我们目前正在研究非常陡峭的学习技术,尝试绘制地震数据图,因此只需通过简单的卷积,即可获得地下图像,从而获得油气分布、油气分布和油气属性分布。这是一个非常令人兴奋的领域,我们公司的一些人也在关注这个领域。
好的。这就是我要说的。我希望这是一次有趣的谈话。谢谢你!
你也可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。