詹姆斯马丁,贝壳国际
Amjad Chaudry,Shell International
机器学习和深度学习可以用于自动化一系列任务。壳牌和高级卓越分析中心(AACoE)正在使用这些技术来加快流程,同时提高其可靠性。在测绘学中,利用丰富的带标记的卫星图像训练数据集可以改进地形分类。大型(全景)植物图像的自动标签检测也导致更有效的维护。
James和Amjad将展示Matlab的方式®使用这些技术轻松。使用最小的设置,Matlab Parallel Server™允许团队在云中的多个远程GPU上培训网络。Matlab Production Server™允许团队创建薄型Web客户端,该客户端可以使用现场运营商,具有最小的物理硬件,如智能手机。
壳牌利用了所有这些技术和工具,使其工程师可以轻松、轻松地使用最新的发现。
记录:2018年10月3日
在过去的四年左右的壳中,高级分析在我们做事的方式上发挥着越来越重要的作用。然而,今天,我想特别谈论深度学习,以及在Matlab中的方式,我们如何利用一些深入学习工具来改善我们的创新管道。有趣的是,Rick的主题演讲提到提到转移学习和语义细分。这正是一些例子,我今天会与你交谈。
当然,作为壳牌,我们总是必须提出警示。所以我会把它留下五秒钟,左右,那些想要阅读的人。好的。
所以今天,我将这样组织我的演讲。下面我简单地向大家介绍一下壳牌公司,以及我们提供的一系列服务和产品。下载188bet金宝搏我还将谈到我们的创新和交付管道,我们如何尝试并将创新的想法,特别是在高级分析中,带到最终产品中,这些最终产品是由IT部门维护的。下载188bet金宝搏然后MATLAB适合于它。
然后我会谈论两个用例。正如我所提到的那样,在工业图像中的标签识别中的第一个,然后在超光谱卫星图像中的地形识别。听起来很酷,所以我把它放在那里。然后最后的下一步,我们从那里开始,结果我们所拥有的结果。
好的。所以这是我们摘要幻灯片的最新化身。所以我们是一家非常广泛的公司。我们从我的初步加入到公司的初步加入,这是在上游勘探,试图识别碳氢化合物存款。然后通过开发我们尝试钻取井来提取那些,然后通过我们尝试处理和改进产品的更多下游活动,通过运输和交易,我们将这些产品送到各种最终用户,可以下载188bet金宝搏包括零售前院,航空和润滑油。
如果我们重新定义这些信息的用途,我们就可以强调分析在组织内部所带来的价值。哦,就是这样,我想让大家注意的是各种颜色的圆圈。这些都是分析在我们组织中发挥主导作用的活跃领域。我们最终可能会有相当大的改变,对当前的工作流程和工作方式产生相当大的影响。蓝色的两个圆圈是我要进一步研究的地方。
黄色的是我们的创新漏斗。上面有一系列的决策门,从D0到D4。基本上,我们试着从左到右收集想法和概念。
在底部你可以看到两个重叠的三角形我们有一个重叠的地方——我们从一个数字化团队,也就是我现在坐的地方,过渡到IT。所以
我们尝试和做的是在范围和创新阶段,我们参与其中。我们生产POC概念,最低可行的产品,尝试证明价值。下载188bet金宝搏然后逐渐被带入,我们尝试和扫描完全部署解决方案以及维护策略,因此我们可以充分为业务提供价值。金宝搏官方网站
另一件事我要注意的是所有的点。所以它 - 想到它几乎就像左侧组织中的思想数量的正常指示。而且我想强调的是,每个决策门都有一个大的流失,所以它是关于确保你在组织内完全的范围。然后,当您到达最后,我们将您的资源集中在最高价值的解决方案上。金宝搏官方网站
Matlab在哪里增加价值?这是非常快的原型。我们与Mathworks Consulting有一项积极的协议,我们利用了提高生产力。
有大量的例子,文档,我们想要在MATLAB中维护。由于MathWorks在过去的一年中对集成一些深度学习技术给予了巨大的关注,我们能够利用该领域的一些最新发展,同时也能够访问这些有利的模块储备。我们真的很喜欢web应用程序交付,所以我们绕过了许多关于安装MATLAB版本的问题来让我们的一些软件运行。
所以在这里,我们有两个我们生产的Web应用程序的示例。就在右上角是沥青测试的Web应用程序。在左下方,您还可以看到稍后会看到我讨论的潜行预览,这是一个作为Web应用程序的地形分类。
我们还通过MDC进行了一点,因此Matlab分布式计算服务器。因此,允许我们利用云上的相当强大的GPU。我们主要使用它来培训我们的一些深入学习模式。
就今年而言,我们在Shell和MATLAB之间有了很多里程碑。我们现在终于——因为壳牌有时会有一些管理方面的事情,要获得业务的不同部分的许可证是相当困难的。所以现在我们有了一个全企业范围的交易。所以这意味着任何聪明的人,无论他们来自哪里,加入这个组织,最终都可以很快地使用MATLAB进行生产,理论上。
我们有第二个MPS许可证。正如我所说,我认为,MDC将成为一个越来越重要的功能。我们正在寻求更多地与我们的策略一起融为一体。
正如我所说,Mathworks Consulting一直非常富有成效的时间。然后我们现在也希望利用我们在班加罗尔的一些资源来尝试,并允许我们进入时钟周围的项目。
好的。所以这是第一个例子。这是标签识别。所以你在背景中看到的是一块工业设备。我认为这是一个泵。
但是在下面,我想引起你的注意,是标签,那个标签。在该标签上有一个SAP代码。我们有这些图像都点缀 - 他们都是地理标记 - 所有人都在工业环境中点缀。我们想要做的是提取标签,DO OCR上,然后链接到我们的SAP系统,因为我们可以从SAP系统中提取大量元数据。
我们采用的最初方法是使用R-CNN,一种区域卷积神经网络。我们取图像。然后,由于图像非常大,我们首先需要从图像中提取一系列区域建议,然后将这些区域建议正确地输入到CNN中。
在我们的例子中,我们用了。我想Rick讲过AlexNet的例子。所以我们使用了VGD 16网络,然后我们将学习转移到最后三层。一开始我们有两个类问题。我们有标签或没有标签。
这是一些图像的样子。想想谷歌街景。在左边你可以看到这几乎是用鱼眼镜头拍摄的。首先,我们需要对图像应用失真校正,这是在MATLAB中完成的。然后想象一下,它的输出就像你站在一个盒子里,然后盒子有六个面向外的面。
我们丢掉顶部和底部的投影,只保留水平的前端投影。然后我们把它输入到算法的区域提取部分。在本例中,我们稍微修改了它,并使用了一种称为Pdollar EdgeBox的方法。但重要的是你可以看到这些区域是很好的提取区域那里可能有一个标签。
好的。然后将进入CNN。所以现在这只是讨论了这一点。
因此,虽然培训您不需要太多的培训数据,但是,我们仍然有一些问题试图以稳定的方式为此进行足够的培训数据。所以我们将标签的定义扩展到更多标志。所以我们还包括迹象,然后对数据增强进行数据集,以便进一步增加数据,以提供足够的数据来为您提供稳定的结果。
在右边,你可以看到在训练激活后。所以这是一个很好的指示,表明了网络在分类之前首先关注的地方。所以这个看起来很奇怪的图像告诉你它主要聚焦在紫色的区域。这是算法的输出。
因此,您可以看到内部场景,您可以看到外观场景,不同的照明条件。而你得到的是它认为是一个迹象的边界框 - 抱歉 - 什么是具有相关概率的迹象和标签。
对于敏锐的眼睛,你可能会注意到那里有很多误报。我们想要做的是实际上带出了所有可能的选择,然后我们依靠OCR,以筛选出很多那些误报。
好的。所以我刚刚显示你的转移学习用于识别工业图像中的标签,然后将OCR运行在顶部以提取SAP代码。在运行时,只是为了给你一个想法,它是每张图片的三到四分钟。现在在这个特殊用例中,我们可以用它来管理,没关系,但显然如果你想要实时反馈,这不会发生。
但是,如果您想下降实时路线,有技术可以显着提高此功能的速度。因此,例如,快速的R-CNN,这应该给您提高速度大约100倍。
我们也在查看MDC上的更多GPU,大GPU,让我们增加图像的分辨率大小。接下来,我猜,很酷的是,一旦我们通过它对SAP系统连接,我们如何将那些信息带回来,说,有人在网站上散步有一些增强的现实护目镜?我们如何共同可视化这些信息?这可能是我们一些客户感兴趣的令人兴奋的区域。
我们使用的数据来自欧洲的一个工业站点,我们现在得到了很多兴趣,特别是来自亚洲的一个业务部门。我们将继续这些活动。
好的。因此,下一个例子是超频卫星数据中的地形识别。因此,只需迅速描述为什么这个问题值得解决以及为什么我们打扰。
因此,在上游,在探索中,地震数据是我们在地下在地面下面看的最重要的技术之一。而且,例如,在这个未指明的中东地区在底部,你可以看到它的expanse,对吧?以及获取数据的成本,从而将能量放入地面并接收它,非常高。因此,我们每年调查每年都会谈论数百万美元。这成本很高。
而地形类型,例如,平滑与粗糙,可以影响成本高达50%。正因为如此,在我们的语言中,他们有一个非常理想的情况来标记数据,但在他们的语言中,一个非常低效的系统。所以他们花钱请了一个非常专业、收入很高的人来查看卫星图像,并在他们认为的粗糙地形周围手工绘制多边形。
然后他们必须用现场访问来证实。所以有人必须飞到这块特定地区的沙漠,然后在一辆卡车上开车。他们需要将旗帜放下以确认这是粗糙的地形。这是在调查之前。
所以在我们的案例中,因为我们现在有很多训练数据,我们想,是的。也许我们可以用更密集的计算机来取代整个工作流程。所以我们决定尝试这种语义分割方法。
所以这是我们的数据。我们有三种类型的图像,航拍,雷达和深度表面模型,DSM图像。由于2017年的局限性,我们需要做三个频道,但在这种情况下就可以了。
现在使用2018年的A和b已经改进了。但是我们决定在这里把它放进三个通道来着色图像,我们这样做了。我们对航空摄影进行灰度化,把它放在红色通道,雷达在绿色通道,等等。然后你就得到了右边这些彩色的图像。这是算法中用到的。
所以segnet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的道路场景,网络所做的是,你通过它喂它,然后它将将每个像素映射到一个类。
所以在顶部的例子中,你有,说,路面类,道路类,树级等等。所以在我们的情况下,我们想把它重新重新用它并用它来用于崎岖的地形或平滑的地形。这就是我们所做的。
我们实际上有一个30,000个示例数据设置,但我们只为此工作,使用1,000个示例。所以有很多改进的空间。我们还与顶部的图片相比,网络结构略微更简单。
所以我们决定使用三个编码器和解码器部分。就1000个测试例子的训练而言,在一个4g的GPU上,非常小,大约需要8小时的训练时间。
所以这些是结果。我已经删除了 - 从颜色消失并将其分解回原始图像。所以在顶部,你可以看到,在左边,航空摄影,然后是雷达和DSM。然后在左侧的底部,您可以看到我们的案例中的人类或地面真相,然后预测的算法。
在这两种情况下,你可以看到,好的。为此选择我选择的数据的快照,即性能非常好。目前,结果的质量小而不是定量,尽管我们将在制作混淆矩阵和所有这些东西的工作中。但表现非常好。我们展示了这一点,实际上是最终客户,并且已经他们本质上认为性能优于现有的工作流程。
我们允许客户通过Web应用程序与数据进行交互,所以这就是您可以在此处看到的。左侧图片,客户可以很轻松地进入URL,只需上传各种图像以及他们想要查看的感兴趣区域。然后在右侧推理步骤后,您可以通过不同的输入和输出图像轻弹并覆盖地面真相,以便他们可以了解结果的意义,以及他们对他们的满意和他们的感受。不满意。
好的。因此,就后续步骤而言,这非常像初始工作。所以要完成很多未来的工作,假设我们可以在内部获得良好的资金。所以我们要做的一些步骤是参数调整。
我们将开始查看从我们目前的培训数据的数量增加,这是1000。我们也将添加更多课程。所以我们有一个设施类,一个城市课程,我们也希望添加到数据中。你可以看到那里右上角的设施类的一个例子。
该应用程序也是很快 - 它只花了两天时间来制作那个网络应用程序。因此,在那里咨询Mathworks咨询的实际力量是合作的真正力量。我们希望将进一步的功能添加到该Web应用程序中,并究竟提供客户想要的内容。
对于这个特殊的例子,由于表现已经和人们非常兴奋,有一点担心如何影响现有的工作流程。这包括人们在做这项工作的人。所以这段时间在我们围绕我们试图拥有双重集成策略,在那里我们都提供了技术,同时也可以提高工作人员,以便他们更加了解工作流程,了解技术更多,然后也许也许是新的想法和更好的工作方式我们可以提出。我们的一些中东单位显然,对这项技术非常感兴趣。但我们也从一些东南亚企业单位上获得了兴趣。
好的,那么这对于未来意味着什么呢?在Shell中,所有的都是关于了解宏伟的宏伟计划,然后你如何适应宏伟计划。在我们的案例中,我们有这些数字主题。
所以我们现在要确保我们内部推广的方式与这些数字主题相一致,我们已经确定了其中三个。利用云计算、MDCS的高性能计算,然后是高级分析。例如,基于智能应用程序的技术。
就2018年的即时优先事项而言,我们希望继续部署MPS和MDC。而且现在我们已经证明了一些这些解决方案的技术方面,但我们现在需要看证明业务价值方面。金宝搏官方网站所以,正如我所说,我们将介绍地形识别的进一步进展,标签识别。
但是,不幸的是,我今天无法谈论的东西也在地震领域。所以我们目前正在寻求非常陡峭的学习技术来尝试和地震数据,因此只是通过简单的卷积来支付地下的地震数据的图像,通过简单的卷积来支付碳氢化合物分布,碳氢化合物属性分布。因此,这是我们公司中少数人的令人兴奋的区域也在看。
好的。这就是我要说的。我希望这是一个有趣的谈话。谢谢你!
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。