詹姆斯马丁,贝壳国际
Amjad Chaudry,Shell International
机器学习和深度学习可用于自动化一系列任务。壳牌和先进的分析卓越中心(Aacoe)正在使用这些技术来加速过程,同时提高其可靠性。在地理学中,可以使用标记卫星图像的丰富训练数据集来改进地形分类。大(全景)植物图像中的自动标签检测也会导致更有效的维护。
James和Amjad将展示Matlab的方式®使用这些技术轻松。使用最小的设置,Matlab Parallel Server™允许团队在云中的多个远程GPU上培训网络。Matlab Production Server™允许团队创建薄型Web客户端,该客户端可以使用现场运营商,具有最小的物理硬件,如智能手机。
Shell利用所有这些技术和工具,以便其工程师可以轻松而无痛地使用最新的调查结果。
记录:2018年10月3日
在过去的四年左右的壳中,高级分析在我们做事的方式上发挥着越来越重要的作用。然而,今天,我想特别谈论深度学习,以及在Matlab中的方式,我们如何利用一些深入学习工具来改善我们的创新管道。有趣的是,Rick的主题演讲提到提到转移学习和语义细分。这正是一些例子,我今天会与你交谈。
当然,作为壳牌,我们总是必须提出警示。所以我会把它留下五秒钟,左右,那些想要阅读的人。好。
所以今天,我要如下构造我的谈话。我将简要介绍一下我们所包围的外壳和服务和产品的范围。下载188bet金宝搏我还将谈论我们的创新和交付管道,我们如何尝试如何创新思想,特别是在先进的分析中,到最终产品被正确维护。下载188bet金宝搏然后Matlab符合这一点。
然后我会谈论两个用例。正如我所提到的那样,在工业图像中的标签识别中的第一个,然后在超光谱卫星图像中的地形识别。听起来很酷,所以我把它放在那里。然后最后的下一步,我们从那里开始,结果我们所拥有的结果。
好的。所以这是我们摘要幻灯片的最新化身。所以我们是一家非常广泛的公司。我们从我的初步加入到公司的初步加入,这是在上游勘探,试图识别碳氢化合物存款。然后通过开发我们尝试钻取井来提取那些,然后通过我们尝试处理和改进产品的更多下游活动,通过运输和交易,我们将这些产品送到各种最终用户,可以下载188bet金宝搏包括零售前院,航空和润滑油。
如果我们重新保证信息,我们可以突出显示分析在组织内的那一刻的价值。而且 - 哦,这就是它 - 我真的要注意的是各种颜色的所有圆圈。因此,这些是积极的区域,分析在我们组织中发挥着主导作用。我们可能最终有很大的变化,对当前的工作流和工作方式产生了相当大的影响。蓝色的两个圆圈是我将进一步探索一下。
所以这是我们的黄色创新漏斗。我们有一系列横跨顶部的决策门,D0到D4。基本上我们试图从左边的左右取得的想法和概念。
在底部你可以看到两个重叠的三角形我们有一个重叠的地方——我们从一个数字化团队,也就是我现在坐的地方,一直到它。所以
我们尝试和做的是在范围和创新阶段,我们参与其中。我们生产POC概念,最低可行的产品,尝试证明价值。下载188bet金宝搏然后逐渐被带入,我们尝试和扫描完全部署解决方案以及维护策略,因此我们可以充分为业务提供价值。金宝搏官方网站
另一件事我要注意的是所有的点。所以它 - 想到它几乎就像左侧组织中的思想数量的正常指示。而且我想强调的是,每个决策门都有一个大的流失,所以它是关于确保你在组织内完全的范围。然后,当您到达最后,我们将您的资源集中在最高价值的解决方案上。金宝搏官方网站
Matlab在哪里增加价值?这是非常快的原型。我们与Mathworks Consulting有一项积极的协议,我们利用了提高生产力。
我们希望在Matlab内维护有一系列大量的示例。由于MathWorks融入了一些深入学习技术的巨大焦点,因此,在去年,我们能够利用该空间中的一些最新发展,同时也能够访问这个有利的积压模块。我们真的喜欢Web应用程序交付,所以我们绕过了很多关于安装Matlab版本的问题,以获得我们的一些软件运行。
所以在这里,我们有两个我们生产的Web应用程序的示例。就在右上角是沥青测试的Web应用程序。在左下方,您还可以看到稍后会看到我讨论的潜行预览,这是一个作为Web应用程序的地形分类。
我们还通过MDC进行了一点,因此Matlab分布式计算服务器。因此,允许我们利用云上的相当强大的GPU。我们主要使用它来培训我们的一些深入学习模式。
因此,在今年,我们在壳牌和matlab之间拥有了很少的里程碑。我们现在终于过去了 - 因为贝壳有时有一些管理员,那么获得不同部分业务的许可证是很难的。所以现在我们有一个企业范围的交易。因此,这意味着任何聪明的人,无论他们从中来自组织,都可以在理论上迅速获得Matlab的效率。
我们有第二个MPS许可证。正如我所说,我认为,MDC将成为一个越来越重要的功能。我们正在寻求更多地与我们的策略一起融为一体。
正如我所说,Mathworks Consulting一直非常富有成效的时间。然后我们现在也希望利用我们在班加罗尔的一些资源来尝试,并允许我们进入时钟周围的项目。
好的。所以这是第一个例子。这是标签识别。所以你在背景中看到的是一块工业设备。我认为这是一个泵。
但是在下面,我想引起你的注意,是标签,那个标签。在该标签上有一个SAP代码。我们有这些图像都点缀 - 他们都是地理标记 - 所有人都在工业环境中点缀。我们想要做的是提取标签,DO OCR上,然后链接到我们的SAP系统,因为我们可以从SAP系统中提取大量元数据。
因此,我们采取的初始方法是使用区域卷积神经网络的R-CNN。所以我们拍摄图像。然后,由于图像非常大,我们需要从图像中提取第一一系列区域提案,然后将其馈入CNN适当。
在我们的例子中,我们用了,我想里克已经讲过了AlexNet的例子。所以我们使用了vgd16网络,然后我们根据我们的目的在最后三层上转移学习。一开始我们有两个类问题。我们只知道有没有标签。
这是一些图像的样子。想想几乎谷歌街景。所以在那里,你可以看到它几乎就像它被用鱼眼镜镜头拍摄了。因此,首先,我们需要对图像的图像应用失真校正,该图像是在Matlab内完成的。然后想到 - 这几乎就像你站在一个盒子里面,然后你有六个面孔望出去。
我们去掉顶部和底部的投影,保持水平的前投影。然后我们把它输入到算法的区域提取部分。在本例中,我们稍微修改了一下,并使用了一种叫做Pdollar EdgeBox的方法。但重要的是你可以看到这些区域很好地提取了可能有标签的区域。
好的。然后将进入CNN。所以现在这只是讨论了这一点。
因此,虽然培训您不需要太多的培训数据,但是,我们仍然有一些问题试图以稳定的方式为此进行足够的培训数据。所以我们将标签的定义扩展到更多标志。所以我们还包括迹象,然后对数据增强进行数据集,以便进一步增加数据,以提供足够的数据来为您提供稳定的结果。
在右侧,您可以在培训激活后查看。因此,这是在分类之前网络最初关注的地方的良好指示。因此,非常奇怪的图像正在告诉你它基本上专注于紫色修补程序。然后这是算法的输出。
因此,您可以看到内部场景,您可以看到外观场景,不同的照明条件。而你得到的是它认为是一个迹象的边界框 - 抱歉 - 什么是具有相关概率的迹象和标签。
对于敏锐的眼睛,你可能会注意到那里有很多误报。我们想要做的是实际上带出了所有可能的选择,然后我们依靠OCR,以筛选出很多那些误报。
好的。所以我刚刚显示你的转移学习用于识别工业图像中的标签,然后将OCR运行在顶部以提取SAP代码。在运行时,只是为了给你一个想法,它是每张图片的三到四分钟。现在在这个特殊用例中,我们可以用它来管理,没关系,但显然如果你想要实时反馈,这不会发生。
但是,如果您想下降实时路线,有技术可以显着提高此功能的速度。因此,例如,快速的R-CNN,这应该给您提高速度大约100倍。
我们也在查看MDC上的更多GPU,大GPU,让我们增加图像的分辨率大小。接下来,我猜,很酷的是,一旦我们通过它对SAP系统连接,我们如何将那些信息带回来,说,有人在网站上散步有一些增强的现实护目镜?我们如何共同可视化这些信息?这可能是我们一些客户感兴趣的令人兴奋的区域。
因此,我们使用的数据来自欧洲工业网站,现在我们从特别是亚洲业务部门获得了很多兴趣。所以我们将继续使用这些活动。
好的。因此,下一个例子是超频卫星数据中的地形识别。因此,只需迅速描述为什么这个问题值得解决以及为什么我们打扰。
因此,在上游,在探索中,地震数据是我们在地下在地面下面看的最重要的技术之一。而且,例如,在这个未指明的中东地区在底部,你可以看到它的expanse,对吧?以及获取数据的成本,从而将能量放入地面并接收它,非常高。因此,我们每年调查每年都会谈论数百万美元。这成本很高。
而地形类型,例如,平滑还是粗糙,会影响高达50%的成本。因此,在我们的语言中,他们有一个非常理想的数据标记环境,但在他们的语言中是一个非常低效的系统。所以他们花钱请一个高度专业的,高薪的人来观察卫星图像,然后在粗糙的地形上手工绘制多边形,他们认为是粗糙的地形。
然后他们必须用现场访问来证实。所以有人必须飞到这块特定地区的沙漠,然后在一辆卡车上开车。他们需要将旗帜放下以确认这是粗糙的地形。这是在调查之前。
在我们的例子中,因为我们现在有很多训练数据,我们想,对。也许我们可以用更计算机密集型的技术来取代整个工作流程。所以我们决定尝试这种语义分割方法。
所以这是我们的数据。我们有三种类型的图像,航拍,雷达和深度表面模型,DSM图像。由于2017年的局限性,我们需要做三个频道,但在这种情况下就可以了。
现在已经改进了2018年A和B.但是我们在此决定将其分为三个渠道以使图像着色,我们这样做了如下。我们缩小了航空摄影,把它放在红色的频道,在绿色,et克朗塔河中的雷达。然后您最终可以在右侧看到这些彩色图像。用于算法。
所以segnet,它是什么?它通常用于自动驾驶汽车。所以想象一下左上角的道路场景,网络所做的是,你通过它喂它,然后它将将每个像素映射到一个类。
所以在顶部的例子中,你有,说,路面类,道路类,树级等等。所以在我们的情况下,我们想把它重新重新用它并用它来用于崎岖的地形或平滑的地形。这就是我们所做的。
我们实际上有一个30,000个示例数据设置,但我们只为此工作,使用1,000个示例。所以有很多改进的空间。我们还与顶部的图片相比,网络结构略微更简单。
所以我们决定使用三个编码器和解码器部分。就训练1000个测试例子而言,在一个4g的GPU上,那是相当小的,大约需要8个小时的训练时间。
所以这些是结果。我已经删除了 - 从颜色消失并将其分解回原始图像。所以在顶部,你可以看到,在左边,航空摄影,然后是雷达和DSM。然后在左侧的底部,您可以看到我们的案例中的人类或地面真相,然后预测的算法。
在这两种情况下,你可以看到,好的。为此选择我选择的数据的快照,即性能非常好。目前,结果的质量小而不是定量,尽管我们将在制作混淆矩阵和所有这些东西的工作中。但表现非常好。我们展示了这一点,实际上是最终客户,并且已经他们本质上认为性能优于现有的工作流程。
我们允许客户通过Web应用程序与数据进行交互,所以这就是您可以在此处看到的。左侧图片,客户可以很轻松地进入URL,只需上传各种图像以及他们想要查看的感兴趣区域。然后在右侧推理步骤后,您可以通过不同的输入和输出图像轻弹并覆盖地面真相,以便他们可以了解结果的意义,以及他们对他们的满意和他们的感受。不满意。
好的。因此,就后续步骤而言,这非常像初始工作。所以要完成很多未来的工作,假设我们可以在内部获得良好的资金。所以我们要做的一些步骤是参数调整。
我们将开始查看从我们目前的培训数据的数量增加,这是1000。我们也将添加更多课程。所以我们有一个设施类,一个城市课程,我们也希望添加到数据中。你可以看到那里右上角的设施类的一个例子。
该应用程序也是很快 - 它只花了两天时间来制作那个网络应用程序。因此,在那里咨询Mathworks咨询的实际力量是合作的真正力量。我们希望将进一步的功能添加到该Web应用程序中,并究竟提供客户想要的内容。
对于这个特殊的例子,由于表现已经和人们非常兴奋,有一点担心如何影响现有的工作流程。这包括人们在做这项工作的人。所以这段时间在我们围绕我们试图拥有双重集成策略,在那里我们都提供了技术,同时也可以提高工作人员,以便他们更加了解工作流程,了解技术更多,然后也许也许是新的想法和更好的工作方式我们可以提出。我们的一些中东单位显然,对这项技术非常感兴趣。但我们也从一些东南亚企业单位上获得了兴趣。
这对未来意味着什么呢?在壳牌,关键在于了解宏大的计划,以及如何融入宏大的计划。所以在我们的案例中,我们有这些数字主题。
所以我们现在要确保我们内部推广的方式与这些数字主题一致,我们已经确定了其中的三个主题。将一切都利用到云上,利用MDCS进行高性能计算,然后是高级分析。例如,基于智能应用程序的技术。
就2018年的即时优先事项而言,我们希望继续部署MPS和MDC。而且现在我们已经证明了一些这些解决方案的技术方面,但我们现在需要看证明业务价值方面。金宝搏官方网站所以,正如我所说,我们将介绍地形识别的进一步进展,标签识别。
但是,不幸的是,我今天无法谈论的东西也在地震领域。所以我们目前正在寻求非常陡峭的学习技术来尝试和地震数据,因此只是通过简单的卷积来支付地下的地震数据的图像,通过简单的卷积来支付碳氢化合物分布,碳氢化合物属性分布。因此,这是我们公司中少数人的令人兴奋的区域也在看。
好的。这就是我要说的。我希望这是一个有趣的演讲。谢谢你!
您还可以从以下列表中选择一个网站:
选择中国网站(以中文或英文)以获取最佳网站性能。其他MathWorks国家网站未优化您的位置。