筛选多源数据安全的电池材料与机器学习

通过奥斯汀d Sendek,斯坦福大学


RoboSimian 6月14日,2016年,一种生活的机器人由喷气推进实验室的研究人员从灾区救援的人,在实验室和起火爆炸。第二年,一个主要手机制造商发布了一个新的平板电脑后报告的全球召回火灾和爆炸。从那时起,已经有众多的类似事件。在每种情况下,锂离子电池被认为是问题的根源。

这些电池的问题是他们的液体电解质,倾向于蒸发或着火如果电池驱动的设备不能足够迅速地冷静下来。研究人员正在寻找固态电解质材料具有良好的离子电导率和电化学稳定性来取代这些有潜在危险的液体电解质,但搜索进程。它可以花费数周时间来评估一个候选人材料通过实验或仿真,并有超过12000 lithium-containing水晶固体材料项目数据库,可以更有前途的候选人而不是数千或数百万的材料没有编号。

使用机器学习模型在MATLAB开发的®,我和我的同事发现在大海针:少数特殊固体电解质的超过12000,我们分析。训练一组已知良好的电解质和原子的结构,我们的MATLAB模型似乎是三倍更有可能比随机猜测识别有前途的新材料,和两倍斯坦福研究生在地里干活。

锂离子电池基础知识:液体电解质的问题

在锂离子电池中,锂离子迁移通过电解质电池充电和放电。因为水与锂反应,电池制造商使用有机溶剂而不是水性溶剂的电解液。这是问题的由来:与水、有机液体,如汽油、头发喷雾,指甲油清洗剂通常易燃和不稳定。

除了安全问题,液体电解质至少有两个缺点。首先,使用它们来创建高电压电池是困难的,因为他们倾向于打破他们穿越电压驱动的增长。其次,他们没有阻止这种现象称为树突增长,电池早期死亡的主要原因。总之,这些缺点为找到合适的固态电解质提供令人信服的动机。

组装来自多个数据源的数据

埃文·里德教授的监督下,我们开始通过聚合数据从三个来源:材料工程数据库,发表论文,和无机晶体结构数据库(听障),通过实验验证的原子论的结构的一个在线数据库。

首先,我们确定了所有12831 lithium-containing固体材料项目数据库。我们排除了超过92%的初始设置后筛查结构稳定性,化学稳定性和较低的电子导电性。此外,我们编译信息在地球上丰富的材料和他们的预计成本。这个初始筛选离开美国超过300稳定候选人材料可能有前途的固态电解质材料要是锂电导率是不够快。为此,我们求助于机器学习。[1]

我们开始通过科学文献梳理发现40固体晶体材料研究者的晶体结构特征和测量在室温下的离子电导率。大约三分之一的这些40材料有足够的电池电解质离子电导率是有用,尽管这些材料都有稳定性的问题,防止他们采用固态电池。这种混合40快和慢lithium-conducting材料将作为训练集机器学习算法来快速预测锂新材料的导电行为。

然后我们下载了原子的结构从“这些40材料。通过这些数据,我们计算20特性描述当地的原子安排和化学的基于位置,晶体质量,电负性以及原子半径的原子结构。这些计算都是在MATLAB中执行。20的特性,我们选择包括原子论的指标如每原子体积,锂离子性,锂的邻居,和最小anion-anion分离距离。我们相信这些20特性可能与离子电导率,在我们的直觉或基于之前文献中报道。我们发现这样的“智能”功能的使用,功能基于现有知识的材料物理学基本应用机器学习时这么小的数据集。

选择一个机器学习模型

这些20的下一个问题是:组合功能最好的预测训练数据吗?鉴于我们相对较小的训练集40材料和20的特性,和易用性和灵活性在MATLAB提供的建模,我们可以考虑超过10000000种可能的组合的特性和模型。

统计和机器学习工具箱™便于探索这些众多的模型,包括最小二乘回归、稳健回归,局部加权最小二乘支持向量机,逻辑回归和多类分类。我们为每个机器学习算法训练模型我们想测试,然后对我们的训练数据验证了算法的准确性。

没有模型训练与原子的特性仅为离子电导性提供了足够的预测能力,但multifeature模型。最终,我们确定了一个最佳的逻辑回归模型的五个特性,是能够对训练集进行分类材料10%旨在错误。这对我们是有意义的,因为逻辑回归分类器往往与我们这样的小训练集表现良好。这个逻辑回归分类器将一个二进制预测:这种材料表现出足够的锂电导率是有用的作为一个固态电解质材料,或不呢?我们的训练模型准确预测10次中有9次。

然后我们把这种训练模式松散在我们300 +剩余候选材料(图1)。

图1所示。候选人确定的机器学习模型。

分类器使我们消除这些候选材料的93.3%,只留下21例潜在候选人从原来的12831人。一旦模型训练,这个筛选步骤只秒才能完成。总之,我们排除了99.8%的候选人材料通过我们的筛选过程。

结果和下一步

要测试的有效性的预测,我们模拟锂传导在这些材料使用准确但缓慢的量子物理模拟。[2]到目前为止,我们发现当我们遵循的建议基于机器学习模型,我们发现新的锂离子导电材料的三倍,如果我们使用简单的试验和错误。我们甚至和人类直觉测试模型,给予相同的一组随机画的材料模型和一群斯坦福大学材料科学博士学位学生。该模型准确的两倍的学生识别好的锂导体时学生们预测在不到1000。

一些候选人的材料被我们的模型完全出乎我们的意料。这些材料的原子论的结构非常复杂,我们没有科学的直觉来帮助我们确定材料是否有足够的离子电导率。原来他们的行为时,模型预测,它帮助验证我们的直觉。我们现在可以把所学融入我们的未来版本MATLAB机器学习模型,我们预计将提高实验数据报告。我们发现材料太激动人心了,我们申请了专利,立即发现了一个感兴趣的企业合作伙伴授权专利和继续研究的材料。

我们继续执行这些考试,在斯坦福大学和与外部团体合作,正在进行的研究对个人候选材料。在不久的将来,这些候选材料之一可能是固体电解质取代液体电解质的锂离子电池,使电池爆炸过去的事了。

斯坦福大学是全世界近1000所大学之一,为MATLAB和Simulink提供校园范围内的访问。金宝app总学术员工(发)许可证、研究人员、教师、和学生访问的常见配置产品,在最新版本级别上,用在教室里,在家里,在实验室里,或在该领域。下载188bet金宝搏

关于作者

奥斯汀d阶数是一个博士生的斯坦福大学应用物理与埃文教授材料科学与工程系的芦苇。他的研究兴趣包括新的计算方法的开发和部署,从机器学习和人工智能基于概念,加快材料储能应用程序的设计。

2018年出版的

引用

  1. 阶数,公元et al。”结构整体计算的超过12000名候选人筛选固体锂离子导体材料。”能源环境。科学。(2016)。doi: 10.1039 / C6EE02697D。https://pubs.rsc.org/en/content/articlehtml/2017/ee/c6ee02697d

  2. 阶数,公元et al。”机learning-assisted发现许多新的固体锂离子电解液材料。”arXiv: 1808.02470(2018)。https://arxiv.org/abs/1808.02470

为相关行业观点文章