通过机器学习的更安全电池材料的多源数据进行筛选

由斯坦福大学奥斯汀D. Sendek

2016年6月14日,Robosimian,一个由喷气推进实验室研究人员建造的猿类机器人,以拯救灾区人口,在实验室中爆炸并引起了火灾。次年,一家主要的手机制造商在发射和爆炸报告后发布了全球新型平板电脑召回。从那时起,有许多类似事件的账户。在每种情况下,锂离子电池被鉴定为根本原因。

这些电池的问题是它们的液体电解质,如果电池供电的装置不能快速冷却,则倾向于蒸发或着火。研究人员正在寻找具有良好离子电导率和电化学稳定性的固体电解质材料,以取代这些潜在的危险液体电解质,但搜索已经缓慢。通过实验或模拟评估单个候选材料可能需要数周数,材料项目数据库中有超过12,000个含锂晶体固体,这可能是有希望的候选人 - 更不用说尚未编目的数千种或以百万美元的材料。

使用Matlab开发的机器学习模型®,我的同事和我发现了大海捞针的针:少量卓越的固体电解质超过12,000,我们分析了。我们的Matlab模型培训了一套已知的良好电解质及其原子结构,似乎比随机猜测确定有前途的新材料的可能性超过三倍,而且比在该领域工作的斯坦福大学研究生的可能性更有可能。

锂离子电池基础:液体电解质的问题

在锂离子电池中,锂离子通过电解质迁移,因为电池充电并排出。因为水与锂电,电池制造商使用有机溶剂而不是电解质的水基溶剂。这是问题所进来的:与水不同,有机液体如汽油,发胶和指甲油去除剂通常是易燃和不稳定的。

除安全问题外,液体电解质还具有至少两个其他缺点。首先,使用它们以创建更高的电压电池很难,因为当电压驱动时,它们往往会崩溃随着电压而增加。其次,他们几乎没有以防止已知的现象枝晶生长是早期电池死亡的主要原因。完全采取,这些缺点提供了令人兴奋的动机,以找到合适的固态电解质。

从多个来源组装数据

在埃文雷德教授的监督下,我们开始通过三个来源聚合数据:材料项目数据库,发布论文和无机晶体结构数据库(ICSD),一个实验验证原子结构的在线数据库。

首先,我们在材料项目数据库中鉴定了所有12,831个含锂锂固体。在筛选结构稳定性,化学稳定性和低电子电导率之后,我们消除了超过92%的初始集合。此外,我们编制了关于材料的丰富的信息及其预测成本。该初始筛选使我们留有超过300种稳定的候选材料,如果只有其锂电片足够快,则可能具有良好的电解质材料。为了完成这一点,我们转向机器学习。[1]

我们开始通过科学文献梳理,找到40个实心晶体材料,其中研究人员表征了晶体结构并在室温下测量离子电导率。这些40种材料中的约三分之一具有足够的离子电导率,使得有用的电池电解质,尽管这些材料都具有防止它们在固态电池中采用的稳定性问题。这种40个快速和慢速锂导电材料的混合物将作为机器学习算法的训练设置,以便在新材料中快速预测锂传导行为。

然后我们从ICSD下载了这40个材料的原子结构。使用该数据,我们基于结构中原子的原子的位置,质量,电力,原子半径计算了20个特征,其在每个晶体中表征在每个晶体中的局部原子布置和化学。这些计算都在MATLAB中执行。我们选择的20个特征包括原子标准,例如体积每粒,锂键离子性,锂邻距的数量,以及最小的阴离子 - 阴离子分离距离。我们认为,这些20个特征可能与离子电导率相关,基于我们的直觉或在文献中的先前报告中。我们发现使用这种“智能”功能 - 即,基于预先存在的材料物理知识的功能 - 在将机器学习到这样一个小型数据集时是必不可少的。

选择机器学习模型

下一个问题是:这20个功能的组合最能预测培训数据?鉴于我们相对小的40种材料培训和仅限20个功能,以及Matlab提供的建模的轻松灵活性,我们能够考虑超过10,000,000种可能的功能和型号组合。

统计和机器学习工具箱™使这些型号很容易探索这些型号,包括最小二乘回归,强大的回归,本地加权最小二乘,SVM,逻辑回归和多字符分类。我们培训了我们想要测试的每种机器学习算法的型号,然后验证了算法的准确性对我们的培训数据。

没有用原子特征训练的模型没有提供足够的预测力,以进行离子电导率,但是多型模型确实如此。最终,我们确定了具有五个功能的最佳逻辑回归模型,该模型能够将培训集材料分类为10%交叉验证误差。这对我们来说是有道理的,因为逻辑回归分类器倾向于与我们这样的小型训练集表现良好。该逻辑回归分类器将提供二进制预测:该材料是否表现出足够的锂电锂电导率作为固体电解质材料,或者我们训练的模型精确地提出了这一预测9次。

然后,我们将此训练型模型宽松地在300多个剩余的候选材料上松动(图1)。

图1.由机器学习模型识别的候选者。

分类器使我们能够消除这些候选材料的93.3%,仅从原始12,831中留下21个潜在候选人。培训模型后,此筛选步骤只需几秒钟即可完成。总而言之,我们通过我们的筛选过程淘汰了99.8%的候选材料。

结果和下一步

为了测试预测的有效性,我们使用基于慢速的量子物理的模拟模拟这些材料中的锂传导。[2]到目前为止,我们发现,当我们遵循基于机器学习的模型的建议时,我们发现新的锂离子导电材料快三倍,而不是我们使用简单的试验和错误。我们甚至通过向模型和一群斯坦福博士提供相同的随机绘制的材料列表来测试抗人类直觉的模型。材料科学的学生。该模型的两倍是学生在识别良好的锂导体作为学生时的两倍,同时在不到千分之一的时间内进行预测。

我们模型确定的一些候选材料是完全出乎意料的。这些材料的原子结构如此复杂的是,我们没有科学直觉,帮助我们确定材料是否具有足够的离子电导率。当事实证明他们做的是,随着模型预测的,它有助于验证我们的直觉。我们现在可以将我们所学到的未来版本的产品中学到了我们预期的,因为报告了更多的实验数据,我们预期会改善。我们发现的材料之一如此令人兴奋,我们专利了,并立即找到了一个有兴趣的公司合作伙伴来许可专利并继续研究材料。

我们继续在斯坦福大学和与外部群体进行关于各个候选材料研究的外部群体进行其中一些考试。在不久的将来,这些候选材料中的一种可以证明是替代锂离子电池中的液体电解质的固体电解质,并使爆炸电池包装过去。

斯坦福大学是全球近1000所大学之一,提供对Matlab和Simulink的校园范围。金宝app随着学术总公司(TAH)许可证,研究人员,教师和学生可以在最新的释放水平上获得产品的共同配置,用于在课堂上使用,在家里,在实验室中或在现场下载188bet金宝搏。

关于作者

奥斯汀D. Sendek是一个博士学位。斯坦福大学应用物理系的候选人,与材料科学与工程系Evan Reed教授合作。他的研究兴趣包括开发和部署新的计算方法,以机器学习和人工智能的概念为基础,以加速储能应用材料的设计。

发布2018年


参考资料

  1. Sendek,A.D.等等。“整体计算结构筛选超过12,000个固体锂离子导体材料的候选物。“能量环境。SCI。(2016)。DOI:10.1039 / C6EE02697D。https://pubs.rsc.org/en/content/articlehtml/2017/ee/c6ee02697d.

  2. Sendek,A.D.等等。“机器学习辅助发现许多新的固体锂离子电解质材料。“arxiv:1808.02470(2018)。https://arxiv.org/abs/1808.02470

下载188bet金宝搏使用的产品

查看相关行业的文章