开始使用机器学习|介绍机器学习,第4部分
从系列:介绍机器学习
一步一步走过一个机器学习的工作流,并获得洞察几个关键决策点。
视频展示了如何使用机器学习来开发一个手机并应用程序。它首先导入和探索数据。然后讨论了数据预处理和特征工程,将原始数据转化为机器学习算法可以使用的信息。视频穿过机器学习模型,如决策树和模型评估工具,如混淆矩阵。然后显示了如何改进和验证模型,所以你可以找到最好的移动电话,并开始跟踪模型。
机器学习,很少有一条直线从开始到完成了工作你会发现自己在不同的思想和方法。
今天,我们将介绍机器学习工作流程一步一步,我们会关注一些关键的决策点。
每一个机器学习工作流程始于三个问题:
- 你使用什么类型的数据?
- 你想从什么见解呢?
- 如何将这些见解是应用在哪里?
在这个视频的例子是基于手机并应用。传感器数据的输入由来自手机的加速度计和陀螺仪。
响应活动performed-walking,站立、跑步、爬楼梯,或者躺着。我们想使用传感器数据来训练分类模型来识别这些活动。
现在,让我们通过工作流的每个部分来了解如何得到我们健身应用程序工作。
我们将从传感器数据的电话。
平面文件格式文本或CSV等容易处理,使导入数据简单。
现在我们所有的数据导入MATLAB和情节每个标签将领略到的是什么数据。
预处理数据,我们寻找丢失数据或离群值。在这种情况下,我们也会看看使用信号处理技术去除低频重力影响。将有助于算法关注主体的运动,没有电话的方向。
最后,我们把数据分成两组。我们保存的一部分数据进行测试和使用其他构建模型。
特性工程是一个机器学习的最重要的部分。原始数据转化为信息,可以使用机器学习算法。
活动的追踪,我们要提取功能,捕获频率加速度计数据的内容。
这些特性将有助于算法区分走路(低频)和跑步(高频)。
我们创建一个新表,包括所选功能。
功能,你可以得到的数量只受限于你的想象力。然而,有很多技术通常用于不同类型的数据。
现在是时候来构建和训练模式。
这是一个好主意从简单的内容开始像一个基本的决策树。这将跑得快,很容易解释。
看看它执行,我们看看混淆矩阵,一个表比较了分类的模型与实际的类标签。
混淆矩阵表明,我们的模型是难以区分跳舞和跑步。
也许一个决策树不适合这种类型的数据。我们会尝试别的东西。
让我们试一试多类支持向量机(SVM)。金宝app
通过这种方法,我们现在得到99%的准确性,这是一个巨大的进步。
我们实现了我们的目标和尝试不同的算法通过迭代模型,然而很少这简单。
如果我们的分类器仍然不能准确区分跳舞和跑步,我们寻求其他方式来改进模型。
改进模型可以把两个不同的方向:使模型简单,避免过学习的原因,或添加复杂性为了提高准确性。
一个好的模型只包括最预测能力的特性,为了简化模型,我们首先应该试着减少特征的数量。
有时候,我们看减少模型本身的方法。我们可以通过修剪树枝从决策树或删除从一个学习者
如果我们的模型仍然不能区分跑步和跳舞,这可能是由于竿子。因此,调整我们的模型,我们可以添加额外的功能。
在我们的示例中,陀螺仪在活动记录手机的方向。
这些数据可能会提供独特的签名不同的活动。
例如,可能有一个独一无二的结合加速度和旋转运行。
现在我们已经调整了我们的模型,我们可以验证其性能对我们预留的测试数据预处理。如果模型可以可靠地分类活动,我们准备把它转移到手机,开始跟踪。
所以,结束我们的机器学习的例子,我们对机器学习的概述视频系列。有关更多信息,请查看下面的链接。
在我们的下一个系列中,我们将看看一些有关机器学习高级的主题,比如功能工程和hyperparameter调优。
相关产品下载188bet金宝搏
你也可以从下面的列表中选择一个网站
表现最好的网站怎么走吗
选择中国网站(中文或英文)最佳站点的性能。其他MathWorks国家网站不优化的访问你的位置。
欧洲