什么是机器学习?

你需要知道的3件事

机器学习是一种数据分析技术,教授计算机对人类和动物自然做的事情:从经验中学习。机器学习算法使用计算方法直接从数据“学习”信息,而不依赖于预定的方程作为模型。随着用于学习增加的样本的数量,该算法自适应地提高了它们的性能。深度学习是机器学习的一种特殊形式。

为什么机器学习很重要

随着崛起的大数据,机器学习已成为解决领域问题的关键技术,例如:

  • 计算融资, 为了信用评分算法交易
  • 图像处理和计算机视觉,用于人脸识别,运动检测和对象检测
  • 计算生物学,用于肿瘤检测,药物发现和DNA测序
  • 能源生产价格和价格负载预测
  • 汽车,航空航天和制造业, 为了预测维护
  • 自然语言处理,用于语音识别应用程序
通过Loren Shure在此概述中完成三种机器学习(聚类,分类和回归)。

更多数据,更多问题,更好的答案

机器学习算法在数据中找到了生成洞察力的自然模式,并帮助您做出更好的决策和预测。它们每天都使用,以在医学诊断,股票交易,能量负荷预测等中做出关键决策。例如,媒体网站依赖机器学习筛选数百万选项以提供歌曲或电影建议。零售商使用它来深入了解客户的购买行为。

你什么时候应该使用机器学习?

考虑使用机器学习,当您有一个复杂的任务或涉及大量数据和大量变量的问题,但没有现有公式或等式。例如,如果您需要处理这样的情况,机器学习是一个很好的选择:

手写规则和方程太复杂 - 如面部识别和语音识别。

任务的规则不断变化 - 从交易记录中的欺诈检测中。

数据的性质不断变化,程序需要适应自动交易,能源需求预测和预测购物趋势。

机器学习如何运作

机器学习使用两种技术:监督学习,它在已知的输入和输出数据上培训模型,以便它可以预测未来的输出和无人监督的学习,它在输入数据中找到隐藏的模式或内在结构。

图1.机器学习技术包括无监督和监督的学习。

监督学习

监督机器学习构建一个基于不确定性存在的证据的模型。监督学习算法采用已知的输入数据集和已知对数据(输出)的响应,并列举模型以产生对新数据的响应的合理预测。如果您已经尝试预测的输出数据,请使用监督学习。

监督学习使用分类和回归技术来发展机器学习模型

分类技术预测离散的响应 - 例如,电子邮件是否是真实的或垃圾邮件,或肿瘤是癌症还是良性。分类模型将输入数据分类为类别。典型应用包括医学成像,语音识别和信用评分。

如果您的数据可以被标记、分类或分成特定的组或类,请使用分类。例如,手写识别的应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中,无监督的模式识别技术用于对象检测和图像分割。

用于执行分类的常见算法包括金宝app支持向量机(SVM)提升袋装决策树K.-最近的邻居天真贝父判别分析物流回归, 和神经网络

回归技巧预测连续响应 - 例如,电力需求中的温度或波动变化。典型应用包括电力负荷预测和算法交易。

如果您正在处理一个数据范围,或者您的响应性质是一个实数,如温度或某件设备故障前的时间,请使用回归技术。

常见的回归算法包括线性模型非线性模型正则化逐步回归提升袋装决策树神经网络, 和适应性神经模糊学习

使用监督学习预测心脏病发作

假设临床医生希望预测某人在一年内会有心脏病发作。他们有关于先前患者的数据,包括年龄,体重,高度和血压。他们知道前一名患者在一年内是否有心脏病发作。因此,问题是将现有数据组合成一个模型,该模型可以预测新人是否会在一年内进行心脏病发作。

无人监督的学习

无人监督的学习在数据中查找隐藏的模式或内在结构。它用于从包含输入数据组成的数据集的推广,而没有标记的响应。

聚类是最常见的无监督学习技术。它用于探索数据分析,以查找数据中的隐藏模式或分组。应用程序聚类分析包括基因序列分析,市场研究和对象识别。

例如,如果手机公司希望优化它们构建手机塔的位置,他们可以使用机器学习来估计依靠塔楼的人群的数量。手机只能一次与一座塔通话,所以团队使用聚类算法来设计细胞塔的最佳放置,以优化客户的信号接收或客户的群体。

用于执行群集的常见算法包括K-means和K-meyoids分层群集高斯混合模型隐藏的马尔可夫模型自组织地图,模糊C-MEARE集群, 和减数集群

图2.群集在数据中查找隐藏模式。

如何确定要使用哪种机器学习算法?

选择正确的算法似乎压倒 - 有几十个监督和无监督的机器学习算法,每个都采取了不同的学习方法。

没有最好的方法或一个尺寸适合所有。找到正确的算法部分只是试验和错误 - 甚至高度经验丰富的数据科学家无法判断算法是否会在不尝试的情况下工作。但算法选择也取决于您正在使用的数据的大小和类型,您想要从数据中获取的洞察力以及将如何使用这些洞察力。

图3.机器学习技术。

以下是在监督和无监督机器学习之间选择的一些指导方针:

  • 选择监督学习如果您需要培训模型来制作预测 - 例如,连续变量的未来值,例如温度或股票价格,或分类 - 例如,从网络摄像头视频镜头识别汽车的制作。
  • 选择无人监督的学习如果您需要探索数据并希望培训模型以找到良好的内部表示,例如将数据拆分为集群。

用matlab学习

如何利用机器学习的力量来利用数据来做出更好的决定?Matlab让机器学习轻松。使用工具和功能来处理大数据,以及使机器学习可访问的应用程序,Matlab是一种理想的环境,用于将机器学习应用于数据分析。

有了MATLAB,工程师和数据科学家可以立即访问预先构建的函数、广泛的工具箱和专门的应用程序分类回归, 和聚类

MATLAB可以让您:

  • 使用已建立的手动和自动化方法从信号和图像中提取特征,并自动选择功能使模型更加紧凑
  • 比较逻辑回归,分类树,支持向量机,集合方法等方法金宝app深度学习
  • 申请自动化和其他模型细化和减少技术创建优化模型
  • 将机器学习模型集成到企业系统,集群和云中,并将模型与实时嵌入式硬件集成到实时嵌入式硬件。
  • 执行嵌入式传感器分析的自动代码生成。
  • 金宝app支持从数据分析到部署的集成工作流程。
  • 通过应用各种优化特征特征工程技术

有趣的机器学习应用

创建可以分析艺术品的算法

Rutgers大学的艺术和人工智能实验室的研究人员希望看到一种计算机算法是否可以像人类那样容易地将绘画分类。他们开始识别用于分类绘画风格的可视特征。它们开发的算法将数据库中的绘画方式分类为60%的精度,优于典型的非专业人类。

研究人员假设可用于样式分类(监督学习问题)的视觉特征也可用于确定艺术影响(无监督的问题)。

他们使用在Google图像上培训的分类算法来识别特定对象。他们从66个不同的艺术家在550年来工作的超过1,700张绘画上测试了算法。该算法容易识别连接的工作,包括Diego Velazquez的“Pope Innocent X”在Francis Bacon的“Pope Innocent X的肖像之后”的影响。

优化大型建筑物中的HVAC能源用途

办公楼,医院和其他大型商业建筑中的加热,通风和空调(HVAC)系统通常效率低下,因为它们没有考虑改变的天气模式,可变能源成本或建筑物的热性能。

Basificiq的基于云的软件平台解决了这个问题。该平台使用先进的算法和机器学习方法来连续地处理来自电力计,温度计和HVAC压力传感器以及天气和能源成本的千兆字节。特别地,机器学习用于分段数据并确定气体,电动,蒸汽和太阳能的相对贡献以及加热和冷却过程。建筑平台在正常运行期间将大型商业建筑的HVAC能耗降低10-25%。

检测低速车祸

RAC以超过800万次成员,是英国最大的驾驶组织之一,为私人和商业驾驶者提供路边援助,保险和其他服务。

为了使路边事件的快速响应,减少崩溃和缓解保险费,RAC开发了一个船上碰撞传感系统,它使用先进的机器学习算法来检测低速冲突,并将这些事件区分离出更常见的驾驶事件(例如驾驶)加速凸起或坑洼。独立测试显示RAR系统在检测测试崩溃中准确为92%。

了解有关机器学习的更多信息

在本网络研讨会中,您将学习如何开始使用机器学习工具来检测模式并从数据集构建预测模型。在本次会话中,您将了解Matlab中的几种机器学习技术以及如何
了解如何使用MATLAB应用,评估,微调和部署机器学习技术。
开始机器学习。学习从基本概念到高级算法的机器学习。下载电子书以了解更多信息。
分类学习者应用程序允许您使用监督机器学习培训模型以对数据进行分类。
了解如何使用选择模型,应用正则化技术,并在MATLAB中执行交叉验证。