什么是机器学习?

三件事情你需要知道的

机器学习是一种数据分析技术,它教会计算机去做人类和动物天生就会做的事情:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预先确定的方程作为模型。随着可用于学习的样本数量的增加,算法自适应地提高其性能。深度学习是机器学习的一种特殊形式。

为什么机器学习事项

随着上升大数据,机器学习已成为解决地区问题,如关键技术:

在这篇Loren Shure的概述中,我们将介绍机器学习的三种类型(集群、分类和回归)。

更多的数据,更多的问题,更好的答案

机器学习算法找出产生的洞察力,帮助你做出更好的决策和预测数据的自然形态。他们每天都在使用,使医疗诊断,股票交易,能源负荷预测,更关键的决策。例如,媒体网站依靠机器学习数以百万计的选项进行筛选,以给你歌曲或电影的建议。零售商用它来深入了解客户的购买行为。

当你应该使用机器学习?

考虑使用机器学习,当你有一个复杂的任务,或涉及大量的数据和大量的变量的问题,但没有现成的公式或公式。例如,机器学习是一个不错的选择,如果你需要这样的处理情况:

手写规则和公式过于复杂,在面部识别和语音识别。

任务的规则不断变化,如从交易记录的欺诈检测。

数据的性质不断变化,程序需要适应,因为在自动交易,能源需求预测,并预测购物趋势。

如何机器学习工程

机器学习使用两种类型的技术:监督学习,这列车上已知的输入和输出数据的模型,因此它可以预测未来的输出,以及无监督学习,其发现隐藏的模式或在输入数据的固有结构。

图1.机器学习技术包括无监督和监督学习。

掌握机器学习:有步骤,分步指南与MATLAB
获取这本电子书,通过动手机器学习教程,帮助您掌握机器学习技术下载代码,并一步。

监督学习

监督机器学习建立一个模型基础上的不确定性的存在证据,使预测。受监督的学习算法将一组已知的输入数据和已知响应的数据(输出)和火车的模型来产生用于响应于新的数据合理预测。使用监督学习,如果你已经知道数据对您正在试图预测输出。

监督学习使用分类和回归技术开发预测模型。

分类技术预测离散的反应——例如,一封电子邮件是真实的还是垃圾邮件,或者肿瘤是癌症还是良性的。分类模型将输入数据分类为类别。典型的应用包括医学成像、语音识别和信用评分。

如果您的数据可以被标记、分类或划分到特定的组或类中,请使用classification。例如,手写识别应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中,无监督模式识别技术用于物体检测和图像分割。

进行分类的统一算法包括金宝app支持向量机(SVM)提振袋装决策树ķ最近的邻居朴素贝叶斯判别分析回归,神经网络

回归技术预测连续反应,例如,改变在电力需求温度或波动。典型的应用包括电力系统负荷预测算法交易。

如果您处理的是一个数据范围,或者响应的性质是一个实数,例如温度或设备故障前的时间,那么请使用回归技术。

一般回归算法包括线性模型非线性模型正则化逐步回归提振袋装决策树神经网络,自适应神经模糊学习

使用监督学习预测心脏病发作

假设临床医生想要预测某人是否会在一年内心脏病发作。他们有以前病人的数据,包括年龄、体重、身高和血压。他们知道之前的病人是否在一年内心脏病发作。所以问题是把现有的数据整合到一个模型中,这个模型可以预测一个新的人是否会在一年内心脏病发作。

无监督学习

无监督学习发现隐藏的模式或在数据固有结构。它是用来从由输入数据,而不标记响应数据集得出推论。

聚类是最常见的非监督学习技术。它用于探索性数据分析,发现数据中隐藏的模式或分组。应用程序聚类分析包括基因序列分析,市场调研,和物体识别。

例如,如果一个手机公司希望优化他们建立手机信号塔的位置,他们可以使用机器学习来估算的人依靠自己的塔楼群的数量。一个电话只能跟一个塔的时间,所以团队使用聚类算法对手机信号塔的最佳位置设计对信号接收团体,或簇,他们的客户。

进行聚类常见的算法包括:k均值和k-中心点划分分层聚类高斯混合模型隐马尔可夫模型自组织图,模糊C-均值聚类,减法聚类

图2.集群发现您的数据隐藏的模式。

如何决定使用哪种机器学习算法?

选择正确的算法似乎是压倒性的——有几十种监督的和非监督的机器学习算法,每一种都采用不同的学习方法。

没有最好的方法或一刀切。找到合适的算法部分是正义的审判和错误,甚至是经验丰富的数据科学家也说不清的算法是否会没有想出来工作。但算法选择也取决于你用,你想从数据获得洞察力的工作数据的大小和类型,以及这些见解将如何使用。

图3。机器学习技术。

下面是一些在有监督和无监督机器学习之间进行选择的指导:

  • 选择监督学习如果你需要训练的模型进行预测 - 例如,一个连续变量的未来值,如温度或股票价格,或分类,例如,从识别摄像头录像的汽车品牌。
  • 选择无监督学习如果你需要探索您的数据,并希望培养一个模型,以找到一个很好的内部表示,如数据拆分成集群。

用MATLAB进行机器学习

你怎么能利用机器学习的力量,用数据来做出更好的决策?MATLAB使得机器学习容易。随着用于处理大数据,以及应用,以提高机器学习访问工具和功能,MATLAB是将机器学习到您的数据分析的理想环境。

使用MATLAB,工程师和数据科学家可以立即访问预构建的函数、广泛的工具箱和专门的应用程序分类回归,集群

MATLAB可以让您:

  • 比较诸如逻辑回归、分类树、支持向量机、集成方法等方法金宝app深度学习
  • 应用AutoML和其他模型细化和减少技术,以创建优化的模型
  • 集成机器学习模型为企业系统,集群和云,和目标模型实时嵌入式硬件。
  • 执行嵌入式传感器分析的自动代码生成。
  • 金宝app支持从数据分析到部署的集成工作流。

有趣的机器学习应用

创建算法,可以分析艺术作品

在艺术与人工智能实验室在罗格斯大学的研究人员想看看是否一个计算机算法可以按风格,流派和艺术家一样容易作为一个人归类画。他们开始通过识别分类的绘画风格的视觉特征。该算法开发它们分类的风格绘画与60%的准确度数据库,跑赢典型的非人类专家。

研究人员假设,对风格分类有用的视觉特征(监督学习问题)也可以用来确定艺术影响(非监督问题)。

他们使用的分类算法训练在谷歌图像识别特定对象。他们测试了从66名不同的艺术家合作过550年的时间里超过1700所绘画的算法。该算法很容易识别连接的作品,其中包括维拉斯奎兹对弗朗西斯·培根的“研究之后委拉斯开兹的肖像教皇英诺森十的”,“肖像教皇英诺森十”的影响

HVAC优化能源使用的大型建筑

在办公楼,医院等大型商业建筑的采暖,通风和空调(HVAC)系统往往是低效的,因为他们没有考虑到天气变化,可变能源成本,或建筑物的热性能。

BuildingIQ基于云的软件平台解决了这个问题。该平台使用先进的算法和机器学习方法来连续处理来自电能表、温度计、HVAC压力传感器以及天气和能源成本的千兆字节的信息。特别是,机器学习被用来分割数据,并确定气体、电力、蒸汽和太阳能对加热和冷却过程的相对贡献。BuildingIQ平台使大型商业建筑的HVAC能耗在正常运行时降低了10-25%。

检测低速车祸

英国皇家汽车俱乐部拥有800多万会员,是英国最大的汽车组织之一,为私人和公司司机提供路边援助、保险和其他服务。

为了让到路边事件的快速响应,减少事故,并降低保险费用,该RAC开发的车载碰撞传感系统,它使用先进的机器学习算法来检测低速碰撞和区分比较常见的驾驶事件,如驾驶过这些事件减速带或坑洼。独立的试验表明在RAC系统在检测测试崩溃92%准确。

学习更多关于机器学习的知识

在此次网络研讨会,您将学习如何开始使用机器学习工具来检测模式和从数据集建立预测模型开始。在这次会议上,您将了解在MATLAB和几个可用的机器学习技术如何
了解如何申请,评估,微调和部署机器学习技术与MATLAB。
开始使用机器学习。从基本理念,以先进的算法学习的机器学习。下载电子书,以了解更多。
分类学习应用程序让你训练模型使用监督机器学习来分类数据。
机器学习的挑战:选择最佳分类模型,并避免过度拟合
了解如何使用选择模型,应用正则化技术,并在MATLAB进行交叉验证。