机器学习是一种数据分析技术,它教会计算机做人类和动物天生具备的事情:从经验中学习。机器学习算法使用计算方法直接从数据中“学习”信息,而不依赖于预先确定的方程作为模型。随着可供学习的样本数量的增加,算法自适应地提高了它们的性能。深度学习是一种专业的机器学习形式。
机器学习算法在数据中找到了生成洞察力的自然模式,并帮助您做出更好的决策和预测。它们每天都使用,以在医学诊断,股票交易,能量负荷预测等中做出关键决策。例如,媒体网站依赖机器学习筛选数百万选项以提供歌曲或电影建议。零售商使用它来深入了解客户的购买行为。
考虑使用机器学习,当您有一个复杂的任务或涉及大量数据和大量变量的问题,但没有现有公式或等式。例如,如果您需要处理这样的情况,机器学习是一个很好的选择:
手写规则和方程太复杂 - 如面部识别和语音识别。
任务的规则不断变化 - 从交易记录中的欺诈检测中。
数据的性质一直在变化,而程序需要适应——就像自动交易、能源需求预测和预测购物趋势一样。
机器学习使用两种技术:监督学习,它在已知的输入和输出数据上培训模型,以便它可以预测未来的输出和无人监督的学习,它在输入数据中找到隐藏的模式或内在结构。
监督机器学习构建一个基于不确定性存在的证据的模型。监督学习算法采用已知的输入数据集和已知对数据(输出)的响应,并列举模型以产生对新数据的响应的合理预测。如果您已经尝试预测的输出数据,请使用监督学习。
监督学习使用分类和回归技术来发展机器学习模型。
分类技术预测离散的响应——例如,电子邮件是真实的还是垃圾邮件,肿瘤是癌变的还是良性的。分类模型将输入数据分类。典型的应用包括医学成像、语音识别和信用评分。
如果可以将数据标记,分类或分成特定组或类,请使用分类。例如,用于手写识别的应用程序使用分类来识别字母和数字。在图像处理和计算机视觉中,无监督的模式识别技术用于对象检测和图像分割。
用于执行分类的常见算法包括金宝app支持向量机(SVM)那提升和袋装决策树那K.最近的邻居那天真贝父那判别分析那物流回归,神经网络。
回归技术预测连续响应——例如,温度的变化或电力需求的波动。典型的应用包括电力负荷预测和算法交易。
如果您使用数据范围或响应的性质是实际数字,请使用回归技术,例如温度或直到设备的失效。
假设临床医生想要预测一个人在一年内是否会心脏病发作。他们有以前病人的数据,包括年龄、体重、身高和血压。他们知道以前的病人在一年内是否有心脏病发作。因此,问题在于将现有数据整合到一个模型中,从而预测一个新人在一年内是否会心脏病发作。
无监督学习在数据中查找隐藏的模式或内在结构。它用于从包含输入数据组成的数据集的推广,而没有标记的响应。
聚类是最常见的无监督学习技术。它用于探索数据分析,以查找数据中的隐藏模式或分组。应用程序聚类分析包括基因序列分析,市场研究和对象识别。
例如,如果手机公司希望优化它们构建手机塔的位置,他们可以使用机器学习来估计依靠塔楼的人群的数量。手机只能一次与一座塔通话,所以团队使用聚类算法来设计细胞塔的最佳放置,以优化客户的信号接收或客户的群体。
用于执行群集的常见算法包括K-means和K-meyoids那分层群集那高斯混合模型那隐马尔可夫模型那自组织地图,模糊C-MEARE集群,减法聚类。
选择正确的算法似乎是不可避免的——有数十种有监督和无监督的机器学习算法,每一种都采用不同的学习方法。
没有最好的方法或一个尺寸适合所有。找到正确的算法部分只是试验和错误 - 甚至高度经验丰富的数据科学家无法判断算法是否会在不尝试的情况下工作。但算法选择也取决于您正在使用的数据的大小和类型,您想要从数据中获取的洞察力以及将如何使用这些洞察力。
以下是一些关于在有监督和无监督机器学习之间选择的指导原则:
Rutgers大学的艺术和人工智能实验室的研究人员希望看到一种计算机算法是否可以像人类那样容易地将绘画分类。他们开始识别用于分类绘画风格的可视特征。它们开发的算法将数据库中的绘画方式分类为60%的精度,优于典型的非专业人类。
研究人员假设,对风格分类(有监督学习问题)有用的视觉特征也可以用来确定艺术影响(无监督问题)。
他们使用在Google图像上培训的分类算法来识别特定对象。他们从66个不同的艺术家在550年来工作的超过1,700张绘画上测试了算法。该算法容易识别连接的工作,包括Diego Velazquez的“Pope Innocent X”在Francis Bacon的“Pope Innocent X的肖像之后”的影响。
办公楼,医院和其他大型商业建筑中的加热,通风和空调(HVAC)系统通常效率低下,因为它们没有考虑改变的天气模式,可变能源成本或建筑物的热性能。
BuildingIQ基于云的软件平台解决了这个问题。该平台使用先进的算法和机器学习方法,连续处理来自电能表、温度计、暖通空调压力传感器以及天气和能源成本的千兆字节的信息。特别是,机器学习被用来分割数据,并确定燃气、电力、蒸汽和太阳能对加热和冷却过程的相对贡献。BuildingIQ平台使大型商业建筑正常运行时的HVAC能耗降低10-25%。
英国皇家汽车联盟拥有800多万会员,是英国最大的汽车组织之一,为私人和商务司机提供道路援助、保险和其他服务。
为了使路边事件的快速响应,减少崩溃和缓解保险费,RAC开发了一个船上碰撞传感系统,它使用先进的机器学习算法来检测低速冲突,并将这些事件区分离出更常见的驾驶事件(例如驾驶)加速凸起或坑洼。独立测试显示RAR系统在检测测试崩溃中准确为92%。