监督学习、无监督学习、半监督学习和强化学习


  想必大家都知道,在机器学习训练一个模型的过程中需要大量的数据进行喂养。根据训练的模型不同,一般有如下的几种机器学习方法:

  • 监督学习

  • 无监督学习

  • 半监督学习

  • 强化学习

  今天我们就来介绍以上的四种学习方式。

模型

在介绍四种学习方法之前,我们先来介绍一下模型。什么是模型呢?模型其实就相当于一个函数,当我们给这个函数(模型)输入特定的值事,函数就会输出一个值,这个值就是模型预测的结果。

监督学习

  监督学习,就是使用已经知道答案的数据或者是已经给定标签的数据给机器进行学习的一个过程,通俗的讲,监督学习就相当于我们高中做练习题的时候,当我们做完一道题之后,可以翻看已经存在的答案,然后通过答案来进行学习和调整,达到一个举一反三的效果。通过这样的学习,在下次出现类似的题目的时候,我们就可以通过已有的经验进行解答。

  例如你想训练一个可以在照片中识别出你父亲的模型。那么,你需要将你所有的照片看一遍,记录下来哪些照片上有你的父母。然后把照片分为两组。第一组叫做训练集,用来训练神经网络。第二组叫做验证集,用来检验训练好的神经网络能否认出你的父母,正确率有多少。然后反复的去调整模型,直到得到最优模型为止。

  监督学习主要应用于预测等场景。当然,在机器学习中,监督学习也包含很多算法,例如决策树、高斯朴素贝叶斯以及KNN等算法,不同的算法适应不同的场景,当然,每个算法也有其优缺点,所以在机器学习的训练中,不同的场景会选择不同的算法。


无监督学习

  无监督学习,使用的数据是没有标记过的,即不知道输入数据对应的输出结果是什么。无监督学习只能默默的读取数据,自己寻找数据的模型和规律。就相当于你在学习的过程中遇到的事情是没有答案的,只能你自己从中摸索,然后对其进行分类判断等。在实际生活中,训练模型使用监督学习比较多,而无监督学习更多是使用在对数据进行分类之上。

  例如你要生产T恤,却不知道 XS、S、M、L 和 XL 的尺寸到底应该设计多大。你可以根据人们的体测数据,用聚类算法把人们分到不同的组,从而决定尺码的大小。


半监督学习

  半监督学习,也就是训练中使用的数据,只有一小部分是标记过的,而大部分是没有标记的。因此和监督学习相比,半监督学习的成本较低,但是又能达到较高的准确度。相当于我们从少量的有答案的数据里训练,然后根据学习经验对剩下的数据进行标记分类等。

  在实际中,半监督学习使用的频率也是挺高的。毕竟,很多时候我们缺的不是数据,缺的是带标签的数据,而人为的给数据打标签也是很费时费力的。

强化学习

  强化学习也是使用未标记的数据,但是可以通过某种方法知道你是离正确答案越来越近还是越来越远(即奖惩函数),强调的是如何基于环境而行动以取得最大化的收益。传统的“冷热游戏”很生动的解释了这个概念。你的朋友会事先藏好一个东西,当你离这个东西越来越近的时候,你朋友就说热,越来越远的时候,你朋友会说冷。冷或者热就是一个奖惩函数。半监督学习算法就是最大化奖惩函数。可以把奖惩函数想象成正确答案的一个延迟的、稀疏的形式。


头像
QQ登录: