1.3.2 无监督学习

无监督学习(Unsupervised Learning)又称为非监督学习,是在没有训练数据集的情况下,对没有标签的数据进行分析并建立模型,发现数据本身的分布特点。与监督学习不同,无监督学习事先没有对数据进行标注,因此无法预测任务,而适合数据分析。

无监督学习分为数据聚类和特征降维。

1.数据聚类

数据聚类(Clustering)是无监督学习的主流应用之一,其目的也是把数据进行分类。对没有标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大而类别间的数据相似度较小。

2.特征降维

特征降维(Dimensionality Reduction)是对事物的特性进行压缩和筛选,使用较少的特征概括该数据的重要特性。

机器学习模式总结如表1-4所示。

表1-4 机器学习模式总结