1.3 机器学习领域分类

从方法论的角度来讲,机器学习分为监督式学习、非监督式学习和新兴机器学习课题三大方面。

1.监督式学习

监督式机器学习的主要任务是通过机器学习模型和已有信息,对感兴趣的变量进行预测,或者对相关对象进行分类。监督式机器学习的一些应用场景包括:对网页访问进行分类,通过声音、文字、表情等信息对用户心情进行判断,对天气进行预测等。常用的监督式机器学习方法包括线性模型、最近邻估计、神经网络、决策树等。最近特别火热的深度学习在图像分类等场景的应用也是监督式学习的一种。

2.非监督式学习

非监督式学习的主要任务是对数据进行描述。在非监督式学习的应用场景中,所有变量几乎都处于同等地位,不存在一个需要进行预测和分类的目标。故此非监督式学习主要用于机器学习建模前期对数据的分析和可视化处理,其在生产环境中的应用较少。非监督式学习的主要方法包括聚类分析、隐含因子分析等。

3.新兴的机器学习课题

最近五年,强化学习(reinforcement learning)领域在深度学习的带领下得到了飞速的发展。强化学习旨在通过对实际事件的观察得到行为优化的结论,例如,Alpha Go通过强化学习优化下围棋的策略。到目前为止,强化学习暂时还主要停留在学院派研究中,实际应用暂时有限。

本书将着重讲述机器学习方法在实时场景中的应用,我们将会简要介绍主流监督式学习的方法和应用。另外值得一提的是,在IT工业界应用中,自然语义处理、推荐系统和搜索引擎由于其专业领域深度和应用的难度,在各种文献中它们往往被列为独立的大方向。本书的第9章和第12章会对自然语言的处理进行简单的介绍。