前言

元学习(Meta-Learning)起源于General AI(普适人工智能),目标是让机器学会学习(Learning-to-Learn),让机器变得更加智能,代替人类完成更多复杂多变的任务。一般将元学习视为深度学习模型的补充,用于提高模型的泛化能力,将模型更好地泛化到差别较大的任务中。通常使用预训练模型结合调参的模式,在保持深度模型精度的同时,额外提高深度学习模型的泛化能力,减弱过拟合,提高深度学习模型在分布外任务的表现。泛化能力的提高可带来以下优势:(1)减弱模型的过拟合;(2)提高模型的样本外预测能力;(3)扩大模型适用的范围;(4)有利于在不同场景之间模型的融合,在同一场景下有更多的模型可供选择,既可以重新训练模型,又可以从相似任务的深度模型泛化而来;(5)提供模型之间交流的通道,有利于不同模型和机器学习框架的合作,基础学习器和元学习器可以是不同种类的机器学习模型。

元学习并不是一个新概念,早在1987年,科学家就提出了元学习,指的是机器与环境交互,不断获取信息,进行自我更新,适应不断变化的环境,在没有任何人为干预的场景下,机器能自发地适应环境并且进化,学会如何处理遇到的新任务。常见的元学习框架包括两个部分:(1)处理任务的基础层模型;(2)综合分析所有任务,并且指导基础层模型的元层,元层指导基础层模型更快更好地适应新任务。元层是综合所有问题解决经验的指挥层,代表知识层级中更加本质和普适的知识,能推广到新任务。基础层和元层表示任务包含的知识层级,基础层表示任务特性的知识,元层表示任务共性的知识。

本书介绍了元学习的发展历史和常用的元学习方法,以及这些方法的思路、改进、继承、应用。元学习的范畴并没有明确的界定,和迁移学习是相近的概念,即更新已有的模型完成新任务,避免重新训练模型。近期发展起来的许多元学习方法都借鉴了迁移学习的思路。本书来源于对早期元学习理论和近期元学习方法的整理,元学习的应用场景举例如下:(1)需要深度学习模型处理的高维数据(High-Dimensional Data);(2)在线学习(Online Learning)需要及时更新深度模型;(3)优化问题,需要优化连续和离散的超参数,元层模型指导基础层模型优先探索更有潜力的超参数组合;(4)从头训练深度模型过于复杂以至于无法实现的场景,必须以过去的经验为基础来训练深度模型;(5)时间序列(Time Series)预测未来。

笔者接触元学习是在2018年,当时笔者使用频率较低(每半年)的公募基金持仓数据计算了频率较低的基金盈利能力指标。根据频率较低的指标预测基金未来表现,例如,根据仅有的3到4个观测点预测未来走势。这个问题本身并不是一个容易处理的问题,数据量太小,但是笔者尝试用直线斜率来预测未来走势,得到的预测结果竟然对大多数基金都有用,可是,仍然有部分基金无法预测。笔者希望找到方法降低这部分无法预测的基金比例。深度学习适用于数据量较大的情况,对于小样本的情形无法使用,而元学习适用于小样本问题的解决。除了笔者遇到的情形,元学习可以解决许多小样本的实际问题,例如,任何数据量不足或者任务环境剧烈变化的场景。其实,元学习不仅限于解决小样本问题,其最早提出时是为了实现General AI,让机器学会学习,使得机器可以学会解决小样本问题。元学习的目标是让机器变得更加智能,可以自行解决新问题,而不用每次都收集大量有标注数据、花大量时间和计算资源来从头训练深度模型。

笔者写这本书的愿望如下:(1)期待元学习的发展让机器学会学习,促进General AI的进步,最终让机器从事烦琐的重复性劳动,让人类将精力放在更加重要的领域,让人类的工作变得轻松;(2)元学习算法的框架灵活多变,对任何任务的适应性都不错,可以促进人工智能和传统领域的双赢融合。人工智能的发展并不限于在现有的任务上实现更高精度、更快速度、更好效果,还要将人工智能方法更好地与传统领域结合,扩大人工智能的应用范围,将人工智能渗透到传统领域;(3)希望元学习的思想能促进基础领域研究的发展。通常认为是基础领域研究的进步促进了其他领域的发展,而元学习的思想却可以影响基础领域的理论研究,提高理论的适应性,扩大理论的适应范围,放宽理论成立要求的苛刻假设条件;(4)提供解决问题的新思路。在元学习的基本思想和框架下,可以灵活地组合和改动现有的方法,解决复杂问题,化繁为简,实现问题分解;(5)促进统计学习和深度学习的融合发展,元学习提供了融合这些方法的灵活框架。

本书分为11章,在宏观上可以分为两大部分:元学习方法思想的介绍和元学习应用场景中模型的介绍。第1章是元学习概述,讲述元学习思想的起源和发展脉络;第2章是元学习框架研究,介绍元学习研究中搭建的理论框架,这两章作为对元学习的引入。第3章介绍了元学习神经网络方法,第4章介绍了基于度量的元学习方法,第5章介绍的是基础学习器和元学习器结合的元学习方法,第6章介绍了贝叶斯思想下的元学习方法,这些章节分别介绍了元学习方法的主要框架,给出了元学习框架的基础理论。第7章详细介绍了元学习的实际应用场景,第8章讲述了元强化学习,第9章描述了元模仿学习,第10章介绍了在线元学习,第11章介绍了无监督元学习。这些章节介绍了在实际应用中,在元学习框架下融入了强化学习、模仿学习、在线学习、无监督学习、迁移学习等,实现了对实际应用中深度模型的改进,以适应复杂多变的实际任务。

本书中介绍的方法都来自论文,书中引用的论文列在“论文及扩展阅读.pdf”文件中,该文件可从http://www.broadview.com.cn/40984下载。书中引用论文的编号对应于“论文及扩展阅读.pdf”文件中的编号。

本书正文中提及参见“链接1”“链接2”等时,可从http://www.broadview.com.cn/40984下载“参考资料.pdf”文件,从中可进行查询。

元学习方法灵活多变,可以混搭组合,解决许多实际问题。在不降低模型精度的情况下,提高模型的泛化能力。本书适用于金融领域的样本外预测问题、机器人领域的连续控制问题、小样本图片分类问题等。元学习致力于让机器学会学习,实现更高程度的智能化,以此改进现有模型的效果。