1.6 实时应用对机器学习的要求

现今每年都会发表成千上万的机器学习相关的论文,其中不乏表现突出的方法论,但是并不是所有的机器学习模型在实际应用中都适用。实时机器学习的应用主要有以下几个方面的要求。

1.模型可扩展性

模型可扩展性需要整个机器学习应用的各个部分均可以轻易地根据实际需要进行扩展。这里的扩展可能是增加新的预测变量,也可能是在新的市场、人群和用户界面中进行使用,还有可能是加入新的架构部件,进行可视化等操作。

2.模型运用低延迟性

低延迟性是实时机器学习应用区别于其他机器学习应用的核心。根据定的义的不同,低延迟的界定也会有所不同。对于网页、交互式游戏等应用场景,低延迟需要整个机器学习后台在少于10个微秒内完成反应;与此相对应的是,对于后台数据分析、作弊检测等场景,低延迟要求整个机器学习后台能在少于一分钟内完成作业即可。

3.训练数据私密性

训练数据私密性是指,模型的用户能否通过逆向工程的办法,倒推出模型训练数据集的内容。如果训练数据集的内容可以被轻松倒推出来,那么可能会对训练集数据提供者的隐私和经济利益带来负面影响。这是近几年刚被机器学习业界意识到的一个重要问题。