三、预测分析技术

大数据分析的应用领域之一是预测性分析,从大数据中挖掘出规律,通过科学建模,然后向模型中输入新数据,从而预测未来的数据。
大数据预测分析可帮助企业做出明智的业务决策、提高商品和服务的销售量、避免灾难的发生等,但预测分析极端困难,实施成功的预测分析有赖于数据质量、数据科学家、预测分析软件、运营软件4个关键因素。

1.数据质量

数据是预测分析的血液。数据中的变量是否有助于有效预测是关键方面。通常数据越多,相关度和质量越高,寻找到原因和结果的可能性越大。

2.数据科学家

数据科学家必须理解业务需求和业务目标,审视数据,并围绕增加电子商务的销售额、保持生产线的正常运转等业务目标建立预测分析规则。数据科学家需要拥有数学、统计学等多个领域的知识。

3.预测分析软件

数据科学家必须借助预测分析软件来评估他们的分析模型和规则,预测分析软件通过整合统计分析和机器学习算法发挥作用。IBM SPSS和SAS是两个数据科学家常用的分析软件。R项目是一个非常流行的开源工具。如果数据量大到大数据的程度,则需要Hadoop等专门的大数据处理平台或Oracle Exadata等数据库分析机。

4.运营软件

首先需要合适的预测规则,然后需将规则植入应用,预测分析软件应能以某种方式产生代码。此外,需将预测规则使用的数据提前准备。预测规则也能通过业务规则管理系统和复杂事件处理平台进行优化。