- 股票多因子模型实战:Python核心代码解析
- 陆一潇
- 516字
- 2024-01-22 19:17:20
1.3.2 未来信息
未来信息是一个特别需要注意的问题,无论是在因子计算还是行情回测或者简单的数据分析中,都有可能犯这个错误。
所谓的未来信息就是在分析的时候,在某个时间节点上使用了这个节点还没有生成或者尚且不能获得的数据。如图1-6所示,当我们在T0时刻计算交易信号的时候,只能使用T0时刻已经可以获取的信息。但是我们在编写量化策略的时候,往往历史数据都已存在,所以很多时候会不经意用到未来的数据,这就是所说的使用未来信息的问题了。
图1-6 未来信息示意图
举一个简单的例子,在简单的均线系统中,通常我们使用当天的收盘价为价格进行均线的计算。在这种情况下,当天的均线点只能在当天收盘之后获取,也就是在下一个交易日开盘前才可以使用,交易系统无法获取当天的均线值。
更容易使用未来信息的情景是财务因子的计算。我们以年报为例。年报反映的是某一年度公司的经营情况,但是公布年报的时间点往往是在下一年度,而且每一家上市公司公布的时间点不一样。例如,2018年的年报按照证监会要求,需要在2019年4月30日之前公布。既然如此,我们就必须在年报公布后的下一个交易日才能使用上市公司年报数据,而不能在2018年结束之后马上就使用。如果我们在量化模型中使用了未来信息,则往往会极大地高估模型的表现。