MQL5算法交易的神经网络-001数据处理
挑选指标数据要考虑两点:1. 指标数据量级不同,不具可比性。2. 指标数据存在相关性。
数据处理
准备ZigZag指标数据作为参考值(5分钟周期,参数设置为48,1,47,即未来4H的ZigZag极值),准备各类指标数据和价格数据。
将2周期后的ZigZag极值与当前Close差值作为Target2(Distance),Target2是否大于等于0作为Target1(Direction)。其他指标都与Close做差值处理数据。
计算相关性
计算所有指标与Target1和Target2的相关性,排除相关性较低的指标(ATR)。
挑选出相关性较高的指标RSI,然后计算与剩余指标间的相关性。挑选出与RSI相关性最低的指标MACD,计算剩余指标与MACD的相关性。
排除同时与RSI和MACD相关性都较高的指标SAR,Bands等。
最终筛选出指标RSI和MACD。
进一步检查指标
统计筛选后的指标非线性值(Pow)与Target间的相关性,选择相关性最高的指标非线性值。
统计筛选后的指标偏移值(Shift)与Target间的相关性,选择相关性最高的指标偏移值。
巧合地是RSI和MACD的1次幂和0偏移值与Target相关性已经是最高的,因此在准备数据时不用进一步处理指标。