1,直接采用滚动序列预测的方法,都会出现预测值之后与实际值,参考https://zhuanlan.zhihu.com/p/54413813?utm_source=qq&utm_medium=social&utm_oi=676541090052575232
原始数据是这样的
如下图,采用的前1到n时刻的值来预测n+1时刻的值,预测值之后于实际值
2,根据上面那个链接提出的方法,即首先采用序列分解的方法,将时间序列分解成多个子序列,然后对每个子序列分别建模,最后把结果加起来作为最终结果,这种滞后现象明显没有了,我试过很多数据集,也确实是这样,可以参考下面这些博客:https://blog.csdn.net/qq_41043389/article/details/104517495(博客1)
https://blog.csdn.net/qq_41043389/article/details/106035949(博客2)
但是,问题来了,这几天有个客户找我做博客1的程序,发现最后的结果虽然精度确实提高了,但是依旧是预测值滞后于实际值(然后客户开始质疑我的程序有问题,态度极其恶劣,最后把我气得直接拉黑了他,),如下图
采用的VMD分解方法,然后对每个序列划分训练集与测试集(这里先不谈数据泄露的问题),训练集用于训练SA-DBN模型,测试集用于测试,最后把各个序列测试集的结果相加
问题是:为什么依旧出现了这种情况,这种结构我试过很多次,都没有这种情况,那么是数据本身存在什么问题吗?比如比自相关还高级的“强自相关性”,欢迎大家讨论。
以下是数据,麻烦大佬们帮忙研究下:https://github.com/fish-kong/data