明显提升Transformer在高频信号的预测效果的策略。

  

↑↑↑关注后"星标"kaggle竞赛宝典
  kaggle竞赛宝典  作者:Fareise

KDD2024 | Transformer频域消偏提升时序预测准确性!

Transformer在时间序列中已经应用比较广泛。但是最近一些针对Transformer的研究工作指出,Transformer的self-attention机制在建模序列数据时,比较倾向于学习低频的信息,而忽略了高频信息,造成频率偏差问题,影响了预测效果。

在时间序列预测中,这个问题也存在,为了解决这个问题,在KDD 2024上,大阪大学发表了一篇相关工作Fredformer,对Transfomrer在时间序列预测中的这种问题进行了解决。

论文标题:Fredformer: Frequency Debiased Transformer for Time Series Forecasting

下载地址https://arxiv.org/pdf/2406.09009v4

1
背景

一些研究指出,transformer模型在进行时间序列预测时,会存在频率偏差问题,也就是模型只关注到了序列数据中的低频信息,忽略了高频信息。这个问题在时间序列预测领域同样存在。比如下图是一些基于Transformer的预测模型,可以看到在预测结果中,模型的预测是比较平滑的,反映了整体的趋势。但是对于高频趋势却预测不出来。

为了进一步验证这个问题,这篇文章首先进行了一些case study。预先设定3个频率,根据这些频率组成人造的时间序列数据,使用Transformer模型进行训练并预测。下图反应了各个频率的预测效果,训练到50轮后,k1作为低频信号已经被拟合的loss比较小了,但是k3这个高频信号却学得很差,说明Transformer时间序列预测模型也存在这种问题。而右侧的图调整了各个频率成分的权重后,高频的k3被拟合的更好了,k1反而拟合的不好。说明造成这种频率偏差问题的主要原因是各个成分的权重不同。这有点类似于多任务学习中,不同任务的数据量或者loss差别大,导致模型侧重于某几个任务的学习。

1
建模方法

为了解决上述的频率bias问题,本文从平衡各个频率成分的比例出发,同时又将各个频率成分的建模拆解开,尽量减小各个成分之间的影响。

整体的模型结构如下图所示。首先,通过傅里叶变换将时间序列映射到频域中。在频域中,将时间序列进行分patch处理,并对每个patch的数据进行频域中的归一化。通过这种方式,让每个频率成分在patch内单独建模,又让每个频率成分的振幅值域归一化到同一水平上,防止某一频率主导了模型学习。

对于每一个频率patch进行独立的Transfomrer建模。这个过程类似于iTransformer的操作,在变量维度使用Transformer。假设有N个频域patch,有C个变量,那么会有N个Transformer。每个Transformer在变量维度计算self-attention,每个频域的patch独立进行建模。通过这种方式,尽量减小各个频率之间的干扰。

最终,再将频域的表征通过逆向傅里叶变换映射回时域,通过一个MLP网络映射到最终输出结果。

3
实验效果

在实验中,作者对比了不同预测窗口的多变量时间序列预测效果,本文提出的方法取得了显著的效果提升。

从case分析来看,模型相比其他Transformer模型,在高频信号的预测上有一个显著的提升,对于极值点的预估更加准确。

END




 如果觉得有帮助麻烦分享在看点赞~  

相关推荐

  • [开源]一款快速且灵活的后台框架,可轻松实现复杂页面,内置代码生成器
  • 推荐!神器 Jupyter 的可视化 Debug~
  • 手把手AI实战(六)老照片动起来
  • CODESYS为何在自动化行业如此牛叉???
  • 187K Star 快20万人关注!!!2000多款开源自托管平替软件
  • ACM MM 2024 以人为中心多媒体分析研讨会,诚邀各界专家学者参与
  • 博士申请 | 香港理工大学李青教授课题组招收人工智能全奖博士/博后/RA
  • 厦门大学首发多模态阅读理解新任务: 图文深度融合数据集VEGA
  • “闭门造车”之多模态思路浅谈:自回归学习与生成
  • Spring Boot集成drools快速入门Demo
  • 腾讯全员调薪,还算厚道
  • 实例分享:如何稳妥重构消费金融系统
  • 由浅入深的混合精度训练教程
  • 硕士生一作!985,发Science!
  • 美联储鲍威尔 | 货币政策半年度参议院听证会 全文+视频
  • 在抖音卖书半年,我如何从月亏十万到月GMV两千万?
  • 被一支笔硬控不止30秒!大模型时代的学生辅导“全能选手”
  • 三星的Galaxy Ring 智能戒指有点意思;附国内外AI产品6月数据
  • 点线面的智慧: 转转JTS技术如何塑造上门履约地理布局
  • 实现LLM应用的可观测,难在哪里?