时序数据压缩和模态匹配

张开发

• 2026/4/21 11:02:56 • 15 分钟阅读

分享文章

Less is More: Efficient Time Series Dataset Condensation via Two-fold Modal Matching这是全球首个面向时间序列的数据集压缩框架TimeDC用双模态匹配频率训练轨迹把海量时序数据压缩成极小合成数据集同时让模型效果接近用全量数据训练大幅降低存储与算力成本。链接https://www.vldb.org/pvldb/vol18/p226-miao.pdf代码https://github.com/uestc-liuzq/STdistillation作者Hao Miao, Ziqiao Liu, Yan Zhao, Chenjuan Guo, Bin Yang, Kai Zheng, Christian S. Jensen关键词时序数据压缩模态匹配一、研究背景与问题痛点物联网/边缘设备产生海量时序数据存储、预处理、训练成本极高边缘设备难以承载。传统方法核心集Coreset靠启发式采样无法保证最优解图像领域的数据集压缩方法不适应时序的趋势、周期性等复杂时序依赖。三大挑战有效性与泛化压缩数据易过拟合难以适配不同网络。时序依赖无法捕捉趋势、季节、多变量耦合特征。可扩展性双层优化耗时、易内存溢出。二、核心创新双模态匹配机制TimeDC用频率匹配保时序模式训练轨迹匹配保模型泛化解决上述全部挑战。1. 整体框架先在全量数据上预训练专家轨迹存入缓冲池 → 用压缩数据训练模型 → 同时对齐频率与训练轨迹→ 得到极小高质量压缩集。2. 三大核心模块1时序特征提取 TSFE通道独立机制把多变量时序拆成单变量单独建模避免特征耦合干扰。分块机制 Patching切分成子序列块大幅降低自注意力复杂度提速省内存。堆叠TSOperator自注意力全连接层捕捉长时序依赖。2分解驱动频率匹配 DDFM保时序模式对每层特征做时序分解分离趋势和周期。用余弦相似度对齐原始与压缩数据的频率保证压缩数据保留趋势、周期性等核心时序规律。3课程式训练轨迹匹配 CT²M保泛化与效率专家缓冲池离线预计算全量数据的模型参数轨迹专家轨迹避免在线双层优化防内存溢出、大幅降训练成本。课程式查询从“相似轨迹”到“差异轨迹”逐步匹配让压缩数据模仿全量数据的长期训练动态提升泛化。三、总体优化目标总损失任务专属损失预测/分类频率匹配损失轨迹匹配损失四、实验结论关键结果效果最优在7个时序预测数据集、3个分类数据集上超过所有核心集与数据集压缩方法MAE/RMSE最高降低13.49%/26.59%。压缩数据训练效果接近全量数据。效率极高训练时间比同类方法快73%以上内存占用最高降至1/10。存储仅为原数据的1%4%**参数仅为传统Transformer的**1/51/50。泛化强压缩数据可直接用于Autoformer/Informer/Transformer等不同架构效果稳定。落地场景边缘设备流式学习解决灾难性遗忘适配资源受限环境。五、核心贡献总结首次提出时序数据集压缩填补技术空白。双模态匹配频率匹配保时序特征轨迹匹配保泛化。专家缓冲池分块机制解决内存溢出、训练慢的工程难题。实测在预测、分类、边缘流式学习均SOTA成本大幅降低。六、一句话概括TimeDC用“留时序规律仿训练行为”的双匹配思路把大数据变成小数据让时序模型在边缘设备也能低成本、高性能跑起来。

更多文章

前端开发 2026/4/16 23:44:12

深入解析C++ I/O流控制标志：ios_base与ios命名空间下的模式对比

1. 为什么C会有两种I/O流控制标志写法？ 第一次看到std::ios::out和std::ios_base::out这两种写法时，我和大多数开发者一样困惑。这就像发现家里有两把完全相同的钥匙，都能开同一扇门，但不知道为什么要做两把。要理解这个问题&…

张开发

前端开发 2026/4/16 23:33:09

打造沉浸式智能AI问答助手：Vue + UniApp 全端实战（支持 Markdown/公式/多模态交互）仔

OCP原则 ocp指开闭原则，对扩展开放，对修改关闭。是七大原则中最基本的一个原则。依赖倒置原则（DIP） 什么是依赖倒置原则核心是面向接口编程、面向抽象编程， 不是面向具体编程。依赖倒置原则的目的降低耦合度&#…

张开发

前端开发 2026/4/19 21:54:32

Harness 中的事件溯源：以事件日志重建状态

Harness 中的事件溯源：以事件日志重建全链路 DevOps 状态引言痛点引入作为全链路 DevOps 平台，Harness 每天会处理数百万到数千万级别的用户/系统操作：开发者点击“启动流水线”、Feature Flag 规则引擎执行批量开关切换、云成本扫描器…

张开发

前端开发 2026/4/16 23:33:10

AQS (AbstractQueuedSynchronizer) Core

AQS (AbstractQueuedSynchronizer) Core AQS is the foundation of almost everything in java.util.concurrent. It provides: an int state a CLH wait queue. Subclasses just define what state means. What’s Built on AQS AQS ├── ReentrantLock (state h…

张开发

前端开发 2026/4/16 23:48:54

嵌入式整数信号变换库：纯定点FFT/DCT实现

1. 项目概述“Transform”是一个专为嵌入式系统设计的轻量级整数信号变换库，其核心目标是在无浮点硬件支持、内存受限、实时性敏感的MCU平台上，以纯整数运算实现高精度、低开销的常用信号变换算法。该库不依赖标准数学库（如math.h&#xff09…

张开发

前端开发 2026/4/19 2:30:44

基于OpenCV与海康摄像头的实时视频帧捕获技术实践

1. 海康摄像头与OpenCV的基础连接配置第一次接触海康摄像头和OpenCV配合使用时，最让人头疼的就是网络配置问题。我清楚地记得自己第一次调试时，光是让摄像头和电脑处在同一个网络就折腾了整整一上午。这里分享几个关键步骤，帮你少走弯路。首…

张开发

前端开发 2026/4/19 1:47:41

【CD4022八进制计数器脉冲分配器】2023-5-31

缘由CD4022可以连接成4进制吗? - 24小时必答区脉宽调节中医不用做胃镜，观察出口物颜色是否带血判断，检查表里可判断远近位置确诊，在表为近端，在里为远端，鲜红色为近端，暗黑色为远端，远端在胃…

张开发

前端开发 2026/4/16 23:33:15

技术判断力之AI三问峭

认识Pass层级结构 Pass范围从上到下一共分为5个层级： 模块层级：单个.ll或.bc文件调用图层级：函数调用的关系。函数层级：单个函数。基本块层级：单个代码块。例如C语言中{}括起来的最小代码。指令层级：单…

张开发

前端开发 2026/4/16 23:34:48

如何用WebSocket构建高性能物联网实时通信系统：IoT-Technical-Guide完整指南

如何用WebSocket构建高性能物联网实时通信系统：IoT-Technical-Guide完整指南【免费下载链接】IoT-Technical-Guide :honeybee: IoT Technical Guide --- 从零搭建高性能物联网平台及物联网解决方案和Thingsboard源码分析 :sparkles: :sparkles: :sparkles: (IoT Pl…

张开发

前端开发 2026/4/16 23:33:15

chromeplugin叛

正文异步/等待解决了什么问题？ 在传统同步I/O操作中（如文件读取或Web API调用），调用线程会被阻塞直到操作完成。这在UI应用中会导致界面冻结，在服务器应用中则造成线程资源的浪费。async/await通过非阻塞的异步操作解…

张开发

前端开发 2026/4/18 19:20:31

10个Yellowbrick可视化技巧：提升机器学习模型诊断效率

10个Yellowbrick可视化技巧：提升机器学习模型诊断效率【免费下载链接】yellowbrick Visual analysis and diagnostic tools to facilitate machine learning model selection. 项目地址: https://gitcode.com/gh_mirrors/ye/yellowbrick Yellowbrick是一款强…

张开发

前端开发 2026/4/15 23:40:03

Tensorflow-Tutorial优化技巧：Dropout和Batch Normalization的终极指南

Tensorflow-Tutorial优化技巧：Dropout和Batch Normalization的终极指南【免费下载链接】Tensorflow-Tutorial Tensorflow tutorial from basic to hard, 莫烦Python 中文AI教学项目地址: https://gitcode.com/gh_mirrors/te/Tensorflow-Tutorial Tensorflo…

张开发

时序数据压缩和模态匹配

最新文章

别让垃圾文件占满硬盘！Syncthing忽略规则保姆级配置指南（附常用模板）

架构实战：无API接口老旧电梯的机器人梯控非侵入式调度设计与状态机实现

WorkshopDL深度解析：打破Steam创意工坊壁垒的三大核心能力

终极Mac软件管理指南：如何用Applite告别繁琐的命令行安装

从Chicken Bit到时钟门控：聊聊RTL微调后，如何用形式等价验证（FEV）守住功能安全底线

nli-MiniLM2-L6-H768效果展示：新闻标题与正文首段的矛盾关系自动预警案例

推荐文章

从零上手CH340G：USB转串口芯片的实战应用指南

别再手动算周期了！用STM32CubeMX的TIM1输入捕获测按键时长（附完整代码）

AI代码配额管理实战指南：7大行业真实配额模型+3类超限预警SOP（附2026大会未发布白皮书节选）

集合（ArrayList）

防止SQL注入的运维实践_实时清理数据库缓存与历史记录

MySQL Explain 执行计划性能对比

相关文章

无损音乐下载与高品质音频管理：tidal-dl-ng的核心能力探索

LyricsX：让歌词如影随形的桌面歌词助手

如何利用自动化抢票工具突破大麦网90%的抢票失败率：从绝望到成功的完整指南

电子设计竞赛必备：RC、运放、TTL信号处理电路实战指南（附避坑技巧）

从RoboMaster到智能仓储：深入聊聊麦克纳姆轮底盘的那些‘坑’与最佳实践

libhv实战：从零构建一个高效的WebSocket客户端

分享文章

更多文章

深入解析C++ I/O流控制标志：ios_base与ios命名空间下的模式对比

打造沉浸式智能AI问答助手：Vue + UniApp 全端实战（支持 Markdown/公式/多模态交互）仔

Harness 中的事件溯源：以事件日志重建状态

AQS (AbstractQueuedSynchronizer) Core

嵌入式整数信号变换库：纯定点FFT/DCT实现

基于OpenCV与海康摄像头的实时视频帧捕获技术实践

【CD4022八进制计数器脉冲分配器】2023-5-31

技术判断力之AI三问峭

如何用WebSocket构建高性能物联网实时通信系统：IoT-Technical-Guide完整指南

chromeplugin叛

10个Yellowbrick可视化技巧：提升机器学习模型诊断效率

Tensorflow-Tutorial优化技巧：Dropout和Batch Normalization的终极指南