WhaiBlog
主页
博客
留言
我
Holding your breath
默认分类
时序数据预处理
#### 基于模型的填充方法 1. **自回归模型(AR)** > 描述**当前值与历史值**之间的关系,用变量自身的**历史时间数据对自身进行预测** 2. **差分自回归移动平均模型(ARIMA)** > 将数据通过**差分**转化为平稳数据,再将**因变量**仅对滞后值以及随机误差项进行回归所建立的模型。 #### 机器学习的填充方法 1. KNN近邻 2. RNN递归神经网络 > **循环神经网络**的**隐藏层**的值s不仅仅取决于当前这次的输入x,还取决于上一次**隐藏层**的值s。 3. EM > 这是一种**近似极大似然函数的迭代方法**。为缺失的数据点选择随机值,猜测下一组数据,不断下去。expect max #### 数据噪声处理 时域滤波 > 用一个**滤波器**来去除噪声,滤波器通常是一个滑动窗口,而去噪就是用窗口内数据的统计值( 如均值、中值等) 来代替当前值 #### 特征提取和模型表示 2. 基于预测模型的时序表示 3. 基于变换的时序表示 > - 傅里叶变换 > > 将时域(即时间域)上的信号转变为频域(即频率域)上的信号 > > - 小波变换 > > 继承发展**短时傅立叶变换局部化**的思想,同时又**克服了窗口大小不随频率变化**等缺点,能够提供一个随频率改变的“时间-频率”窗口 > > - PCA > > 使用最广泛的数据**降维算法**。 4. 基于分段的时序表示 - 分段线性表示 > 关注时间序列的主要趋势变化,而不太关注具体的数值和少量的异常点,对序列分段,我们可以抓住重点。 - 分段聚合近似PAA > 基于长序列数据,生成一条短序列数据,使得短序列数据大致和长序列数据的趋势相似。 - SAX 符号聚合近似 > 将时间序列转换为字符串. > > 可以用于做降维。**降维成8帧**
默认分类
Post Comments 评论列表
0
Comment 评论
Submit Comment 提交评论
Post Comments 评论列表0