PriceForecast/shiyoujiaopuhuodataset/特征频度统计.txt
2025-11-06 09:13:16 +08:00

14 lines
774 B
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

特征信息总共有41个,日度(43), 详看 附1、特征列表
时序数据工程处理:
1. 时序对齐处理
- 按观测时间升序排列,确保最新数据位于序列末端
2. 空值特征筛除
- 删除全空值特征列(缺失率=100%
3. 失效指标剔除
- 基于最近两个月数据更新状态,移除停止更新的指标
4. 多粒度特征时序化处理
- 非日度指标采用前向/后向插值法转化为日频数据:
▶ 后向填充:当周度指标在周五更新时,用上周五值填充当周前四日
▶ 前向填充:对数据采集起始日的空白值,采用首个有效值前推填充
数据特征相关性分析: