PriceForecast/juxitingdataset/特征频度统计.txt
2024-11-21 10:10:59 +08:00

10 lines
684 B
Plaintext
Raw Blame History

This file contains ambiguous Unicode characters

This file contains Unicode characters that might be confused with other characters. If you think that this is intentional, you can safely ignore this warning. Use the Escape button to reveal them.

特征信息总共有309个,日度(216),周度(94),154天(1), 详看 附1、特征列表
数据特征工程:
1. 数据日期排序,新日期在最后
2. 删除空列,特征数据列没有值,就删除
3. 删除近两月不再更新值的指标
4. 非日度数据填充为日度数据,填充规则:
-- 向后填充,举例:假设周五出现一个周度指标数据,那么在这之前的数据用上周五的数据
-- 向前填充举例采集数据开始日期为2018年1月1日那么周度数据可能是2018年1月3日那么3日的数据向前填充使1日2日都有数值
数据特征相关性分析: