2.3 数据清洗
数据清洗包括奇异数据的处理(去极值)、数据规范化和部分风格因子的因子载荷正交化以及缺失风险载荷的补足。下面分别对其进行说明。
2.3.1 极值与规范化处理
首先,对数据进行如下标准化:
其中μk 为市值加权平均,σk 为简单平均标准差。
与传统的极值限制在 3 个标准差的做法不同,我们采取以下极值处理方式,将风险暴露限制在[-3.5,3.5]。
其中
2.3 数据清洗
数据清洗包括奇异数据的处理(去极值)、数据规范化和部分风格因子的因子载荷正交化以及缺失风险载荷的补足。下面分别对其进行说明。
2.3.1 极值与规范化处理
首先,对数据进行如下标准化:
其中μk 为市值加权平均,σk 为简单平均标准差。
与传统的极值限制在 3 个标准差的做法不同,我们采取以下极值处理方式,将风险暴露限制在[-3.5,3.5]。
其中