Subscribe to Collins Insights
Subscribe to Collins Insights
Share Dialog
Share Dialog


<100 subscribers
<100 subscribers
在数据完整性及时效性的前提下,管理人通常将另类数据作为财报因子的补充和替代加入到选股策略中去
少有直接采用单一另类因子的策略产品
行业景气度刻画
供需、宏观、上市公司财务
光伏-产业链、政策、业绩预期-link到那一篇
滞后披露 不透明、不及时
选股策略的研究已经非常成熟,衍生出非常多基本面因子
所有上市公司进行横向比较
普适、客观且相对高质量 另类数据
热辐射遥感数据,其数据能直接体现地表温度的变化,上市公司尤其是制造业上市公司其所在地温度的变化与经济活动的强度紧密相关
将热辐射数据整合至公司发展情况的评估框架中
去除季节性、地理差异的调整
热辐射数据比较适用于有固定且独立的生产基地、能源消耗相对较高的行业公司
业绩受供给比受需求影响更大的公司
资源开采、基建、科技行业
先进制造与周期类
地缘政治、政策因素、季节因素
时效性
全面性
精准性
构建因子
从逻辑上来看,公司热辐射同比或环比增速越大,代表公司生产经营活动有所增加;公司热辐射与行业/市场均值的比值越高,代表公司生产经营活动相对于行业或市场整体的水平在增加。
A股利润表中提取共计8个财务指标:营业总收入、营业收入、营业利润、利润总额、净利润(含少数股东损益)、EBIT、息税折旧摊销前利润、扣除非经常性损益后净利润(扣除少数股东损益)
相关性检验
对于季度数据,分别测试各因子与滞后1期季度收益率、滞后1期财务指标之间线性相关的显著性
TIRRaw(公司区域平均热辐射)同比与环比变化率因子、
TIR_IndTIR(公司区域平均热辐射与行业平均热辐射的比值)
TIR_MktTIR(公司区域平均热辐射与市场平均热辐射的比值)因子
~营业收入
热辐射指标具有与收益率线性相关性低、与营业收入线性相关性高的特点
商贸零售、建筑装饰、传媒、石油石化
消费、周期、先进制造以及科技(TMT)类
热辐射因子与营收增速不具有单调性
营收同比因子和净利润同比因子的IC值在2021年四季度开始都有呈现减小态势,并且相关关系显著性降低
该数据所打造的因子是一个典型的基本面因子,在基本面更能驱动股价的市场环境里会表现更好
热辐射因子的单调性较弱,不适合作为单因子在全市场股票池中进行选股。我们将主要利用热辐射因子分别进行单因子和多因子股票组合测算,简要思路如下:
1、 通过营收同比和股价收益率之间的相关性大小排序筛选“精选股票池”,再在精选股票池中使用热辐射因子单因子选股策略;
2、 热辐射因子能够较为高效、客观地刻画上市公司生产经营活动,通过热辐射因子构造具有潜在营收增长能力的基础股票池,再在营收潜在增长的基础股票池内,用多因子来进一步优选股票。
精选股票池搭建
总市值最大的前200只
200只股票的回归系数绝对值整体在0.6以上,R²整体在40%以上
电子、电力设备、医药生物、机械设备、汽车、基础化工
对精选股票池内的成分股根据另类数据因子值在横截面上进行排序,选取排名前40只股票做多(根据精选股票池数量的20%确定),投资组合内各股票等权重配置。
根据精选股票池内股票偏中小市值的特点,选择中证1000作为指数基准,同时以精选股票池内200只股票做等权重配置的投资组合作为业绩基准
高清低频数据:月频、TIRRaw_MOM、母公司
单调性较好,且近两年没有出现显著的衰弱
分析师指标反应的对公司业绩的市场预期通常基于公司调研、公告等手段获取的生产经营活动相关公开信息,而热辐射数据属于通过卫星遥感技术手段获得的与公司生产经营活动相关联的客观信息,两者在反映的事件类型上具有一定重叠。
因此,我们想看热辐射因子所提供的是否是在市场预期之外的增量信息。进一步对比3.1.2的策略表现和分析师一致预期因子选股的策略表现,观察另类数据因子的选股策略表现是否具有优越性。两个策略回测区间相同,样本股相同,信号频率相同,因子是唯一的变量。下面我们选取低清高频月度数据下的母公司DayTIRRaw_MOM因子月频策略与分析师预期营业收入同比因子月频策略表现进行对比。
多因子构建
每一期(季度)末根据当期数值筛选下一期多因子选股策略基础股票池。具体的筛选方法是:每一期末,筛选前一期因子数值排名前1000,且本期有数据的股票,再从中筛选排名靠前的700只股票构成基础股票池。
DayTIR_IndDayTIR指标能够选出具有潜在营收增速的股票池。
3.2.2 多因子组合构建及测试
针对3.2.1小节筛选出的基础股票池,对选股因子在股票池内的选股效果进行测试,回测区间为2018/3/31~2023/12/31,每季度末进行组合调仓。选股因子包括成长、盈利、估值、波动性、流动性、长期动量、短期反转、市值、分析师、分红
比较选股因子在基础股票池内的IC均值及分组多头超额收益的强弱表现,并且考虑到因子间的相关性(尽管选股因子做了逐步正交的处理),最后我们选取Growth、Value、Volatility、Momentum、Size、Analyst六个因子作为选股因子,因子权重采取等权的方式。
在2018/6/30-2024/3/31回测区间,每年3、6、9、12月底,基于因子打分方式对基础股票池内的股票进行打分排序,选取得分靠前的50值股票,按照等权的方式构建组合,下称“股票池优选”。在每期构建组合时,另外再增加市值因子排序前80%、剔除北交所和ST股票的限制条件。同时,我们选取沪深300、中证500、中证1000、基础股票池等权组合、全市场优选组合在同一回测区间内的净值表现作为对比
热辐射因子增长?实际业绩增长?股价增长的反应链并不具备在全市场股票样本里的普适性,因此我们认为根据行业筛选股票池再做热辐射因子选股具有可行性
电力设备、电子、机械设备、医药生物
基于全样本股票池,从属于对应行业的股票中,利用热辐射因子进行行业内选股策略的测算,并以行业指数以及股票池中所有的对应行业股票等权组合作为另类数据行业内选股策略的两个比较基准
回测区间统一为2018/1/1~2023/12/31,选股方案为在对应的行业股票池内,根据截面的另类数据因子大小进行排序,选择排名在20%*行业样本池数量的股票做多,等权构建股票多头组合。
对于A股上市公司的业绩前瞻,另类数据主要有三方面帮助。一是拓展了分析研判的信息维度。另类数据的特殊属性,使得其包含很多预见性的信息,可以进一步优化分析研判的工作质量。二是增强了分析研判的时效性。另类数据的获取和传输时效性更强,通过借助另类数据,有助于及时、迅速掌握企业经营的实际情况。三是为量化投资提供机遇。形式多样的另类数据,为数据挖掘、机器学习等研究方法提供了更大的空间和机遇。
根据我们的观察,另类数据在实际使用上具有以下几个特征:
1) 另类数据具有客观、及时、数据质量高等优点,但根据另类数据指标的含义、测量方法的不同,其所覆盖的上市公司各不相同,且覆盖范围可能较为有限,具有行业偏度和市值偏度较高的特点。合理的另类数据选择可以在行业内选股策略中更高效地捕获阿尔法。
2) 另类数据因子的使用需要结合针对股票池的具体分析,主要原因是另类数据含义偏基本面,不同时期A股市场股价驱动因素是动态变化的且不同行业基本面驱动股价变化的逻辑之间存在差异。另类数据在数据质量保证的情况下,可以作为基本面因子加入到多因子模型中去以提高组合风险收益能力。
3) 另类数据因子不一定用于因子选股模型,也常用于主动系统化投资。报告中选择构建因子选股模型来检验因子质量只是一种通用手段,通过这种方式我们可以更直观地看到另类数据因子预测上市公司业绩进而提示股价的作用。
4) 另类数据的获取技术壁垒较高,常见的金融数据资讯平台不一定有收录,需要与数据供应商达成合作,且数据结构需要经过额外处理方可用于模型使用。不同数据来源的数据质量存在差异。
在数据完整性及时效性的前提下,管理人通常将另类数据作为财报因子的补充和替代加入到选股策略中去
少有直接采用单一另类因子的策略产品
行业景气度刻画
供需、宏观、上市公司财务
光伏-产业链、政策、业绩预期-link到那一篇
滞后披露 不透明、不及时
选股策略的研究已经非常成熟,衍生出非常多基本面因子
所有上市公司进行横向比较
普适、客观且相对高质量 另类数据
热辐射遥感数据,其数据能直接体现地表温度的变化,上市公司尤其是制造业上市公司其所在地温度的变化与经济活动的强度紧密相关
将热辐射数据整合至公司发展情况的评估框架中
去除季节性、地理差异的调整
热辐射数据比较适用于有固定且独立的生产基地、能源消耗相对较高的行业公司
业绩受供给比受需求影响更大的公司
资源开采、基建、科技行业
先进制造与周期类
地缘政治、政策因素、季节因素
时效性
全面性
精准性
构建因子
从逻辑上来看,公司热辐射同比或环比增速越大,代表公司生产经营活动有所增加;公司热辐射与行业/市场均值的比值越高,代表公司生产经营活动相对于行业或市场整体的水平在增加。
A股利润表中提取共计8个财务指标:营业总收入、营业收入、营业利润、利润总额、净利润(含少数股东损益)、EBIT、息税折旧摊销前利润、扣除非经常性损益后净利润(扣除少数股东损益)
相关性检验
对于季度数据,分别测试各因子与滞后1期季度收益率、滞后1期财务指标之间线性相关的显著性
TIRRaw(公司区域平均热辐射)同比与环比变化率因子、
TIR_IndTIR(公司区域平均热辐射与行业平均热辐射的比值)
TIR_MktTIR(公司区域平均热辐射与市场平均热辐射的比值)因子
~营业收入
热辐射指标具有与收益率线性相关性低、与营业收入线性相关性高的特点
商贸零售、建筑装饰、传媒、石油石化
消费、周期、先进制造以及科技(TMT)类
热辐射因子与营收增速不具有单调性
营收同比因子和净利润同比因子的IC值在2021年四季度开始都有呈现减小态势,并且相关关系显著性降低
该数据所打造的因子是一个典型的基本面因子,在基本面更能驱动股价的市场环境里会表现更好
热辐射因子的单调性较弱,不适合作为单因子在全市场股票池中进行选股。我们将主要利用热辐射因子分别进行单因子和多因子股票组合测算,简要思路如下:
1、 通过营收同比和股价收益率之间的相关性大小排序筛选“精选股票池”,再在精选股票池中使用热辐射因子单因子选股策略;
2、 热辐射因子能够较为高效、客观地刻画上市公司生产经营活动,通过热辐射因子构造具有潜在营收增长能力的基础股票池,再在营收潜在增长的基础股票池内,用多因子来进一步优选股票。
精选股票池搭建
总市值最大的前200只
200只股票的回归系数绝对值整体在0.6以上,R²整体在40%以上
电子、电力设备、医药生物、机械设备、汽车、基础化工
对精选股票池内的成分股根据另类数据因子值在横截面上进行排序,选取排名前40只股票做多(根据精选股票池数量的20%确定),投资组合内各股票等权重配置。
根据精选股票池内股票偏中小市值的特点,选择中证1000作为指数基准,同时以精选股票池内200只股票做等权重配置的投资组合作为业绩基准
高清低频数据:月频、TIRRaw_MOM、母公司
单调性较好,且近两年没有出现显著的衰弱
分析师指标反应的对公司业绩的市场预期通常基于公司调研、公告等手段获取的生产经营活动相关公开信息,而热辐射数据属于通过卫星遥感技术手段获得的与公司生产经营活动相关联的客观信息,两者在反映的事件类型上具有一定重叠。
因此,我们想看热辐射因子所提供的是否是在市场预期之外的增量信息。进一步对比3.1.2的策略表现和分析师一致预期因子选股的策略表现,观察另类数据因子的选股策略表现是否具有优越性。两个策略回测区间相同,样本股相同,信号频率相同,因子是唯一的变量。下面我们选取低清高频月度数据下的母公司DayTIRRaw_MOM因子月频策略与分析师预期营业收入同比因子月频策略表现进行对比。
多因子构建
每一期(季度)末根据当期数值筛选下一期多因子选股策略基础股票池。具体的筛选方法是:每一期末,筛选前一期因子数值排名前1000,且本期有数据的股票,再从中筛选排名靠前的700只股票构成基础股票池。
DayTIR_IndDayTIR指标能够选出具有潜在营收增速的股票池。
3.2.2 多因子组合构建及测试
针对3.2.1小节筛选出的基础股票池,对选股因子在股票池内的选股效果进行测试,回测区间为2018/3/31~2023/12/31,每季度末进行组合调仓。选股因子包括成长、盈利、估值、波动性、流动性、长期动量、短期反转、市值、分析师、分红
比较选股因子在基础股票池内的IC均值及分组多头超额收益的强弱表现,并且考虑到因子间的相关性(尽管选股因子做了逐步正交的处理),最后我们选取Growth、Value、Volatility、Momentum、Size、Analyst六个因子作为选股因子,因子权重采取等权的方式。
在2018/6/30-2024/3/31回测区间,每年3、6、9、12月底,基于因子打分方式对基础股票池内的股票进行打分排序,选取得分靠前的50值股票,按照等权的方式构建组合,下称“股票池优选”。在每期构建组合时,另外再增加市值因子排序前80%、剔除北交所和ST股票的限制条件。同时,我们选取沪深300、中证500、中证1000、基础股票池等权组合、全市场优选组合在同一回测区间内的净值表现作为对比
热辐射因子增长?实际业绩增长?股价增长的反应链并不具备在全市场股票样本里的普适性,因此我们认为根据行业筛选股票池再做热辐射因子选股具有可行性
电力设备、电子、机械设备、医药生物
基于全样本股票池,从属于对应行业的股票中,利用热辐射因子进行行业内选股策略的测算,并以行业指数以及股票池中所有的对应行业股票等权组合作为另类数据行业内选股策略的两个比较基准
回测区间统一为2018/1/1~2023/12/31,选股方案为在对应的行业股票池内,根据截面的另类数据因子大小进行排序,选择排名在20%*行业样本池数量的股票做多,等权构建股票多头组合。
对于A股上市公司的业绩前瞻,另类数据主要有三方面帮助。一是拓展了分析研判的信息维度。另类数据的特殊属性,使得其包含很多预见性的信息,可以进一步优化分析研判的工作质量。二是增强了分析研判的时效性。另类数据的获取和传输时效性更强,通过借助另类数据,有助于及时、迅速掌握企业经营的实际情况。三是为量化投资提供机遇。形式多样的另类数据,为数据挖掘、机器学习等研究方法提供了更大的空间和机遇。
根据我们的观察,另类数据在实际使用上具有以下几个特征:
1) 另类数据具有客观、及时、数据质量高等优点,但根据另类数据指标的含义、测量方法的不同,其所覆盖的上市公司各不相同,且覆盖范围可能较为有限,具有行业偏度和市值偏度较高的特点。合理的另类数据选择可以在行业内选股策略中更高效地捕获阿尔法。
2) 另类数据因子的使用需要结合针对股票池的具体分析,主要原因是另类数据含义偏基本面,不同时期A股市场股价驱动因素是动态变化的且不同行业基本面驱动股价变化的逻辑之间存在差异。另类数据在数据质量保证的情况下,可以作为基本面因子加入到多因子模型中去以提高组合风险收益能力。
3) 另类数据因子不一定用于因子选股模型,也常用于主动系统化投资。报告中选择构建因子选股模型来检验因子质量只是一种通用手段,通过这种方式我们可以更直观地看到另类数据因子预测上市公司业绩进而提示股价的作用。
4) 另类数据的获取技术壁垒较高,常见的金融数据资讯平台不一定有收录,需要与数据供应商达成合作,且数据结构需要经过额外处理方可用于模型使用。不同数据来源的数据质量存在差异。
No activity yet