
LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...

用多因子策略构建强大的加密资产投资组合 #大类因子分析:因子合成篇#
书接上回,关于《用多因子模型构建强大的加密资产投资组合》系列文章中,我们已经发布了三篇:《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》。 前三篇分别解释了多因子策略的理论与单因子测试的步骤。一、因子相关性检验的原因:多重共线性我们通过单因子测试部分筛选出一批有效因子,但以上因子不能直接入库。因子本身可以根据具体的经济含义进行大类划分,同类型的因子间存在较强的相关性,若不经相关性筛选直接入库,根据不同因子进行多元线性回归求预期收益率时,会出现多重共线性问题。计量经济学中,多重共线性是指回归模型中的一些或全部解释变量存在“完全”或准确的线性关系(各变量间高度相关)。 因此,有效因子筛选出后,首先需要根据大类对因子的相关性进行T检验,对于相关性较高的因子,要么舍弃显著性较低的因子,要么进行因子合成。 多重共线性的数学解释如下: $$Y = β₁ + β₂X₂ᵢ + β₃X₃ᵢ + ... + βₖXₖᵢ + μᵢ , i = 1,2,...,n$$ 会存在两种情况: 1.$$C₂X₂ᵢ + C₃X₃ᵢ + … + CₖXₖᵢ = 常数向量$$,$$ Cᵢ$$不全为$$0→Xᵢ$...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...

用多因子策略构建强大的加密资产投资组合 #大类因子分析:因子合成篇#
书接上回,关于《用多因子模型构建强大的加密资产投资组合》系列文章中,我们已经发布了三篇:《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》。 前三篇分别解释了多因子策略的理论与单因子测试的步骤。一、因子相关性检验的原因:多重共线性我们通过单因子测试部分筛选出一批有效因子,但以上因子不能直接入库。因子本身可以根据具体的经济含义进行大类划分,同类型的因子间存在较强的相关性,若不经相关性筛选直接入库,根据不同因子进行多元线性回归求预期收益率时,会出现多重共线性问题。计量经济学中,多重共线性是指回归模型中的一些或全部解释变量存在“完全”或准确的线性关系(各变量间高度相关)。 因此,有效因子筛选出后,首先需要根据大类对因子的相关性进行T检验,对于相关性较高的因子,要么舍弃显著性较低的因子,要么进行因子合成。 多重共线性的数学解释如下: $$Y = β₁ + β₂X₂ᵢ + β₃X₃ᵢ + ... + βₖXₖᵢ + μᵢ , i = 1,2,...,n$$ 会存在两种情况: 1.$$C₂X₂ᵢ + C₃X₃ᵢ + … + CₖXₖᵢ = 常数向量$$,$$ Cᵢ$$不全为$$0→Xᵢ$...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

Subscribe to LUCIDA & FALCON

Subscribe to LUCIDA & FALCON
Share Dialog
Share Dialog
<100 subscribers
<100 subscribers


在去年6月份,我设想了用多因子模型去择币的简单构思。
https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA
nft://undefined/undefined/undefined?showBuying=true&showMeta=true
一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。
本系列的大体框架如下(不排除微调的可能):
一、多因子模型理论基础
二、单因子构建
因子数据预处理
数据筛选
异常值处理:极值、错误值、空值
标准化
中性化:行业、市场、市值
因子有效性判断
信息比率IC、收益率、夏普比率、换手率
三、大类因子合成
因子共线性分析
正交消除因子共线性
经典加权方法→合成因子
等权、滚动IC加权、IC_IR加权
合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率
其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)
四、风险组合优化
以下是第一篇**#理论基础篇#**的正文内容。
“因子”即技术分析中的“指标”、人工智能机器学习的“特征”,是决定加密货币收益率涨跌的原因。
我们团队把加密货币领域常见的因子类型:基本面因子、链上因子、量价因子、衍生品因子、另类因子和宏观因子。
挖掘和计算“因子”的最终目的是为了准确计算资产的预期收益率。
因子研究可追溯于20C60S,资本资产定价模型(Capital Asset Pricing Model, CAPM)问世,该模型量化了风险如何影响一个公司的资本成本从而影响预期收益率。根据CAPM理论,单个资产的预期超额收益可由以下的一元线性模型决定:
是数学期望, 为资产的收益率, 为无风险收益率, 为市场组合的收益率, 体现资产收益对市场收益的敏感程度,也称资产对市场风险的暴露程度。
补充理解:
金融市场中,所谈及的“风险”和“收益”本质是同类东西。
从统计学角度,更详细的理解
CAPM可看成是无截距项的双变量回归模型,利用普通最小二乘估计法(OLS)求出模型参数的估计值,其中 。
CAPM模型是最简单的线性因子模型,指出资产的超额收益只由市场**组合(市场因子)**的预期超额收益和资产对市场风险的暴露大小决定。该模型为后续大量线性多因子定价模型的研究奠定基理论础。
在CAPM基础,人们发现不同资产的收益率受多个因子影响,套利定价理论(Arbitrage Pricing Theory, APT)问世,构建线性多因子模型:
其中,$E(Ri) $表示资产 的预期收益, 表示因子预期收益(即因子溢价)。公式(2) 利用
代替CAPM模型中的 来表示预期收益,利用多空对冲构建的资金中性投资组合资产, 被抵消,整个资产的预期收益率就是多头和空头预期收益率之差,因此用 表示更具一般性。
综合考虑金融市场实际存在的定价误差和APT模型,从时序角度上看,单个资产的预期收益率由以下的多元线性模型决定:
其中, 表示 $t $ 时刻资产 的收益, 表示 时刻因子收益率(即因子溢价), 表示 $t $ 时刻的随机扰动。
多因子模型关注资产预期收益率在截面上的差异,本质是关于均值的模型,而预期收益率是收益率在时间序列上的平均。基于(3) ,可推导出截面角度的多元线性模型:
其中, 表示资产 的预期超额收益, 在时序上取平均,则。
补充理解:
从学术界角度出发,根据市场有效性理论,一个有效的资产组合应该是可抵消风险完全为0,实际收益率等于预期收益率,且预期资产收益率只取决于市场的系统性风险,即 ,不存在超额收益率(Abnormal Return, AR),即 。但现实的金融世界通常是市场非有效的,存在超额收益率,即 。
假设投资组合由 个资产构成,并将每个资产 对应的因子收益率 按照不同因子展开,得到以下多因子模型的组合收益率:
其中, 为组合的超额收益,$Wi βij λ = ∑ᴹⱼ₌₁βᵢⱼfᵢⱼ$,fᵢⱼ 是每份资产的每个因子每单位因子载荷对应的因子收益率。
结合统计学知识,该模型隐含三层假设:
每个资产的 收益和 收益不相关:
不同资产间的特质收益率也不相关:
对于 收益和 收益的综合解释:
结合具体的金融市场, 是归属于大盘整体表现的 收益, 则是由资产自身特定带来的 收益,即跑赢大盘多少个点。而每个资产的收益率则是由 Beta 收益和 收益组成,人们可利用多因子模型中每个资产对应的 值来对每个资产打分或赋予权重,从而构造投资组合,并利用期货对 收益部分做空来对冲风险,从而获得 收益。
构造投资组合时需在组合的风险和收益间取平衡,需要将以上模型转化为带约束的规划问题来求解。组合的风险即组合的波动率 ,以下对 进行推导。涉及组合构建的详细分析则在“风险组合优化”部分阐述。
基于公式(3) 的矩阵表达式,可得到组合的波动率:

其中, 是资产的权重矩阵, 是因子的权重矩阵,表示 个资产在 个风险因子上的因子载荷矩阵:

表示 个因子的因子收益率协方差矩阵:

由假设3,不同资产间的特质收益率也不相关,可得Δ 矩阵为:

Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
更多内容可访问 https://linktr.ee/lucida_and_falcon
From Tech Breakthroughs to Market Boom: Understanding the Link in the Crypto Bull Market
Development as the Driving Force: Understanding the Impact on Token Price Performance?
5 Million Rows of Data Recap: Investigating The Crypto Market’s 3-Year Bull Run @LUCIDA
LUCIDA × SnapFingers DAO:21 top public chains in three-year bull market recap
在去年6月份,我设想了用多因子模型去择币的简单构思。
https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA
nft://undefined/undefined/undefined?showBuying=true&showMeta=true
一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。
本系列的大体框架如下(不排除微调的可能):
一、多因子模型理论基础
二、单因子构建
因子数据预处理
数据筛选
异常值处理:极值、错误值、空值
标准化
中性化:行业、市场、市值
因子有效性判断
信息比率IC、收益率、夏普比率、换手率
三、大类因子合成
因子共线性分析
正交消除因子共线性
经典加权方法→合成因子
等权、滚动IC加权、IC_IR加权
合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率
其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)
四、风险组合优化
以下是第一篇**#理论基础篇#**的正文内容。
“因子”即技术分析中的“指标”、人工智能机器学习的“特征”,是决定加密货币收益率涨跌的原因。
我们团队把加密货币领域常见的因子类型:基本面因子、链上因子、量价因子、衍生品因子、另类因子和宏观因子。
挖掘和计算“因子”的最终目的是为了准确计算资产的预期收益率。
因子研究可追溯于20C60S,资本资产定价模型(Capital Asset Pricing Model, CAPM)问世,该模型量化了风险如何影响一个公司的资本成本从而影响预期收益率。根据CAPM理论,单个资产的预期超额收益可由以下的一元线性模型决定:
是数学期望, 为资产的收益率, 为无风险收益率, 为市场组合的收益率, 体现资产收益对市场收益的敏感程度,也称资产对市场风险的暴露程度。
补充理解:
金融市场中,所谈及的“风险”和“收益”本质是同类东西。
从统计学角度,更详细的理解
CAPM可看成是无截距项的双变量回归模型,利用普通最小二乘估计法(OLS)求出模型参数的估计值,其中 。
CAPM模型是最简单的线性因子模型,指出资产的超额收益只由市场**组合(市场因子)**的预期超额收益和资产对市场风险的暴露大小决定。该模型为后续大量线性多因子定价模型的研究奠定基理论础。
在CAPM基础,人们发现不同资产的收益率受多个因子影响,套利定价理论(Arbitrage Pricing Theory, APT)问世,构建线性多因子模型:
其中,$E(Ri) $表示资产 的预期收益, 表示因子预期收益(即因子溢价)。公式(2) 利用
代替CAPM模型中的 来表示预期收益,利用多空对冲构建的资金中性投资组合资产, 被抵消,整个资产的预期收益率就是多头和空头预期收益率之差,因此用 表示更具一般性。
综合考虑金融市场实际存在的定价误差和APT模型,从时序角度上看,单个资产的预期收益率由以下的多元线性模型决定:
其中, 表示 $t $ 时刻资产 的收益, 表示 时刻因子收益率(即因子溢价), 表示 $t $ 时刻的随机扰动。
多因子模型关注资产预期收益率在截面上的差异,本质是关于均值的模型,而预期收益率是收益率在时间序列上的平均。基于(3) ,可推导出截面角度的多元线性模型:
其中, 表示资产 的预期超额收益, 在时序上取平均,则。
补充理解:
从学术界角度出发,根据市场有效性理论,一个有效的资产组合应该是可抵消风险完全为0,实际收益率等于预期收益率,且预期资产收益率只取决于市场的系统性风险,即 ,不存在超额收益率(Abnormal Return, AR),即 。但现实的金融世界通常是市场非有效的,存在超额收益率,即 。
假设投资组合由 个资产构成,并将每个资产 对应的因子收益率 按照不同因子展开,得到以下多因子模型的组合收益率:
其中, 为组合的超额收益,$Wi βij λ = ∑ᴹⱼ₌₁βᵢⱼfᵢⱼ$,fᵢⱼ 是每份资产的每个因子每单位因子载荷对应的因子收益率。
结合统计学知识,该模型隐含三层假设:
每个资产的 收益和 收益不相关:
不同资产间的特质收益率也不相关:
对于 收益和 收益的综合解释:
结合具体的金融市场, 是归属于大盘整体表现的 收益, 则是由资产自身特定带来的 收益,即跑赢大盘多少个点。而每个资产的收益率则是由 Beta 收益和 收益组成,人们可利用多因子模型中每个资产对应的 值来对每个资产打分或赋予权重,从而构造投资组合,并利用期货对 收益部分做空来对冲风险,从而获得 收益。
构造投资组合时需在组合的风险和收益间取平衡,需要将以上模型转化为带约束的规划问题来求解。组合的风险即组合的波动率 ,以下对 进行推导。涉及组合构建的详细分析则在“风险组合优化”部分阐述。
基于公式(3) 的矩阵表达式,可得到组合的波动率:

其中, 是资产的权重矩阵, 是因子的权重矩阵,表示 个资产在 个风险因子上的因子载荷矩阵:

表示 个因子的因子收益率协方差矩阵:

由假设3,不同资产间的特质收益率也不相关,可得Δ 矩阵为:

Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
更多内容可访问 https://linktr.ee/lucida_and_falcon
From Tech Breakthroughs to Market Boom: Understanding the Link in the Crypto Bull Market
Development as the Driving Force: Understanding the Impact on Token Price Performance?
5 Million Rows of Data Recap: Investigating The Crypto Market’s 3-Year Bull Run @LUCIDA
LUCIDA × SnapFingers DAO:21 top public chains in three-year bull market recap
衡量解释变量(市场收益率)变动以单位,被解释变量(资产i的收益率)平均变动的程度,金融领域将该变动程度解释为Y对X的“敏感”或“暴露”程度。
放大市场波动
与市场波动完全相同
与市场同向波动,但比市场波动小
与市场反向波动
从金融学风险和收益的角度,更详细的理解
投资组合有两类风险,系统性风险(即市场风险、不可抵消风险)和非系统性风险(可抵消风险)。 是系统性风险,无论如何构造资产组合,该风险是该系统特有的,无法抵消。下文提及的 则是非系统性风险,可通过构造不同的策略来对冲掉。
因子一定和资产收益率有关:
衡量解释变量(市场收益率)变动以单位,被解释变量(资产i的收益率)平均变动的程度,金融领域将该变动程度解释为Y对X的“敏感”或“暴露”程度。
放大市场波动
与市场波动完全相同
与市场同向波动,但比市场波动小
与市场反向波动
从金融学风险和收益的角度,更详细的理解
投资组合有两类风险,系统性风险(即市场风险、不可抵消风险)和非系统性风险(可抵消风险)。 是系统性风险,无论如何构造资产组合,该风险是该系统特有的,无法抵消。下文提及的 则是非系统性风险,可通过构造不同的策略来对冲掉。
因子一定和资产收益率有关:
No activity yet