
用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...

用多因子策略构建强大的加密资产投资组合 #大类因子分析:因子合成篇#
书接上回,关于《用多因子模型构建强大的加密资产投资组合》系列文章中,我们已经发布了三篇:《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》。 前三篇分别解释了多因子策略的理论与单因子测试的步骤。一、因子相关性检验的原因:多重共线性我们通过单因子测试部分筛选出一批有效因子,但以上因子不能直接入库。因子本身可以根据具体的经济含义进行大类划分,同类型的因子间存在较强的相关性,若不经相关性筛选直接入库,根据不同因子进行多元线性回归求预期收益率时,会出现多重共线性问题。计量经济学中,多重共线性是指回归模型中的一些或全部解释变量存在“完全”或准确的线性关系(各变量间高度相关)。 因此,有效因子筛选出后,首先需要根据大类对因子的相关性进行T检验,对于相关性较高的因子,要么舍弃显著性较低的因子,要么进行因子合成。 多重共线性的数学解释如下: $$Y = β₁ + β₂X₂ᵢ + β₃X₃ᵢ + ... + βₖXₖᵢ + μᵢ , i = 1,2,...,n$$ 会存在两种情况: 1.$$C₂X₂ᵢ + C₃X₃ᵢ + … + CₖXₖᵢ = 常数向量$$,$$ Cᵢ$$不全为$$0→Xᵢ$...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...

用多因子策略构建强大的加密资产投资组合 #大类因子分析:因子合成篇#
书接上回,关于《用多因子模型构建强大的加密资产投资组合》系列文章中,我们已经发布了三篇:《理论基础篇》、《数据预处理篇》、《因子有效性检验篇》。 前三篇分别解释了多因子策略的理论与单因子测试的步骤。一、因子相关性检验的原因:多重共线性我们通过单因子测试部分筛选出一批有效因子,但以上因子不能直接入库。因子本身可以根据具体的经济含义进行大类划分,同类型的因子间存在较强的相关性,若不经相关性筛选直接入库,根据不同因子进行多元线性回归求预期收益率时,会出现多重共线性问题。计量经济学中,多重共线性是指回归模型中的一些或全部解释变量存在“完全”或准确的线性关系(各变量间高度相关)。 因此,有效因子筛选出后,首先需要根据大类对因子的相关性进行T检验,对于相关性较高的因子,要么舍弃显著性较低的因子,要么进行因子合成。 多重共线性的数学解释如下: $$Y = β₁ + β₂X₂ᵢ + β₃X₃ᵢ + ... + βₖXₖᵢ + μᵢ , i = 1,2,...,n$$ 会存在两种情况: 1.$$C₂X₂ᵢ + C₃X₃ᵢ + … + CₖXₖᵢ = 常数向量$$,$$ Cᵢ$$不全为$$0→Xᵢ$...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

Subscribe to LUCIDA & FALCON

Subscribe to LUCIDA & FALCON
Share Dialog
Share Dialog


<100 subscribers
<100 subscribers
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。
选包括两部分,选赛道和选币种。
买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。
管是指管理投资组合。包括对冲风险、增强收益、调仓等等。
卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。
这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。
关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。
我希望通过多因子模型去解决“选”的问题。
市场是有统计规律的,为什么每次牛市大顶我们都能完美逃顶,这不是运气,而是我们发现了这个规律,我们决定把这部分经验运用到小币种的身上。在牛市中涨幅大的小币种也一定是有统计规律的,一定有。
对于多因子模型,我希望它80%是客观的,靠算法和模型来实现,20%是主观的,它来自交易员长年累月实盘交易的盘感,而不是颠倒过来,甚至完全无视统计规律。区块链的价值之一就是数据的透明与可信,这简直就是宝藏。人脑的优势在于逻辑判断,计算机的优势在于计算效率,二者结合是理想状态。
LUCIDA目前在做的一系列投研工作,包括发出去研究报告,只是基本的数据分析、获取与可视化,目的是得到一些定性上的结论,进而发现市场洞察和灵感,找到推动价格上涨的Key Factors,尽管目前的工作不涉及到策略层面的东西,但是这个过程非常重要。
传统的Fama-French三因子模型把因子分类三大类:value, size , momentum 但这不适合Crypto。我目前把因子分成了几大类:
基本面因子:包括Github的代码、共识机制、赛道分类、最大发行量/总发行量/流通量、市值…
动量因子:包括价格、链上成交量、Cex成交量…
技术指标因子:一些传统的技术指标
链上因子:包括时间序列数据(钱包地址监测)、截面数据(大额转账监测)
事件因子:例如马斯克喊单dogecoin什么的…
衍生品因子:CEX的期权、期货合约、DEX和DeFi的Lending、Stacking、Yield Farming…
另类数据因子:项目社区的聊天记录、社交媒体上的搜索量…
这篇文章里提到了”不同市场状态下因子有效性“的问题。
Not all factors or combinations of factors are relevant across all market states. Based on economic conditions and historical performance, we can model the market lifecycle in four key stages.
While some factors are relevant in a specific market state, they tend to loose effectiveness as the market evolves. From that perspective, applying the right factor strategy during the right market cycle is the cornerstone of effective quantitative strategies.

这也是多因子模型的一些问题。文章链接:Thinking like a Crypto Quant: Multi-Factor Strategies for Crypto-Assets
多因子模型是个庞大的系统工程,需要大量的特征库,也需要更多投研伙伴的加入,如果你对我们所做的事情有兴趣,欢迎通过下方的联系方式联系我。
LUCIDA是一家Crypto领域的量化对冲基金,主体位于开曼群岛,在2018年4月进入Crypto市场并进行二级市场投资,主营CTA、统计套利、期权等金融衍生品策略,同时为高净值客户提供资管服务,不定期发布深度投研报告。
Twitter:@ZnQ_626 / @lucidafund
website:https://www.lucida.fund
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。
选包括两部分,选赛道和选币种。
买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。
管是指管理投资组合。包括对冲风险、增强收益、调仓等等。
卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。
这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。
关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。
我希望通过多因子模型去解决“选”的问题。
市场是有统计规律的,为什么每次牛市大顶我们都能完美逃顶,这不是运气,而是我们发现了这个规律,我们决定把这部分经验运用到小币种的身上。在牛市中涨幅大的小币种也一定是有统计规律的,一定有。
对于多因子模型,我希望它80%是客观的,靠算法和模型来实现,20%是主观的,它来自交易员长年累月实盘交易的盘感,而不是颠倒过来,甚至完全无视统计规律。区块链的价值之一就是数据的透明与可信,这简直就是宝藏。人脑的优势在于逻辑判断,计算机的优势在于计算效率,二者结合是理想状态。
LUCIDA目前在做的一系列投研工作,包括发出去研究报告,只是基本的数据分析、获取与可视化,目的是得到一些定性上的结论,进而发现市场洞察和灵感,找到推动价格上涨的Key Factors,尽管目前的工作不涉及到策略层面的东西,但是这个过程非常重要。
传统的Fama-French三因子模型把因子分类三大类:value, size , momentum 但这不适合Crypto。我目前把因子分成了几大类:
基本面因子:包括Github的代码、共识机制、赛道分类、最大发行量/总发行量/流通量、市值…
动量因子:包括价格、链上成交量、Cex成交量…
技术指标因子:一些传统的技术指标
链上因子:包括时间序列数据(钱包地址监测)、截面数据(大额转账监测)
事件因子:例如马斯克喊单dogecoin什么的…
衍生品因子:CEX的期权、期货合约、DEX和DeFi的Lending、Stacking、Yield Farming…
另类数据因子:项目社区的聊天记录、社交媒体上的搜索量…
这篇文章里提到了”不同市场状态下因子有效性“的问题。
Not all factors or combinations of factors are relevant across all market states. Based on economic conditions and historical performance, we can model the market lifecycle in four key stages.
While some factors are relevant in a specific market state, they tend to loose effectiveness as the market evolves. From that perspective, applying the right factor strategy during the right market cycle is the cornerstone of effective quantitative strategies.

这也是多因子模型的一些问题。文章链接:Thinking like a Crypto Quant: Multi-Factor Strategies for Crypto-Assets
多因子模型是个庞大的系统工程,需要大量的特征库,也需要更多投研伙伴的加入,如果你对我们所做的事情有兴趣,欢迎通过下方的联系方式联系我。
LUCIDA是一家Crypto领域的量化对冲基金,主体位于开曼群岛,在2018年4月进入Crypto市场并进行二级市场投资,主营CTA、统计套利、期权等金融衍生品策略,同时为高净值客户提供资管服务,不定期发布深度投研报告。
Twitter:@ZnQ_626 / @lucidafund
website:https://www.lucida.fund
No activity yet