
LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.



LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...
Share Dialog
Share Dialog
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

Subscribe to LUCIDA & FALCON

Subscribe to LUCIDA & FALCON
在上一篇文“团队在做事’和币价真的有关吗?”,我们分析了行业整体的GitHub开发情况与代币价格涨跌幅的相关性,得出GitHub六因子与币价涨跌幅在牛熊市都呈正相关的结论。
本文就“相关性“这一结论进一步拓展,研究二者的因果性,即“是因为技术升级促进了币价上涨,还是币价上涨拉动了技术升级”?从而帮助投资者与开发者更加明确“技术开发”这一基本面因子在币价涨跌盘中的位置。
文章大体思路如下:
首先,我们针对单个token构建GitHub开发活跃度指标 Github Development Activity Index (GDAI)。
其次,在此基础上,结合行业市值排名、GitHub项目数量随时间发展的规律性趋势等因素,构建反映全行业整体GitHub开发活跃度的指标 Industury Github Development Activity Index (IGDAI)。
然后,通过比较行业开发活跃度指标 IGDAI 与币价涨跌幅近6年来的变化趋势,判断技术与价格的因果关系。
最后,将GDAI指标应用于近6年来一直开发的token,比较其开发活跃度指标值和币价涨幅与BTC、ETH二者的差异,以印证前文对技术与价格因果关系的判断。

具体的 GDAI 公式如下:

**层次分析法(The Analytic Hierarchy Process即AHP)**是一种系统分析与决策的综合评价方法,将所需决策的元素分解为目标层(objective)、准则层(criterion)和方案层(scheme)。在分解的基础上再次进行定性和定量分析,计算方式简单高效。
(1) 分析系统中各因素之间的关系,建立系统的递阶层次结构
将目标层 GDAI 分解为5个准则层
μStar, μFork, μCommit, μIssues, μPullRequests。

(2) 建立判断矩阵
对于同一层次的各元素关于上一层次中某一准则的重要性进行两两比较,构造两两比较矩阵(判断矩阵)。我们在表2上确定了不同重要程度的度量。

为准则层B创建以下判断矩阵。根据经验和指标的性质,对GitHub开发活跃程度贡献的优先级为Commit>Pullrequests>Issues>Fork>Star。由于Star和Fork指标与开发活动没有特别直接的联系,我们将给它们的权重分配相对较低的分数。

(3) 一致性检查(CI)
矩阵B的特征方程:


(4) 3种方法计算权重
方法 1: 算术平均法

其中推导出的权重向量公式是:

方法 2: 几何平均法

方法 3: 首先使用特征值法确定矩阵A的最大特征值和相应的特征向量。然后将特征向量归一化为所需的权重。
将以上3中方法所求权重取均值,即为最终确定的权重值。具体结果如表四所示:

因此,具体的GDAI指标公式可有如下形式:
在Step 1,我们构建了针对单个token GitHub开发活跃度指标GDAI 。现基于GDAI ,综合考虑加密货币行业全部上市流通且在GitHub开源的token,通过汇总其所有token的GDAI ,求得全行业GitHub开发活跃度指标 IGDAI。具体的 IGDAI计算公式如下:

其中n代表某一区间段所有在加密货币市场流通且在GitHub开源的token总数量。
构建某一指标反映全行业情况,通常有两种思路:
1.选取代表性标的计算其表现 2.综合考虑全行业的情况
对于思路1,我们首先考虑到当下的加密货币行业生态并不十分完善,许多有币价且市值表现良好的token并未开源,第三方无法获取其具体的开发信息,所选取的标的“代表性”有待商榷;其次,当下的加密货币行业仍是一片蓝海,发展空间广阔,对于每个token,都有可能在短时间内取得飞速的发展;再次,加密货币行业24小时交易的高流动性特征使得行业市值短期波动较大。若参考A股市场半年内更换选取的标的,有可能错过大量token市值变动的信息。
因此,本文综合考虑全行业token的开发信息以计算IGDAI。
我们运用**格兰杰因果关系检验(Granger casuality test)分析行业开发活跃度 IGDAI与BTC币价变化两串时间序列数据的因果关系,其中时间段为2015-2023.10.31,指数维度为“日”。首先确定滞后阶数为4,通过单位根检验(Unit root test)**确定两类数据都为平稳序列(数据“平稳”格兰杰因果关系检验的前提),并得出以下结果:

其中0.000<0.05,说明该F检验拒绝原假设(原假设H0: 二者不存在格兰杰因果关系),BTC_price是 IGDAI 的原因,即行业GitHub开发活跃程度 IGDAI 受到币价变化滞后项的影响。
0.135>0.05**,说明该F检验接受原假设,IGDAI不是 BTC_price 的原因。综上,币价变化单向影响行业开发活跃程度。**
同时,我们借助图表更直观的分析。考虑到以日为区间的开发活跃度指标波动幅度较大,存在较多偶然因素,且视图不直观,我们进行指数平滑处理并扩大时间段为“周”。图2是从2015至今,时间段为“月”的 IGDAI 指数和BTC价格变化情况:

该图十分直观的展现了在不同时期行业开发生态的变动滞后于BTC币价的变化,且二者呈相似的波动的幅度,印证 IGDAI 单向受币价变化影响的结论。
并且我们从图中发现,在过去几个月中,行业开发活跃度指数暴跌31.7%,创下了近十年最大跌幅!
在Step3 部分我们通过格兰杰因果关系检验确立了币价单向影响技术开发的结论。**但我们还想探讨是否存在一种特殊的关系:即使GitHub开发的程度并不是改善币价涨跌的前因,但只要团队不摆烂,一直开发,熬过熊市,币价表现是否就不会特别拉胯。**考虑到token开发生态的成熟期和token种类丰富程度的变化,我们决定寻找2018年至今持续开发的token,并比较其GitHub开发活跃度 GDAI 和币价涨跌幅与BTC之间的关系。
其中,我们将**”持续开发”**定义为GitHub开发核心的commit、issues、pull requests三因子在时间段为2018至2023年10月中每一周不同时为0。币价涨跌幅定义为该时期(最高价-最低价)/最低价。通过海量的数据爬取和分析,我们首先确定2018至今共有约1400个token同时开源并上市,在1400个token中找到38个符合上述条件(其中包含了 BTC和ETH,考虑到BTC与ETH开发生态与市值已经非常成熟,十分具有代表性,考虑到文章篇幅,本文重点阐述剩余的36个token与BTC比较的结果)。具体token名单如表6所示:

关于GitHub开发活跃度 GDAI,统计38个token情况,得到图3:

红色表示IGDAI超过BTC的token,蓝色表示未超过的。在持续开发的token中,有9个token的开发活跃度超过BTC。
关于币价涨跌幅,得到图4:

红色表示币价涨跌幅超过BTC的token,蓝色表示未超过的。在持续开发的token中,有31个token的币价涨幅超过BTC。
汇总两张图情况,红色的token相互重合的有8个,即从2018至今,有8个token的Github开发活跃度 GDAI 和币价涨跌幅表现同时优于BTC(行业风向标),占该区间持续开发的所有token 22%。具体token如表7所示:

从持续开发的角度考虑,22%的重合率偏低,因此我们只能得出持续持续开发对币价有一定程度影响,但无法绝对的说明持续开发对币价存在十分积极的拉动效应。此观点也与step3 格兰杰因果关系检验的结果相互印证。
通过上述内容,Falcon对本文的结论做一个总结:
借助层次分析法,本文针对单个token建立了开发活跃度指标GDAI,也针对全行业分别建立了全行业GitHub开发活跃度指标IGDAI。
通过分析2015-2023.10的“全行业GitHub开发活跃度指标 IGDAI” 和 “BTC价格数据”,发现币价仅单向影响GitHub开发活跃度。并且在过去几个月中,行业开发活跃度指数暴跌31.7%,创下了近十年最大跌幅。
“团队持续开发不摆烂” 并不是熊市过后币价上涨的核心推动要素。投资时还需综合考虑其他因子对价格的影响。
Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
在上一篇文“团队在做事’和币价真的有关吗?”,我们分析了行业整体的GitHub开发情况与代币价格涨跌幅的相关性,得出GitHub六因子与币价涨跌幅在牛熊市都呈正相关的结论。
本文就“相关性“这一结论进一步拓展,研究二者的因果性,即“是因为技术升级促进了币价上涨,还是币价上涨拉动了技术升级”?从而帮助投资者与开发者更加明确“技术开发”这一基本面因子在币价涨跌盘中的位置。
文章大体思路如下:
首先,我们针对单个token构建GitHub开发活跃度指标 Github Development Activity Index (GDAI)。
其次,在此基础上,结合行业市值排名、GitHub项目数量随时间发展的规律性趋势等因素,构建反映全行业整体GitHub开发活跃度的指标 Industury Github Development Activity Index (IGDAI)。
然后,通过比较行业开发活跃度指标 IGDAI 与币价涨跌幅近6年来的变化趋势,判断技术与价格的因果关系。
最后,将GDAI指标应用于近6年来一直开发的token,比较其开发活跃度指标值和币价涨幅与BTC、ETH二者的差异,以印证前文对技术与价格因果关系的判断。

具体的 GDAI 公式如下:

**层次分析法(The Analytic Hierarchy Process即AHP)**是一种系统分析与决策的综合评价方法,将所需决策的元素分解为目标层(objective)、准则层(criterion)和方案层(scheme)。在分解的基础上再次进行定性和定量分析,计算方式简单高效。
(1) 分析系统中各因素之间的关系,建立系统的递阶层次结构
将目标层 GDAI 分解为5个准则层
μStar, μFork, μCommit, μIssues, μPullRequests。

(2) 建立判断矩阵
对于同一层次的各元素关于上一层次中某一准则的重要性进行两两比较,构造两两比较矩阵(判断矩阵)。我们在表2上确定了不同重要程度的度量。

为准则层B创建以下判断矩阵。根据经验和指标的性质,对GitHub开发活跃程度贡献的优先级为Commit>Pullrequests>Issues>Fork>Star。由于Star和Fork指标与开发活动没有特别直接的联系,我们将给它们的权重分配相对较低的分数。

(3) 一致性检查(CI)
矩阵B的特征方程:


(4) 3种方法计算权重
方法 1: 算术平均法

其中推导出的权重向量公式是:

方法 2: 几何平均法

方法 3: 首先使用特征值法确定矩阵A的最大特征值和相应的特征向量。然后将特征向量归一化为所需的权重。
将以上3中方法所求权重取均值,即为最终确定的权重值。具体结果如表四所示:

因此,具体的GDAI指标公式可有如下形式:
在Step 1,我们构建了针对单个token GitHub开发活跃度指标GDAI 。现基于GDAI ,综合考虑加密货币行业全部上市流通且在GitHub开源的token,通过汇总其所有token的GDAI ,求得全行业GitHub开发活跃度指标 IGDAI。具体的 IGDAI计算公式如下:

其中n代表某一区间段所有在加密货币市场流通且在GitHub开源的token总数量。
构建某一指标反映全行业情况,通常有两种思路:
1.选取代表性标的计算其表现 2.综合考虑全行业的情况
对于思路1,我们首先考虑到当下的加密货币行业生态并不十分完善,许多有币价且市值表现良好的token并未开源,第三方无法获取其具体的开发信息,所选取的标的“代表性”有待商榷;其次,当下的加密货币行业仍是一片蓝海,发展空间广阔,对于每个token,都有可能在短时间内取得飞速的发展;再次,加密货币行业24小时交易的高流动性特征使得行业市值短期波动较大。若参考A股市场半年内更换选取的标的,有可能错过大量token市值变动的信息。
因此,本文综合考虑全行业token的开发信息以计算IGDAI。
我们运用**格兰杰因果关系检验(Granger casuality test)分析行业开发活跃度 IGDAI与BTC币价变化两串时间序列数据的因果关系,其中时间段为2015-2023.10.31,指数维度为“日”。首先确定滞后阶数为4,通过单位根检验(Unit root test)**确定两类数据都为平稳序列(数据“平稳”格兰杰因果关系检验的前提),并得出以下结果:

其中0.000<0.05,说明该F检验拒绝原假设(原假设H0: 二者不存在格兰杰因果关系),BTC_price是 IGDAI 的原因,即行业GitHub开发活跃程度 IGDAI 受到币价变化滞后项的影响。
0.135>0.05**,说明该F检验接受原假设,IGDAI不是 BTC_price 的原因。综上,币价变化单向影响行业开发活跃程度。**
同时,我们借助图表更直观的分析。考虑到以日为区间的开发活跃度指标波动幅度较大,存在较多偶然因素,且视图不直观,我们进行指数平滑处理并扩大时间段为“周”。图2是从2015至今,时间段为“月”的 IGDAI 指数和BTC价格变化情况:

该图十分直观的展现了在不同时期行业开发生态的变动滞后于BTC币价的变化,且二者呈相似的波动的幅度,印证 IGDAI 单向受币价变化影响的结论。
并且我们从图中发现,在过去几个月中,行业开发活跃度指数暴跌31.7%,创下了近十年最大跌幅!
在Step3 部分我们通过格兰杰因果关系检验确立了币价单向影响技术开发的结论。**但我们还想探讨是否存在一种特殊的关系:即使GitHub开发的程度并不是改善币价涨跌的前因,但只要团队不摆烂,一直开发,熬过熊市,币价表现是否就不会特别拉胯。**考虑到token开发生态的成熟期和token种类丰富程度的变化,我们决定寻找2018年至今持续开发的token,并比较其GitHub开发活跃度 GDAI 和币价涨跌幅与BTC之间的关系。
其中,我们将**”持续开发”**定义为GitHub开发核心的commit、issues、pull requests三因子在时间段为2018至2023年10月中每一周不同时为0。币价涨跌幅定义为该时期(最高价-最低价)/最低价。通过海量的数据爬取和分析,我们首先确定2018至今共有约1400个token同时开源并上市,在1400个token中找到38个符合上述条件(其中包含了 BTC和ETH,考虑到BTC与ETH开发生态与市值已经非常成熟,十分具有代表性,考虑到文章篇幅,本文重点阐述剩余的36个token与BTC比较的结果)。具体token名单如表6所示:

关于GitHub开发活跃度 GDAI,统计38个token情况,得到图3:

红色表示IGDAI超过BTC的token,蓝色表示未超过的。在持续开发的token中,有9个token的开发活跃度超过BTC。
关于币价涨跌幅,得到图4:

红色表示币价涨跌幅超过BTC的token,蓝色表示未超过的。在持续开发的token中,有31个token的币价涨幅超过BTC。
汇总两张图情况,红色的token相互重合的有8个,即从2018至今,有8个token的Github开发活跃度 GDAI 和币价涨跌幅表现同时优于BTC(行业风向标),占该区间持续开发的所有token 22%。具体token如表7所示:

从持续开发的角度考虑,22%的重合率偏低,因此我们只能得出持续持续开发对币价有一定程度影响,但无法绝对的说明持续开发对币价存在十分积极的拉动效应。此观点也与step3 格兰杰因果关系检验的结果相互印证。
通过上述内容,Falcon对本文的结论做一个总结:
借助层次分析法,本文针对单个token建立了开发活跃度指标GDAI,也针对全行业分别建立了全行业GitHub开发活跃度指标IGDAI。
通过分析2015-2023.10的“全行业GitHub开发活跃度指标 IGDAI” 和 “BTC价格数据”,发现币价仅单向影响GitHub开发活跃度。并且在过去几个月中,行业开发活跃度指数暴跌31.7%,创下了近十年最大跌幅。
“团队持续开发不摆烂” 并不是熊市过后币价上涨的核心推动要素。投资时还需综合考虑其他因子对价格的影响。
Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
<100 subscribers
<100 subscribers
No activity yet