
LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

LUCIDA:用多因子模型去选赛道、选币种
投资小币种,无论是一级还是二级,我把整个过程分成四个部分:选、买、管、卖。『 选 』选包括两部分,选赛道和选币种。『 买 』买有两种方式,一级或者二级,这两个需要的核心能力不一样,一级看重行业资源,二级看重投研能力,目前我没看到,二者各有优劣,目前没看到两个能力都有的机构,这里不展开讲。『 管 』管是指管理投资组合。包括对冲风险、增强收益、调仓等等。『 卖 』卖不解释了。如果你是屯币者或者对某类资产有特殊信仰,当我没说。仅靠逻辑分析,不太靠谱这四块里最难的还是选。市场中的小币种太多,光CMC收录的就有9000多个,再怎么筛选,潜在的投资标的也得有大几十个。 关于选赛道和选币种,我发现目前行业的主流做法还是靠逻辑分析。列一堆看好某个赛道和币种的理由作为买某类资产的依据,这算不上错,但是有缺陷。首先,当你处在某个时间截面下,你都能找到无数个看多或看空某一赛道和资产的理由,因为凡事都是一体两面的,所以靠逻辑分析还是主观的,再深入讨论下去就成辩论了,二是不定量,缺乏客观数据的支撑。关于多因子模型,80%靠算法,20%靠经验我希望通过多因子模型去解决“选”的问题。 市场是有统计规律的,为什...

用多因子策略构建强大的加密资产投资组合 #理论基础篇#
前言在去年6月份,我设想了用多因子模型去择币的简单构思。 https://mirror.xyz/lucidafund.eth/UdOfxxKgD_Xuc_KrvGvsjrWZZCwKlWPAYNx991ZgmIA nft://undefined/undefined/undefined?showBuying=true&showMeta=true 一年后,我们已经着手研发针对加密资产市场的多因子策略,并把整体的策略框架写成系列的文章《用多因子策略构建强大的加密资产投资组合》。 本系列的大体框架如下(不排除微调的可能):一、多因子模型理论基础 二、单因子构建因子数据预处理数据筛选异常值处理:极值、错误值、空值标准化中性化:行业、市场、市值因子有效性判断信息比率IC、收益率、夏普比率、换手率三、大类因子合成因子共线性分析正交消除因子共线性经典加权方法→合成因子等权、滚动IC加权、IC_IR加权合成因子的测试:收益率、分组收益率、因子值加权收益率、合成因子IC、分组换手率其他加权方法(因子与收益率存在非线性关系):机器学习、强化学习(由于加密货币行业的特殊性,不考虑)四、风险组合优化以下是...

用多因子策略构建强大的加密资产投资组合 #数据预处理篇#
前言书接上回,我们发布了《用多因子策略构建强大的加密资产投资组合》系列文章的第一篇 - 理论基础篇,本篇是第二篇 - 数据预处理篇。 在计算因子数据前/后,以及测试单因子的有效性之前,都需要对相关数据进行处理。具体的数据预处理涉及重复值、异常值/缺失值/极端值、标准化和数据频率的处理。一、重复值数据相关定义:键(Key):表示一个独一无二的索引。eg. 对于一份有全部token所有日期的数据,键是“token_id/contract_address - 日期”值(Value):被键索引的对象就称之为“值”。诊断重复值的首先需要理解数据“应当”是什么样子。通常数据的形式有:时间序列数据(Time Series)。键是“时间”。eg.单个token5年的价格数据横截面数据(Cross Section)。键是“个体”。eg.2023.11.01当日crypto市场所有token的价格数据面板数据(Panel)。键是“个体-时间”的组合。eg.从2019.01.01-2023.11.01 四年所有token的价格数据。原则:确定了数据的索引(键),就能知道数据应该在什么层面没有重复值。检...
Lucida is a quantitative hedge fund. Falcon is a Web3 investment infra.

Subscribe to LUCIDA & FALCON

Subscribe to LUCIDA & FALCON
Share Dialog
Share Dialog


<100 subscribers
<100 subscribers
随着Sora的发布,AI最近又火了一把,AI板块也涨疯了。

这两年Bloomberg / Wind / Tiger Broker等传统金融机构也相继发布了自己的垂直大模型应用。Crypto行业里,Dune等诸多产品也集成了AI或者干脆发布了垂直GPT,我差不多都体验了一遍。

对于”AI对二级市场投资的影响“,我个人的看法是:AI有用,但大语言模型的作用非常有限。
原因是:二级市场的核心竞争力是方法论和认知层次对市场上其他对手盘的碾压,而不是靠生产力的碾压。
好的(量化)交易员通过长期在市场中摸爬滚打,充分地理解市场特征,从而形成一套稳定可量化的交易策略。而水平不够的交易者会因为稳定亏损从而被市场淘汰,自此市场完成”良币驱逐劣币“的进化过程,赚钱会越来越难。
所以,想要战胜市场稳定盈利,你要比市场进化得更快,对市场上其他的参与者理解更深,这是一种方法论和认知层次上的胜利,也是二级市场的核心竞争力。绝大多数情况下,市场的共识都是风险因子,所以“寻找非共识“是一个(量化)交易员最重要的能力,也是认知层次高的一种体现。
说得再深入一些,这种能力是和你读没读CFA/金工没直接关系,如果读好CFA/金工就能赚钱,那在二级市场赚钱可容易太多了。一个生活常识是,在任何行业,你想赚钱总得有绝大部分人都没有的东西,这才是竞争力,它可以是资源/资本/认知/方法论/经验等等。
所以,所有试图帮你直接或用极低成本赚大钱的人/事/项目,都可以归类到非坏即蠢的范畴。
说回AI。从我目前能公开体验到的最先进的大语言模型GPT4来看,模型对于世界的理解和认知明显不如人类,它的优势在于提高了生产力,水平接近本科生。所以,这并不符合我们上述提到的二级市场的核心竞争力。所以等到GPT对世界认知和理解接近甚至领先于人类,对于二级市场投资来说,才会产生重大的革命性的影响。
而且从目前来看,Crypto行业内的大语言模型的表现和GPT3.5都还有代差,更别提GPT4了。所以用垂直的GPT去交易Crypto,或者为用户提供交易决策,任重而道远。
那AI对于二级市场投资是不是到底没有用呢?有。 大概有几个方向:
1、挖因子:传统金融市场里少数非常头部的对冲基金是靠ML/DL的模型来挖因子,相比于传统的靠人来挖因子,这种模式主要是在因子数量上取胜,相对牺牲因子质量,但这不是行业主流,而且这对团队能力的要求非常高。
2、清洗/加工数据:比如用ML优化数据集里的缺失值/异常值、识别MEV Bot的成交量等等。
3、算法交易:主要应用在市场的盘口/订单簿等微观结构中。
4、加工另类因子:分析新闻/社交媒体上的内容,并分析他是Positive还是Negative的,甚至去打分。
5、用GPT整理自然语言数据:比如SEC的Electronic Data Gathering, Analysis, and Retrieval中的上市公司财报都是文本格式的,用GPT整理成加工成结构化的数据,这个效果应该能做的不错。
我目前能想到的大概就这么几点,如果有遗漏的,欢迎补充。通过上面这几个场景,我们可以发现几点规律:
1、2、3场景,在GPT流行之前就已经挺成熟了。
4、5主要是属于GPT的应用范畴。4我没试过,但作用估计也比较有限,第一是另类因子在多因子策略里的占比很低,第二是通过这种简单粗暴+低成本挖出来的因子大概率不会好用,好用的话也会很快失效。5的作用还是提高生产力。
以上所有场景都是基于某一个非常非常非常具体的小环节会用到AI,而不是直接用AI帮你做交易/投资,因为它对于市场的认知层次太低了,此外金融行业的信噪比也太低,和智能驾驶等领域完全比不了。
以这种视角来看Crypto领域中的AI产品,Dune的思路还算是相对合理的,它并没有尝试去做智能投顾的角色给你直接的交易信号,当然这个产品也不是这个定位,它还是在用AI帮你提高生产效率,因为写SQL对普通用户的门槛确实太高了,尽管它现在并不是很智能…

Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
随着Sora的发布,AI最近又火了一把,AI板块也涨疯了。

这两年Bloomberg / Wind / Tiger Broker等传统金融机构也相继发布了自己的垂直大模型应用。Crypto行业里,Dune等诸多产品也集成了AI或者干脆发布了垂直GPT,我差不多都体验了一遍。

对于”AI对二级市场投资的影响“,我个人的看法是:AI有用,但大语言模型的作用非常有限。
原因是:二级市场的核心竞争力是方法论和认知层次对市场上其他对手盘的碾压,而不是靠生产力的碾压。
好的(量化)交易员通过长期在市场中摸爬滚打,充分地理解市场特征,从而形成一套稳定可量化的交易策略。而水平不够的交易者会因为稳定亏损从而被市场淘汰,自此市场完成”良币驱逐劣币“的进化过程,赚钱会越来越难。
所以,想要战胜市场稳定盈利,你要比市场进化得更快,对市场上其他的参与者理解更深,这是一种方法论和认知层次上的胜利,也是二级市场的核心竞争力。绝大多数情况下,市场的共识都是风险因子,所以“寻找非共识“是一个(量化)交易员最重要的能力,也是认知层次高的一种体现。
说得再深入一些,这种能力是和你读没读CFA/金工没直接关系,如果读好CFA/金工就能赚钱,那在二级市场赚钱可容易太多了。一个生活常识是,在任何行业,你想赚钱总得有绝大部分人都没有的东西,这才是竞争力,它可以是资源/资本/认知/方法论/经验等等。
所以,所有试图帮你直接或用极低成本赚大钱的人/事/项目,都可以归类到非坏即蠢的范畴。
说回AI。从我目前能公开体验到的最先进的大语言模型GPT4来看,模型对于世界的理解和认知明显不如人类,它的优势在于提高了生产力,水平接近本科生。所以,这并不符合我们上述提到的二级市场的核心竞争力。所以等到GPT对世界认知和理解接近甚至领先于人类,对于二级市场投资来说,才会产生重大的革命性的影响。
而且从目前来看,Crypto行业内的大语言模型的表现和GPT3.5都还有代差,更别提GPT4了。所以用垂直的GPT去交易Crypto,或者为用户提供交易决策,任重而道远。
那AI对于二级市场投资是不是到底没有用呢?有。 大概有几个方向:
1、挖因子:传统金融市场里少数非常头部的对冲基金是靠ML/DL的模型来挖因子,相比于传统的靠人来挖因子,这种模式主要是在因子数量上取胜,相对牺牲因子质量,但这不是行业主流,而且这对团队能力的要求非常高。
2、清洗/加工数据:比如用ML优化数据集里的缺失值/异常值、识别MEV Bot的成交量等等。
3、算法交易:主要应用在市场的盘口/订单簿等微观结构中。
4、加工另类因子:分析新闻/社交媒体上的内容,并分析他是Positive还是Negative的,甚至去打分。
5、用GPT整理自然语言数据:比如SEC的Electronic Data Gathering, Analysis, and Retrieval中的上市公司财报都是文本格式的,用GPT整理成加工成结构化的数据,这个效果应该能做的不错。
我目前能想到的大概就这么几点,如果有遗漏的,欢迎补充。通过上面这几个场景,我们可以发现几点规律:
1、2、3场景,在GPT流行之前就已经挺成熟了。
4、5主要是属于GPT的应用范畴。4我没试过,但作用估计也比较有限,第一是另类因子在多因子策略里的占比很低,第二是通过这种简单粗暴+低成本挖出来的因子大概率不会好用,好用的话也会很快失效。5的作用还是提高生产力。
以上所有场景都是基于某一个非常非常非常具体的小环节会用到AI,而不是直接用AI帮你做交易/投资,因为它对于市场的认知层次太低了,此外金融行业的信噪比也太低,和智能驾驶等领域完全比不了。
以这种视角来看Crypto领域中的AI产品,Dune的思路还算是相对合理的,它并没有尝试去做智能投顾的角色给你直接的交易信号,当然这个产品也不是这个定位,它还是在用AI帮你提高生产效率,因为写SQL对普通用户的门槛确实太高了,尽管它现在并不是很智能…

Lucida (https://www.lucida.fund/ )是行业领先的量化对冲基金,在2018年4月进入Crypto市场,主要交易CTA / 统计套利 / 期权波动率套利等策略,现管理规模3000万美元。
Falcon (https://falcon.lucida.fund /)是新一代的Web3投资基础设施,它基于多因子模型,帮助用户“选”、“买”、“管”、“卖”加密资产。Falcon在2022年6月由Lucida所孵化。
No activity yet