一些不常见的高频因子,分享给有缘人。
写得比较随意,大致有几块:Order aggressiveness、order book shape、撤单、事件聚集、订单薄韧性、异常挂单、逐笔。
(1)订单侵略性,其实就是挂单的激进程度。假设你是买家,你挂单的价格越高,你就越激进;反过来,你是卖家,你挂单价格越低,你越是激进的卖家。举个例子,买家挂单越接近bid1,越激进;卖家挂单越接近ask1,越激进;
(2)订单侵略性,体现了买家/卖家完成交易的迫切程度。通过整个订单薄,我们可以知道所有买家整体的激进程度、和所有卖家整体的激进程度;通过这个,就能构建一系列因子了。此外,买卖aggressiveness的差异,也是一系列因子;
(3)一个订单的执行概率和订单薄的厚度、参与者对即将到来的订单的预期有关;买盘越厚,一个潜在的买家下market order的概率更大;这套说法对卖方同样适用;bid ask的厚度体现了看涨和看跌者的相对力量。
(4)不要用静态的思维来看待订单薄,要从动态的角度来分析。订单薄性质的变化,体现了多空力量的动态变化,是未来价格走势的重要体现;在这个问题上,时间序列的建模是很有必要的。
(1)order book shape,就是订单薄所呈现的形状。
(2)很多学术研究表明,股票的order book的平均形态就是Humped,就是整个订单薄上有一块隆起的地方;
(3)个股来说,我觉得,离不开几种情况。第一,就是Humped,只是这个顶点不同,而且可能随着时间的变化而变化;第二,可能是双峰的、甚至是多峰的Humped;第三,可能是没有峰,就是矩形分布;第四,可能就在某些档位有分布;第五,可能是单调的,比如从第一档往后几乎单调上升或者下降,单调的函数可以是线性的,也可以是concave或者convex;
(4)上面,是从全局的角度来描述LOB(limit order book简称,下同) 状态的一种方法。也可以只关注一些特殊的点,比如,在某个偏离bid/ask的位置有个奇怪的大单;然后,还要加入时间维度。前面两个,都是静态的、截面的。
(5)humped位置:很多实证研究,都表明,LOB的平均形态,就是humped,只是这个humped的位置不同,这个顶点的位置,可以作为一个因子。比如,买单的顶点位置,是位于0-10%、10-20%等的哪个位置;此外,还需要关注这个hump位置随时间的迁移。
(6)order book slope:订单薄斜率,描述订单薄上的价格和该价格处的挂单量之间的关系。这个slope属于shape的分支,其含义和aggressiveness类似;
(1)撤单行为,不仅反映了交易者的观点的变化,还会影响其他交易者;根据买卖双方各自的撤单量、撤单金额、撤单价位、大单超大单的撤单情况,可以构建很多因子;
(2)和订单薄不同,撤单类因子,是一个流量变量,它需要考虑一个时间段的因子;构建撤单因子时,一定不要独立地看待某段时间的撤单行为,而需要结合实际的成交情况,这才是这段时间内多空双方博弈的信息全集(相对的);
(3)fleeting order:即挂单后短时间内又撤掉的订单;除了正常交易情况下撤单去追跑掉的价格外,fleeting order还有欺骗对手的作用,挂单者想制造假象,以诱导其他投资者(spoofing order);比如,前面降了order book shape,如果你采用了这种因子进行交易,那么你的对手以通过fleeting order来扰乱order book,从而让你的系统发出虚假的信号;
(1)定义一些事件,比如撤单、挂买一单、超大买卖单出现,然后在一段时间内统计事件发生的频率,可以构建很多个系列的因子;这是高频数据低频化的常见思路;
(2)一些事件具有聚集的特性,原因有:交易者拆分大单来掩盖交易意图;交易者之间的模仿;不同交易者对新闻的反应(反应是一致的,只是有先有后);为了在竞价上击败其他交易者;
(1)如果来了个大的市价卖单,然后,当然,买单被吃掉很多;但是通常会回复一部分。比如,有个100手的市价卖单,刚好吃掉了所有报价21元以上的单;后来,21元以上的买单恢复了80手。那么,这个回复能力,就是80%。
(2)订单薄韧性,反映了一部分股票的属性。是个很有意思的因子。
(1)有时候,在原理买一和卖一的地方(比如涨停价跌停价,会存在大量挂单。正常情况下,这些订单几乎不可能成交。
(2)类似这样的异常挂单,十分重要。依据这些数据来构建的因子,很有信息量。
(1)判断一笔交易属于主动买还是主动卖,通常以一笔交易的买卖双方的订单到底先后顺序来定;
(2)在实际中,逐笔交易买卖单判断十分重要;像我们常见的资金流这类指标,就是这么计算的;
(3)逐笔数据可以构建的因子很多,主动买卖算一类;
(4) 举例:日内累计主买率、日内累计资金净流入、日内累计大单资金流入率、日内累计小单资金流入率,等等;
一些不常见的高频因子,分享给有缘人。
写得比较随意,大致有几块:Order aggressiveness、order book shape、撤单、事件聚集、订单薄韧性、异常挂单、逐笔。
(1)订单侵略性,其实就是挂单的激进程度。假设你是买家,你挂单的价格越高,你就越激进;反过来,你是卖家,你挂单价格越低,你越是激进的卖家。举个例子,买家挂单越接近bid1,越激进;卖家挂单越接近ask1,越激进;
(2)订单侵略性,体现了买家/卖家完成交易的迫切程度。通过整个订单薄,我们可以知道所有买家整体的激进程度、和所有卖家整体的激进程度;通过这个,就能构建一系列因子了。此外,买卖aggressiveness的差异,也是一系列因子;
(3)一个订单的执行概率和订单薄的厚度、参与者对即将到来的订单的预期有关;买盘越厚,一个潜在的买家下market order的概率更大;这套说法对卖方同样适用;bid ask的厚度体现了看涨和看跌者的相对力量。
(4)不要用静态的思维来看待订单薄,要从动态的角度来分析。订单薄性质的变化,体现了多空力量的动态变化,是未来价格走势的重要体现;在这个问题上,时间序列的建模是很有必要的。
(1)order book shape,就是订单薄所呈现的形状。
(2)很多学术研究表明,股票的order book的平均形态就是Humped,就是整个订单薄上有一块隆起的地方;
(3)个股来说,我觉得,离不开几种情况。第一,就是Humped,只是这个顶点不同,而且可能随着时间的变化而变化;第二,可能是双峰的、甚至是多峰的Humped;第三,可能是没有峰,就是矩形分布;第四,可能就在某些档位有分布;第五,可能是单调的,比如从第一档往后几乎单调上升或者下降,单调的函数可以是线性的,也可以是concave或者convex;
(4)上面,是从全局的角度来描述LOB(limit order book简称,下同) 状态的一种方法。也可以只关注一些特殊的点,比如,在某个偏离bid/ask的位置有个奇怪的大单;然后,还要加入时间维度。前面两个,都是静态的、截面的。
(5)humped位置:很多实证研究,都表明,LOB的平均形态,就是humped,只是这个humped的位置不同,这个顶点的位置,可以作为一个因子。比如,买单的顶点位置,是位于0-10%、10-20%等的哪个位置;此外,还需要关注这个hump位置随时间的迁移。
(6)order book slope:订单薄斜率,描述订单薄上的价格和该价格处的挂单量之间的关系。这个slope属于shape的分支,其含义和aggressiveness类似;
(1)撤单行为,不仅反映了交易者的观点的变化,还会影响其他交易者;根据买卖双方各自的撤单量、撤单金额、撤单价位、大单超大单的撤单情况,可以构建很多因子;
(2)和订单薄不同,撤单类因子,是一个流量变量,它需要考虑一个时间段的因子;构建撤单因子时,一定不要独立地看待某段时间的撤单行为,而需要结合实际的成交情况,这才是这段时间内多空双方博弈的信息全集(相对的);
(3)fleeting order:即挂单后短时间内又撤掉的订单;除了正常交易情况下撤单去追跑掉的价格外,fleeting order还有欺骗对手的作用,挂单者想制造假象,以诱导其他投资者(spoofing order);比如,前面降了order book shape,如果你采用了这种因子进行交易,那么你的对手以通过fleeting order来扰乱order book,从而让你的系统发出虚假的信号;
(1)定义一些事件,比如撤单、挂买一单、超大买卖单出现,然后在一段时间内统计事件发生的频率,可以构建很多个系列的因子;这是高频数据低频化的常见思路;
(2)一些事件具有聚集的特性,原因有:交易者拆分大单来掩盖交易意图;交易者之间的模仿;不同交易者对新闻的反应(反应是一致的,只是有先有后);为了在竞价上击败其他交易者;
(1)如果来了个大的市价卖单,然后,当然,买单被吃掉很多;但是通常会回复一部分。比如,有个100手的市价卖单,刚好吃掉了所有报价21元以上的单;后来,21元以上的买单恢复了80手。那么,这个回复能力,就是80%。
(2)订单薄韧性,反映了一部分股票的属性。是个很有意思的因子。
(1)有时候,在原理买一和卖一的地方(比如涨停价跌停价,会存在大量挂单。正常情况下,这些订单几乎不可能成交。
(2)类似这样的异常挂单,十分重要。依据这些数据来构建的因子,很有信息量。
(1)判断一笔交易属于主动买还是主动卖,通常以一笔交易的买卖双方的订单到底先后顺序来定;
(2)在实际中,逐笔交易买卖单判断十分重要;像我们常见的资金流这类指标,就是这么计算的;
(3)逐笔数据可以构建的因子很多,主动买卖算一类;
(4) 举例:日内累计主买率、日内累计资金净流入、日内累计大单资金流入率、日内累计小单资金流入率,等等;
test
test
Subscribe to Test
Subscribe to Test
Share Dialog
Share Dialog
<100 subscribers
<100 subscribers
群晖性能调优指南
群晖DSM虽然在易用性方面非常不错,但是系统上的很多机制可以说是非常搓了,我的DS918+,自行添加内存到16G双通道,按理来说,NAS上跑的那点东西,16G内存是完全够用了,但就是这样,群晖也特别喜欢用虚拟内存,导致开机久了,我打开docker控制台,都要等7,8秒 原因就在于,群晖的配置都非常寒酸,那么高的价格只舍得配2G,4G的内存,DSM默认的vm.swappiness值设定为10,内存高的建议修改为1 所以,如果想要提高群晖系统的流畅度,首先就是要加大你的内存,之后修改DSM的vm.swappiness数值 ssh 进群晖,输入如下命令即可,不需要重启(对大部分Linux系统也适用) 目录 临时生效版 永久生效版 添加到群晖计划任务中 添加开机时刷新sysctl.conf 简单说一下vm.swappiness vm.swappiness 优化 相关文章推荐 临时生效版 之前的方法方法,虽说是永久生效,但是群晖并不会读取/etc/sysctl.conf,所以实际上,我们还是要重启后刷新一下sysctl.conf。不如直接开机时就执行修改swappiness的命令,这条命令...
深度学习笔记之约束优化
有时候,在 x 的所有可能值下最大化或最小化一个函数 f(x) 不是我们所希望的。相反,我们可能希望在 x 的某些集合 S 中找 f(x) 的最大值或最小值。这被称为约束优化 (constrained optimization)。在约束优化术语中,集合 S 内的点 x 被称为可行 (feasible) 点。 我们常常希望找到在某种意义上小的解。针对这种情况下的常见方法是强加一个范数约束,如 ∥x∥ ≤ 1。约束优化的一个简单方法是将约束考虑在内后简单地对梯度下降进行修改。如 果我们使用一个小的恒定步长 ϵ,我们可以先取梯度下降的单步结果,然后将结果投影回 S。如果我们使用线搜索,我们只能在步长为 ϵ 范围内搜索可行的新 x 点,或者我们可以将线上的每个点投影到约束区域。如果可能的话,在梯度下降或线搜索前将梯度投影到可行域的切空间会更高效 (Rosen, 1960)。 一个更复杂的方法是设计一个不同的、无约束的优化问题,其解可以转化成原始约束优化问题的解。例如,我们要在 x ∈ R2 中最小化 f(x),其中 x 约束为具有单位 L2 范数。我们可以关于 θ 最小化 g(θ) = ...
用Matrix进行匿名加密的私聊
Matrix是一个强加密、去中心化的即时通信协议,Matrix也有多种开源客户端和服务器实现。Matrix协议,对标的是同为即时通信软件的Telegram,Discord。比起这两者,Matrix无需邮箱和手机号就可以注册,免除个人信息泄露之忧。本文介绍Matrix协议和它的一个客户端Element(原名Riot.im)。下文为了方便起见,统称为Matrix。 Element桌面和移动客户端截图 Element桌面和移动客户端截图 Matrix有很多优点,包括: 隐私:注册Matrix不需要邮箱和手机号,只需要用户名和密码。使用Matrix无需担心手机号和邮箱泄露的危险。 安全加密:Matrix私聊和群聊是端到端加密的,即使是服务器的所有者,也无法看到用户的聊天内容。 开源:Matrix客户端和服务器软件全部开源,任何人都可以审查代码,检查代码中的漏洞。有兴趣的人也可以用开源代码搭建自己的Matrix服务器。 去中心化:Matrix是联邦式协议,Matrix网络由分布在世界各地,由不同个人和组织运营的服务器组成,因此Matrix协议不容易被单个组织垄断。Matrix网络组成结构 ...
群晖性能调优指南
群晖DSM虽然在易用性方面非常不错,但是系统上的很多机制可以说是非常搓了,我的DS918+,自行添加内存到16G双通道,按理来说,NAS上跑的那点东西,16G内存是完全够用了,但就是这样,群晖也特别喜欢用虚拟内存,导致开机久了,我打开docker控制台,都要等7,8秒 原因就在于,群晖的配置都非常寒酸,那么高的价格只舍得配2G,4G的内存,DSM默认的vm.swappiness值设定为10,内存高的建议修改为1 所以,如果想要提高群晖系统的流畅度,首先就是要加大你的内存,之后修改DSM的vm.swappiness数值 ssh 进群晖,输入如下命令即可,不需要重启(对大部分Linux系统也适用) 目录 临时生效版 永久生效版 添加到群晖计划任务中 添加开机时刷新sysctl.conf 简单说一下vm.swappiness vm.swappiness 优化 相关文章推荐 临时生效版 之前的方法方法,虽说是永久生效,但是群晖并不会读取/etc/sysctl.conf,所以实际上,我们还是要重启后刷新一下sysctl.conf。不如直接开机时就执行修改swappiness的命令,这条命令...
深度学习笔记之约束优化
有时候,在 x 的所有可能值下最大化或最小化一个函数 f(x) 不是我们所希望的。相反,我们可能希望在 x 的某些集合 S 中找 f(x) 的最大值或最小值。这被称为约束优化 (constrained optimization)。在约束优化术语中,集合 S 内的点 x 被称为可行 (feasible) 点。 我们常常希望找到在某种意义上小的解。针对这种情况下的常见方法是强加一个范数约束,如 ∥x∥ ≤ 1。约束优化的一个简单方法是将约束考虑在内后简单地对梯度下降进行修改。如 果我们使用一个小的恒定步长 ϵ,我们可以先取梯度下降的单步结果,然后将结果投影回 S。如果我们使用线搜索,我们只能在步长为 ϵ 范围内搜索可行的新 x 点,或者我们可以将线上的每个点投影到约束区域。如果可能的话,在梯度下降或线搜索前将梯度投影到可行域的切空间会更高效 (Rosen, 1960)。 一个更复杂的方法是设计一个不同的、无约束的优化问题,其解可以转化成原始约束优化问题的解。例如,我们要在 x ∈ R2 中最小化 f(x),其中 x 约束为具有单位 L2 范数。我们可以关于 θ 最小化 g(θ) = ...
用Matrix进行匿名加密的私聊
Matrix是一个强加密、去中心化的即时通信协议,Matrix也有多种开源客户端和服务器实现。Matrix协议,对标的是同为即时通信软件的Telegram,Discord。比起这两者,Matrix无需邮箱和手机号就可以注册,免除个人信息泄露之忧。本文介绍Matrix协议和它的一个客户端Element(原名Riot.im)。下文为了方便起见,统称为Matrix。 Element桌面和移动客户端截图 Element桌面和移动客户端截图 Matrix有很多优点,包括: 隐私:注册Matrix不需要邮箱和手机号,只需要用户名和密码。使用Matrix无需担心手机号和邮箱泄露的危险。 安全加密:Matrix私聊和群聊是端到端加密的,即使是服务器的所有者,也无法看到用户的聊天内容。 开源:Matrix客户端和服务器软件全部开源,任何人都可以审查代码,检查代码中的漏洞。有兴趣的人也可以用开源代码搭建自己的Matrix服务器。 去中心化:Matrix是联邦式协议,Matrix网络由分布在世界各地,由不同个人和组织运营的服务器组成,因此Matrix协议不容易被单个组织垄断。Matrix网络组成结构 ...
No activity yet