预测|基于TabNet与高频指标的期货预测模型
量化投资与机器学习微信公众号 , 是业内垂直于量化投资、对冲基金、Fintech、人工智能、大数据等领域的主流自媒体 。 公众号拥有来自公募、私募、券商、期货、银行、保险、高校等行业30W+关注者 , 荣获2021年度AMMA优秀品牌力、优秀洞察力大奖 , 连续2年被腾讯云+社区评选为“年度最佳作者” 。
标题:Order Flow, Technical Analysis And Neural Network: Predicting Short-term Direction Of Futures Contract本文使用传统的技术指标与高频指标结合 , 并使用了TabNet模型对白银期货未来15分钟的收益率构建分类模型 。 并基于分类模型给出的概率构建了回测 , 测试结果显示 , 模型预测准确度超过60% 。 对于想使用深度学习模型应用到CTA策略的场景有一定的借鉴意义 。
来源:techrxiv
作者:Yiyang Zheng
特征
传统技术指标
基于1分钟的K线数据计算以下传统技术指标:
文章图片
文章图片
文章图片
高频技术指标
高频技术指标主要根据订单流数据计算出近80个指标:
Bid-Ask Spread
首先计算当前快照数据i前K(K=1,2,3,4,5)档bid-ask价差的累计值AccumulatedSpread:
然后计算AccumulatedSpread的滚动均值:
文中 , 对于每个快照都计算过去m=5,10,15,30分钟的AverageAccumnulatedSpread , 所以这一共20个指标 。
Volume imbalance
【预测|基于TabNet与高频指标的期货预测模型】和AccumulatedSpread计算类似 , 首先计算当前快照数据i前K(K=1,2,3,4,5)档bid-ask订单量的累计值AccumulatedVolumeImbalance:
然后计算AccumulatedSpread的过去m=5,10,15,30分钟的滚动均值 , 共计20个特征:
Snapshot Type
根据以下逻辑把快照数据分为四个类型:
文章图片
然后 , 统计过去m=5,10,15,30分钟 , 四种不同类型的快照的占比 , 总计16个指标:
接着 , 同样用上面的逻辑 , 但过滤掉10手以下的数据点 , 只统计大单类型的占比 , 同样也有16个指标:
Open Close Percentage
首先计算快照i持仓量和成交量的变化:
那么快照i时共现的开仓量openContract和平仓量closeContract应该满足以下关系:
从上式可以求出:
然后 , 可以计算过去m=5,10,15,30分钟开平仓的比率 , 共4个指标:
Open Interest Percentage
根据以上信息 , 也可以计算过去m=5,10,15,30分钟持仓变动的比率 , 共4个指标:
模型
本文使用了TabNet模型 , TabNet是一种针对于表格数据的神经网络 , 它通过类似于加性模型的顺序注意力机制(sequential attention mechanism)实现了instance-wise的特征选择 , 还通过encoder-decoder框架实现了自监督学习 , 从而将树模型的可解释性与DNN的表征能力很好地结合到了一起 。 模型主要的参数设置如下:
模型的特征为前文涉及的近百个特征 , 预测的目标为未来15分钟的收益率变动的方向 , 上涨为1 , 下跌为0(训练数据组去除了价格未发生变动的样本) 。 关于收益率的计算 , 作者做了些调整 , 具体定义如下:
- 首先在快照数据上 , 使用2分钟的滚动窗口 , 计算每个快照前两分钟的VWAP价格;
- 基于以上VWAP计算15分钟的收益率 。
数据使用的是上期所白银期货近月连续合约 , 其中2018年1月1日至2021年8月31日的数据为训练数据 , 2021年9月1日至2021年12月1日的数据为测试数据 。 模型表现如下:
文章图片
最后 , 基于以下逻辑进行回测 , 也就是说 , 最终根据模型给出的预测上涨下跌的概率进行开仓 , 未加任何止损止盈:
文章图片
在两个月的样本外测试 , 取得了20.48%的收益 , 但最大回测有24.08% 。
文章图片
总结
本文就是传统的使用技术指标结合机器学习构建预测模型的案例 , 有几点可以借鉴:
推荐阅读
- IT|碳酸锂价格飙升 大摩预测电池成本或上涨四分之一 电动汽车涨价15%
- 新知|基于两架望远镜数据,天文学家绘出银河系早期演化图像│新知
- 预测|AI用5秒准确预测患者5年内心脏病发作风险
- 硬件|瑞芯微与诠视科技达成战略合作 共同打造基于RK3588平台的XR解决方案
- 主要基于|诺基亚贝尔、联发科、中国移动完成 5G 下行三载波聚合应用
- 二氧化碳|海温可用于预测全球大气甲烷变化
- 传统|波动率预测:深度学习VS传统计量模型
- Spaces|高通与 Square Enix 将基于 Snapdragon Spaces 合作,打造 XR 体验
- and|香港置地邀你参加2022年置慧杯,预测大型商业综合体能耗数据
- AMD|传闻AMD基于MCM的RX 7000 GPU将比NVIDIA RTX 4000效率更高