团队|鱼和熊掌不可兼得？清华团队提出高准确率的可解释分类模型( 六 )_离散|解释性|Layer|准确率|分类

可以看出， RRL 显著优于其他可解释模型，只有两个复杂模型，即 LightGBM 和 XGBoost 有着相当的结果。此外， RRL 在所有数据集上均取得了较好的结果，这也证明了 RRL 良好的可扩展性。
表 2：13 个数据集上各模型的分类效果（五折交叉验证的 F1 Score）
模型复杂度
可解释模型追求在确保准确率可接受的前提下，尽可能降低模型复杂度。如果模型分类效果太差，那么再低的模型复杂度也没有意义。因此，从业人员真正关心的是模型分类效果与复杂度之间的关系。
考虑到存在规则复用的情况，论文使用边的总数而不是规则总数来衡量基于规则的模型的复杂度（可解释性）。 RRL ， CART ， CRS 以及 XGBoost 的模型复杂度与模型分类效果之间的关系如图 4 所示，其中横轴为复杂度，纵轴为分类效果。可以看出，相比其他规则模型和集成模型， RRL 能够更加高效地利用规则，即用更低的模型复杂度获得更好的分类效果。结果还表明，通过参数设置， RRL 可以轻松地在模型复杂度和分类性能间进行权衡。

文章图片

图 4：RRL 与基线模型的模型复杂度与分类效果散点图。
消融实验
离散模型训练方法
通过训练结构相同的 RRL ，作者将梯度嫁接法与 STE（Courbariaux et al., 2015, 2016）， ProxQuant（Bai et al., 2018）以及 RB（Wang et al., 2020）这三类离散模型训练方法进行了对比，训练损失函数结果如图 5 所示。由于 RRL 本身特殊的结构（即在离散点处的梯度具有极少的信息），只有使用梯度嫁接法训练的 RRL 才能够很好的收敛。
改进的逻辑激活函数
改进前后的逻辑激活函数的结果同样在图 5 中展示。可以看出，当处理大规模数据时，逻辑激活函数会发生梯度消失的问题，从而导致不收敛。而改进后的逻辑激活函数则克服了该问题。

文章图片

图 5：梯度嫁接和另外三种离散模型训练方法的训练损失，以及使用改进前后的逻辑激活函数的训练损失。
实例展示
权重分布
图 6 展示的是不同正则项系数所对应的 RRL 线性层权重（规则重要度）的分布情况。当正则项系数比较小时， RRL 产生的规则比较复杂，数量较多。但从分布可以看出，大多数是权重绝对值较小的规则。因此，可以先去理解权重值较大的重要规则，当对模型整体和数据有了更好的认识后，再去理解权重较小的规则。而当正则项系数较大时， RRL 整体复杂度较低，则可以直接理解模型整体。

团队|鱼和熊掌不可兼得？清华团队提出高准确率的可解释分类模型( 六 )

推荐阅读

如何找寻自我

缝纫机调线器怎么安装平车方法如何

强组词强字组词

火笋鸡翅的做法（增肥食谱）

闺女生日快乐祝福语朋友圈

LV请来潮牌设计师做艺术总监，看中的是啥

老虎豆怎么做好吃老虎豆图片怎样弄来吃

暖气有流水声是什么原因

皮球是什么体

手机怎样开通QQ空间

男生发mua说明 mua是什么意思

手指盖凹陷怎么回事

对自己的生活失去掌控咋调整

小米10s怎么没有月亮模式

我想找个偏僻的地方搞养殖！有没有推荐的地方？

南京养老金认证上门服务怎么申请南京市养老金认证

如何评价猪场阉割猪？

最后一个字是豹的成语

泰山散酒怎么样

猫发情的声音(猫发情的叫声)