常用的消偏技术和策略

针对数据偏差，常用的消偏技术有如下三类。

(1)重调权(Re-Weighting)：该类方法的出发点是通过样本权重来调控每一条样本对模型训练的影响。

(2)重标注(Re-Labeling)：该类方法的出发点是为缺失或者有偏的数据重新设置一个伪标签(label)。

(3)生成模型(Generative Modeling)：假设偏差数据的生成过程，通过模型策略消除偏差影响。

图3给出了一些数据偏差消偏常用的策略和方法。

选择偏差常用的消偏方法有数据填充、倾向打分、双重鲁棒模型及生成模型等。

其中数据填充属于重标注，倾向打分属于重调权，双重鲁棒模型是结合了重标注和重调权的消偏方法。

针对一致性偏差也可以将用户行为和打分分解为用户兴趣和从众心理影响两部分，通过引入特定的参数对一致性偏差进行消偏。还有最近几年比较火的基于逆倾向分(Inverse Propensity Score，IPS)的建模思路可以解决多种偏差问题。关于这些消偏技术在此不做展开介绍，感兴趣的读者可以查阅相关的参考文献。

前文所述的偏差问题很多时候是没有严格的区别或者划分界限的，相应的消偏策略和方法很多时候也是相通的。下面以推荐中最典型的位置偏差为例，介绍一些工业界最常使用的方法。

位置消偏最常用的方法之一是将位置信息作为模型特征加入点击率预估模型中，这是最简单且代价最小的位置消偏策略。将位置编码作为模型特征，在训练时输入实际曝光的位置信息。在预测时，因为曝光位置还未确定，位置特征统一取默认值。借由位置特征学习到的后验信息纠正位置偏差的影响。

华为发表在 RecSys2019 上的 PAL 是位置消偏比较经典的工作之一。首先，PAL 将用户点击广告的概率拆分为广告被看到的概率和看到后被点击的概率，如式(1)所示。

然后，作者又做了进一步的假设：

(1)用户是否看到广告只与广告的位置有关；

(2)用户看到广告后，是否点击广告与广告的位置无关。于是式(1)可以进一步简化为式(2)，基于此，我们就可以单独建模位置的影响。

如图4所示，通过单独的网络建模位置信息，可以得到广告被看到的概率 ProbSeen。pCTR 部分是广告被看到后的点击概率。

如式(3)所示， PAL 的损失函数是两者的结合。当线上预估广告的曝光点击率时，只使用黑框部分的网络模型预估 pCTR 即可。

如图4所示，通过单独的网络建模位置信息，可以得到广告被看到的概率 ProbSeen。pCTR 部分是广告被看到后的点击概率。

该模型是在主模型的基础上，另外添加一个浅层偏差网络。浅层偏差网络的输入是包括位置信息、设备信息等影响用户选择偏差的特征。线上预测时也只使用主网络部分。