Maximum Mean Discrepancy

MMD

Maximum Mean Discrepancy (MMD)[1][2] 是一个衡量两个分布差异的指标。具体而言,设 p,qX 上的概率分布,给定从 p 采样出的独立同分布样本 X={x1,,xm} 以及从 q 采样出的独立同分布样本 Y={y1,,yn},我们询问 p 是否等于 q

MMD 启发自如下定理。

定理 1:设 (X,d) 是一个可分的度量空间,p,qX 上的两个 Borel 概率测度,则: p=qEp[f(x)]=Eq[f(x)],fC(X) 其中 C(X) 表示 X 上所有连续有界泛函。

基于上述定理,当 p=q 时总有 Ep[f(x)]Eq[f(x)]=0,因此用这个差值作为衡量指标似乎是一个不错的选择。不过这个差值还依赖于 f 的选取,一个自然的想法是选择使得差值最大的那个 f. 综上,我们得到了 MMD 的定义。

定义 (MMD):设 FX 上的泛函的集合,p,q,X,Y 如上文所定义。定义 MMD 为: MMD[F,p,q]:=supfF(Ep[f(x)]Eq[f(x)]) 当取 F=C(X) 我们就回到了定理 1 的情形,但是对于实际求解而言,C(X) 的范围太大了。因此,MMD 作者将 F 限制为 universal 再生核希尔伯特空间 (RKHS) 中的单位球。若加入 X 是紧的这一条件,那么 universal RKHS 在 C(X) 中在 L 范数下是稠密的。这引出了下面的定理,表明限制 F 为 universal RKHS 中的单位球是可行的。

定理 2:设 X 是一个紧的度量空间,HX 上的泛函构成的 universal RKHS,相应的再生核为 k(,). 设 FH 中的单位球,则: p=qMMD[F,p,q]=0 选择 RKHS 的好处在于,利用再生核的再生性,我们能很方便地计算 MMD. 具体而言,设 ϕ(x)=k(,x)H,则根据再生性有: f(x)=f,ϕ(x)H 因此 MMD 可以写作: MMD[F,p,q]=supfH1(Ep[f(x)]Eq[f(x)])=supfH1(Epf,ϕ(x)HEqf,ϕ(x)H)=supfH1(f,Ep[ϕ(x)]Hf,Eq[ϕ(x)]H)=supfH1f,Ep[ϕ(x)]Eq[ϕ(x)]H=Ep[ϕ(x)]Eq[ϕ(x)]H 其中 Ep[ϕ(x)]H 称作分布 p 的核均值嵌入 (kernel mean embedding). 可以看见,MMD 本质上就是 RKHS 中两个点的距离。

使用样本近似期望,得到 MMD 的经验估计: MMD[F,X,Y]=1mi=1mϕ(xi)1ni=1nϕ(yi)H

值得注意的是这个估计其实是有偏的。进一步地,取平方得: MMD[F,X,Y]2=1mi=1mϕ(xi)1ni=1nϕ(yi)H2=1m2i=1mj=1mϕ(xi),ϕ(xj)+1n2i=1nj=1nϕ(yi),ϕ(yj)2mni=1mj=1nϕ(xi),ϕ(yj)=1m2i=1mj=1mk(xi,xj)+1n2i=1nj=1nk(yi,yj)2mni=1mj=1nk(xi,yj)

因此: MMD[F,X,Y]=[1m2i=1mj=1mk(xi,xj)+1n2i=1nj=1nk(yi,yj)2mni=1mj=1nk(xi,yj)]12 这就是我们在实际应用中使用的 MMD 计算公式,其中再生核一般取高斯核或者拉普拉斯核。

References

  1. Gretton, Arthur, Karsten Borgwardt, Malte Rasch, Bernhard Schölkopf, and Alex Smola. A kernel method for the two-sample-problem. Advances in neural information processing systems 19 (2006). ↩︎
  2. Gretton, Arthur, Karsten M. Borgwardt, Malte J. Rasch, Bernhard Schölkopf, and Alexander Smola. A kernel two-sample test. The Journal of Machine Learning Research 13, no. 1 (2012): 723-773. ↩︎
  3. 迁移学习简介之最大均值差异(Maximum Mean Discrepancy) - 姚远的文章 - 知乎. https://zhuanlan.zhihu.com/p/679276071 ↩︎

Maximum Mean Discrepancy
https://xyfjason.github.io/blog-main/2024/07/08/Maximum-Mean-Discrepancy/
作者
xyfJASON
发布于
2024年7月8日
许可协议