最大宽度增广求最大流

一种可以在 O(mlogf(m+nlogn))O(m\log |f|(m+n\log n)) 时间复杂度内求解最大流的诡异方法,其中 f|f| 是最大流流量。方法名称是我自己胡乱翻译的,原名叫:The Fattest Augmenting Path Heuristic。

求解最大流通常使用的是 Ford-Fulkerson 方法,但是各个方法找增广路的方式有所区别。 Edmonds-Karp 找的是最短的增广路,Dinic 则是建立的分层图找增广路,还有其他更多的算法。

本文介绍的找增广路的方法是,找到路径上边权最小值最大的增广路,称为最大宽度增广路

以下均假设图 G=(V,E,c,S,T)G=(V,E,c,S,T),且 n=V,m=En=|V|,m=|E|,且容量限制均为整数(有理数与实数可以通过整数扩充)。

找到源点与汇点之间的最大宽度路径可以使用优先队列 BFS 完成,把 BFS 中的队列换成堆就可以了,时间复杂度为 O(m+nlogn)O(m+n\log n)

我们的首要任务是正名:

命题 11:这样找增广路径则增广次数为 O(mlogf)O(m\log |f|) 级别,其中 f|f| 为最大流流量。

为此我们先证明一个引理:

引理 11:对于任意一个流网络图 G=(V,E,c,S,T)G=(V,E,c,S,T),设其最大流流量为 f|f|,则 GG 中存在一条可行流流量至少是 f/E|f|/|E|

证明:为证明此结论,我们尝试把最大流进行分解。

设图 GG 的最大流为 f:ERf:E\to \mathbb R(也就是说 ff 是一个映射,给出了最大流中边对应的流量),而最大流的流量为 f|f|

我们按照如下方式讲流进行分解:

  1. 找到一条从 SSTT 的路径 pp,满足对于 pp 中的任何边 eef(e)>0f(e)>0
  2. d=minepf(e)d=\min\limits_{e\in p}f(e),然后令所有 pp 中的边的 ff 减去 dd
  3. 如果此时残量网络中的最大流已经降为 00 则退出;否则回到第 11 步继续。

值得注意的是只要有当前残量网络的最大流大于 00,就一定可以找到这样的路径。

这样我们就分解出了若干个可行流 f1,f2,,fkf_1,f_2,\ldots,f_k,这些流并起来是 ff

注意到每次找到一个 fif_i,都会使得至少一条边的 ff 变为 00,所以 kEk\le |E|

又因为 f1++fk=f|f_1|+\cdots + |f_k|=|f|,所以存在一个 1ik1\le i\le k,使得 fkf/E|f_k|\ge |f|/|E|,得证。\Box

那么这时再回到原命题:

证明:设第 ii 次增广完当前的流量为 fif_i,对饮的残量网络为 GiG_i。则 GiG_i 上的最大流显然是 ri=ffir_i=|f|-f_i

根据引理 11 有:fi+1fi+ri2mf_{i+1}\ge f_i+\dfrac{r_i}{2m}(除 2m2m 是因为残量网络上是有反向边的)。

所以:ri+1=ffi+1ffiri2m=ri(112m)r_{i+1}=|f|-f_{i+1}\le |f|-f_i-\dfrac{r_i}{2m}=r_i\left(1-\dfrac 1{2m} \right)

初始时有:f0=0,r0=ff_0=0,r_0=|f|,所以:

rir0(112m)2=f(112m)2fei/2mr_i\le r_0\left(1-\dfrac 1{2m} \right)^2=|f|\left(1-\dfrac 1{2m} \right)^2\le |f|\text{e}^{-i/2m}

故当 i>2mlnfi>2m\ln |f| 时有 ri<1r_i<1,又因为 rir_i 是整数,所以 ri=0r_i=0

所以增广次数级别为 O(mlogf)O(m\log |f|),得证。\Box

其实上述证明方法还可以用来证明集合覆盖朴素贪心解法的近似优越性。

集合覆盖问题如下:给定正整数 nn 与集合 {1,2,,n}\{1,2,\ldots,n\}mm 个子集 S1,S2,,SmS_1,S_2,\ldots,S_m,找到最少的集合,使得其全部并起来是 {1,2,,n}\{1,2,\ldots,n\}

朴素的贪心想法就是选择当前可以新覆盖最多点的集合,以下命题说明这一算法的近似优越性。

命题 22:如果最优解要取 kk 个集合,则使用如上贪心策略取的集合数量不会超过 klnnk\ln n

证明:记 rir_i 为执行完第 ii 步后还未被覆盖的点个数。则因为最优解是 kk,所以一定有一个集合覆盖了其中至少 ri/kr_i/k 个点。那么之后的证明和命题 11 的证明无二致。\Box

实际上根据 PCP 理论,我们有:任何多项式算法都不可能得到上界为 o(klnn)o(k\ln n) 的解,除非 P=NP\text P=\text{NP}

参考文献

[1] From Standford University,
site: https://theory.stanford.edu/~trevisan/cs261/lecture10.pdf.

[2] From Standford University,
site: https://theory.stanford.edu/~trevisan/cs261/lecture11.pdf.