大数据机器学习算法与计算机视觉应用04:多项式
The Algorithm Magic of Polynomial
- Polynomials
- The Root of Polynomial
- A Delete Channel
- Polynomials for Finding Maximum Matchings
Polynomials 多项式
一个 d d d 次多项式可以用一个 d + 1 d+1 d+1 元组 c i {c_i} ci 表达。在这种情况下,两个多项式相加的时间复杂度是 O ( d ) O(d) O(d) ,而两个多项式相乘的实践复杂度是 O ( d log d ) O(d \log d) O(dlogd) 。
快速地估计一个多项式的值的方法:对应给定值b,循环执行将当前式子乘b,加下一项。这个方法叫做霍纳规则。流程如下:
c d c d × b + c d − 1 ( c d × b + c d − 1 ) × b + c d − 2 c_d c_d \times b + c_{d-1} (c_d \times b + c_{d-1}) \times b +c_{d-2} cdcd×b+cd−1(cd×b+cd−1)×b+cd−2
该算法的时间复杂度是 O ( d ) O(d) O(d)。
多项式的根
对于一个多项式 P ( x ) P(x) P(x),令 P ( x ) = 0 P(x)=0 P(x)=0 的值 x ′ x' x′ 被称作多项式的根。
根据代数基本定理,一个d次多项式一定有d个根。
Unique Reconstruction Theorem 唯一重构定理
唯一重构定理告诉我们,给定d个点 ( x 1 , y 1 ) , ( x 2 , y 2 ) ⋱ , ( x d , y d ) (x_1,y_1),(x_2,y_2) \ddots, (x_d,y_d) (x1,y1),(x2,y2)⋱,(xd,yd), 总有一个多项式 P ( x ) P(x) P(x) 使得这些点都在多项式上。
事实上,唯一重构定理告诉我们如何构造这样一个多项式满足条件。
首先我们构造这样一组多项式 R i ( x ) R_i(x) Ri(x) 满足:
R i ( x i ) = 1 R i ( x j ) = 0 , j ≠ i R_i(x_i) = 1 R_i(x_j) = 0, j \neq i Ri(xi)=1Ri(xj)=0,j=i
结果如下:
Π j ≠ i ( x − x j ) Π j ≠ i ( x i − x j ) \quad{\Pi _{j\neq i}(x-x_j)}\over{\Pi _{j\neq i}(x_i-x_j)} Πj=i(xi−xj)Πj=i(x−xj)
那么
P ( x ) = y 0 R 0 ( x ) + y 1 R 1 ( x ) + ⋯ + y d R d ( x ) P(x) = y_0 R_0(x) + y_1 R_1(x) + \cdots +y_d R_d(x) P(x)=y0R0(x)+y1R1(x)+⋯+ydRd(x)
举个例子:有三个点 ( 5 , 1 ) , ( 6 , 2 ) , ( 7 , 9 ) (5,1),(6,2),(7,9) (5,1),(6,2),(7,9),现在找出经过这三个点的多项式。
R 1 ( x ) = ( x − 6 ) ( x − 7 ) ( 5 − 6 ) ( 5 − 7 ) = 1 2 ( x 2 − 13 x + 42 ) R 2 ( x ) = ( x − 5 ) ( x − 7 ) ( 6 − 5 ) ( 6 − 7 ) = − 1 2 ( x 2 − 12 x + 35 ) R 3 ( x ) = ( x − 5 ) ( x − 6 ) ( 7 − 6 ) ( 7 − 5 ) = 1 2 ( x 2 − 11 x + 30 ) P ( x ) = R 1 ( x ) + 2 R 2 ( X ) + 9 R 3 ( x ) = 4 x 2 − 50 x + R_1(x) = \frac{(x-6)(x-7)}{(5-6)(5-7)} = \frac{1}{2} (x^2 -13x +42) R_2(x) = \frac{(x-5)(x-7)}{(6-5)(6-7)} = -\frac{1}{2} (x^2 -12x +35) R_3(x) = \frac{(x-5)(x-6)}{(7-6)(7-5)} = \frac{1}{2} (x^2 -11x +30) P(x) = R_1(x) + 2R_2(X) + 9R_3(x) = 4x^2-50x + R1(x)=(5−6)(5−7)(x−6)(x−7)=21(x2−13x+42)R2(x)=(6−5)(6−7)(x−5)(x−7)=−21(x2−12x+35)R3(x)=(7−6)(7−5)(x−5)(x−6)=21(x2−11x+30)P(x)=R1(x)+2R2(X)+9R3(x)=4x2−50x+
A Deletion Channel 丢失频道
下面是另一个问题,假设在上面构造多项式的情景中,Alice要向Bob传d+1个数,但是在传输的过程中总会有k个数丢失,那么怎么才能保证Bob一定收的到这d+1个数呢?
一种很笨的方法是,将每个数据发送k+1次就可以了。但是这需要发送 d × ( k + 1 ) d\times (k+1) d×(k+1) 个数据,有没有更好的方法呢?
一种好方法是构造一个多项式 P ( x ) = Σ c i x i P(x) =\Sigma c_i x_i P(x)=Σcixi,然后发送 P ( 0 ) , P ( 1 ) , ⋱ , P ( d + k ) P(0),P(1),\ddots,P(d+k) P(0),P(1),⋱,P(d+k),这样Bob至少可以收到d+1个多项式的值,根据唯一重构定理,Bob可以计算出这个多项式从而得出所有的c。
这种做法的时间复杂度是 O ( d + k + 1 ) O(d+k+1) O(d+k+1),比上面的做法少传输很多数据。(注意,不用担心乱序的问题,因为是一个一个传的,而如果出错会传乱码而不是什么也不做)。
General Error Correction 误码纠错
假设现在不是传输丢失,而是传输一个错误的数字,那么在同样的背景下,需要进行怎样的传输呢?
很明显,答案是需要传输 d + 2 k + 1 d+2k+1 d+2k+1个数字,其中 d + k + 1 d+k+1 d+k+1是正确的多项式的值。因为 k + 1 > k k+1>k k+1>k,所以我们从理论上确认了Bob可以通过这种方式找到正确的多项式。
那么实际上应该怎么找到那个正确的多项式呢?
假设Bob收到的数据是 r 0 , r 1 , ⋱ , r d + 2 k r_0,r_1,\ddots,r_{d+2k} r0,r1,⋱,rd+2k,Z是其中错误信息的集合,那么我们声明一个错误项多项式
E ( x ) = Π i ∈ Z ( x − i ) E(x) = \Pi_{i\in Z}(x-i) E(x)=Πi∈Z(x−i)
那么对于Bob收到的所有项都满足以下等式,因为要么 E ( x ) = 0 E(x)=0 E(x)=0,要么 P ( x ) = r x P(x) = r_x P(x)=rx
P ( x ) ⋅ E ( x ) = r x ⋅ E ( x ) P(x)\cdot E(x) = r_x \cdot E(x) P(x)⋅E(x)=rx⋅E(x)
Berlekamp-Welch Algorithm BW算法
BW算法是一种用于误码纠错的算法,其运行规律基于上文所述,我们假设
E ( x ) = x k + e k − 1 x k − 1 + ⋯ + e 0 ( i f d e g r e e ( E ( x ) ) i s k ) P ( x ) ⋅ E ( x ) = f d + k x d + k + f d + k − 1 x d + k − 1 + ⋯ + f 0 E(x) = x^k +e_{k-1}x^{k-1} + \cdots + e_0 (if degree(E(x)) is k) P(x) \cdot E(x) = f_{d+k}x^{d+k} + f_{d+k-1}x^{d+k-1} + \cdots + f_0 E(x)=xk+ek−1xk−1+⋯+e0(ifdegree(E(x))isk)P(x)⋅E(x)=fd+kxd+k+fd+k−1xd+k−1+⋯+f0
这种情况下,我们分别将 x = 0 , 1 , ⋯ , d + 2 k x = 0,1,\cdots, d+2k x=0,1,⋯,d+2k带入方程
P ( x ) ⋅ E ( x ) = r x ⋅ E ( x ) P(x) \cdot E(x) = r_x \cdot E(x) P(x)⋅E(x)=rx⋅E(x)
左边是一堆参数f相加,右边是一堆e相加,f和e未知数的总和是d+2k+1个,而带入d+2k+1个x的值对应d+2k+1个方程,而且方程必定有解,因此就可以解出所有的e和f。
已知 P ( x ) ⋅ E ( x ) P(x) \cdot E(x) P(x)⋅E(x) 和 E ( x ) E(x) E(x) ,相除就可以求出 P ( x ) P(x) P(x)。
Polynomials for Finding Maximum Matching 多项式在最大匹配中的应用
Schwarz-Zippel Lemma Schwarz-Zippel 引理
这个引理的内容是:假设 P P P是一个非零 m m m元 d d d次多项式,假设 S S S是有限域 F F F的一个子集。如果从 S S S中随机抽取 m m m个数 x 1 , x 2 , ⋯ , x m {x_1,x_2,\cdots,x_m} x1,x2,⋯,xm,那么
P r [ P ( x 1 , ⋯ , x m ) = 0 ] ≤ d ∣ S ∣ Pr[P(x_1,\cdots,x_m)=0] \leq \frac{d}{|S|} Pr[P(x1,⋯,xm)=0]≤∣S∣d
健全性检查:当 m = 1 m=1 m=1时,因为d次多项式最多有 d d d个根,因此概率很明显就是 d ∣ S ∣ \frac{d}{|S|} ∣S∣d。
这个引理可以用来解决下文提到的图的匹配问题。
Tutte Matrix
每个顶点数 v v v的简单无向图都对应一个Tutte Matrix M ( G ) M(G) M(G),简单来说如图所示:
Tutte Determinant Theorem Tutte行列式定理
一个图有完美匹配当且仅当 M ( G ) M(G) M(G)的行列式不是零多项式。
(注:匹配指的找到图中一组边集,其中任意两条边都没有公共点。如果这组边集包括了图中所有的顶点,那么就说该匹配是完美匹配。)
那么剩下的就是选取 F F F的大小了, F F F的基数越大,这张图有完美匹配的概率就越高。
Finding a Perfect Matching
上面我们知道了有完美匹配的概率,但是我们如何找到一个完美匹配呢?下面是一个方法:
对于每个边,将图中的该边删去,判断剩下的图中是否还存在完美匹配。如果没有完美匹配,那么将该边加回来;否则丢弃该边。
最后一定剩下 V 2 \frac{V}{2} 2V条边,这些边就是一个完美匹配。