原文:https://blog.lambdaclass.com/additive-fft-background/
作者:LambdaClass
译者:Kurt Pan
在本文中,我们继续研究 二进制域塔,灵感来源于 Diamond 和 Posen 为在 特征 2 域上运行的完整协议 BINIUS(https://www.binius.xyz)所提出的方案。此前我们已经介绍了在二进制域塔中域元素的基本算术,即 Wiedemann 对 的迭代二次扩张。我们着眼于在此类域上对多项式进行求值与插值的问题,并考虑其在密码学中的应用。设计一个漂亮且高效的多项式求值算法,将为在特征 2 下高效实现 Reed–Solomon 编码铺平道路,而 Reed–Solomon 编码是多项式承诺的关键模块。
既然我们已经了解了 Wiedemann 二进制域塔的结构,自然而然要思考如何在该塔上对函数进行求值或相乘。对我们的目标而言,这点很重要,因为在一个精心选定的基域子集(例如 次单位根)上对多项式求值,正是使用 Reed–Solomon 技术进行消息编码的基础;从这个角度看,多项式求值问题与 Reed–Solomon 编码问题几乎等价。
回想一种高效的多项式乘法方法:快速傅里叶变换(FFT)。它采用著名的流程
对于熟悉这些概念的读者来说,用更专业的术语来说,“多项式求值”代表“对多项式进行快速傅里叶变换 (FFT)”,逐点乘表示“逐点相乘它们的快速傅里叶变换”,而插值则表示“对结果进行逆快速傅里叶变换”。这种通用方案使我们能够绕过高中时将两个多项式相乘并应用分配律的计算成本。这些“求值”和“插值”步骤通常涉及矩阵乘法;每当我们求多项式 的幂时,如果其本原 次方根为单位根,且 是 的幂,则可以使用递归算法,并且所有这些都可以快速完成,例如 。显然,这必须是数学史上记录最多的事实之一;文献中对此进行了大量的论述。
那么,能否在此处应用 FFT 呢?问题在于,在有限域中“单位根”可能并不存在,或者要找到足够多的单位根就必须在更大、更复杂的扩域中运行。这一基本限制使得经典 FFT 在这类域上要么不可行,要么效率极低。
为克服此难题,我们审视 David Cantor 于 1989 年发表的论文《On Arithmetical Algorithms over Finite Fields》。他在其中提出了一种类似 FFT 的算法,但它作用于基域的加法子群而非乘法子群;由于此时我们处理的是群元素的加法,而非乘法,这一方案通常被称为 加法 FFT。Cantor 构造了“单位根”的加法对应物,并像经典 FFT 那样将问题递归地拆解为更小的子问题。好消息是,这些加法子群正是一系列 向量子空间,与 Wiedemann 的工作及 Diamond 和 Posen 的方案中出现的熟悉子域密切相关。
构建加法 FFT 的关键对象是 线性化多项式;它是一类特殊多项式,由于其对基域中加法和数乘的“线性”特性,展现出极其有趣的性质。*线性化多项式的所有单项式次数均为 的幂,即 *;其一般形式为(更多细节请参见文末附录):
其中 (假设 为素数,)。这些多项式的主要性质在于:由于我们在模 意义下运算,它们表现得就像标准线性代数意义下的线性变换——对任意 和 ,都有
当我们有一个线性化多项式 时,其根(零点)集合形成一个 上的向量空间,称为其 核:
该事实源自线性代数理论;它意味着任意根的线性组合仍是 的根。最后,线性化多项式的一个绝佳性质是:它们的复合仍为线性化多项式。这正是 Cantor 关于正特征扩域塔描述的基石。
为了简明起见,我们聚焦一个简单但重要的例子:固定素数 ,令 为 的代数闭包(例如 是 的代数闭包),取线性化多项式
从上述基本定义出发,我们得到如下对象:
考虑将 与自身依次复合,得到一族线性化多项式
记 ,,即 的根集合。
这是所有钟表装置开始运转的地方,对所有 ,以下三点成立:
https://en.wikipedia.org/wiki/Codimension
最后一点在Cantor思想的结构中扮演着非常重要的角色:这意味着,如果我们把 想象成一块巧克力棒,那么它也可以被认为是恰好 个不相交的 副本的并集:画一个矩形,称之为 ,然后把它分成 个形状和大小相同的部分。每一个都是 的副本!
掌握了这个(非常)简短的总结后,接下来就是好东西了。一个关键的观察是,每当 时,由于我们以 为模,因此所涉及的线性化多项式具有非常整齐的形状:
它们被称为稀疏的,因为它们只有很少的系数;这在稍后计算多项式除法的复杂度时很有用。它的根集合形成一个恰好包含 个元素的域,因此回顾一下性质的逐项列表,我们得到的是 的扩张塔:
其中每一步我们都有度为 的域扩张 。映射 的满射性意味着对于每个 和每个 ,总存在一个元素 使得
这将带来一个非常熟悉的结果。
令 ,即可重现 Wiedemann 的二进制域塔:
并认出记号等价关系
此外,映射 的满射性还让我们能够为塔中每一层构造生成元与基。具体而言:
第一层生成元取为 .
第二层生成元为满足
的元素 ,即 为 的根,由于该多项式在 上无根,故 。
第三层生成元定义为满足
这蕴含着 ,或者等价地 。同样,这蕴含着 是 的根。很容易验证这个多项式在 中没有根,因此在 中也没有根。
对于 ,则递归令
并满足域论关系 。
基于这些生成元,Cantor 按照 的二进制展开定义基元素 :这模仿了Wiedemann 二进制塔中元素域乘法的自然运用。具体来说,如果我们写下 的二进制展开式
则
举例说明:
对于 的显式基,直接对应于 Diamond 和 Posen 所称的 Wiedemann 塔 的多线性基。他们指出,对于 ,单项式集
构成一个基,其中的 实际上就是Cantor的 。值得注意的是,Diamond 论文中的Wiedemann 塔生成元使用了一个略有不同的关系:
尽管在特定的生成关系中存在这些差异,但这些迭代二次扩张的底层代数结构与Cantor的有效基表示和算术的一般框架是一致的。
Cantor的加法 FFT 的核心机制是一个递归的"分治"过程,这与传统 FFT 算法的效率原则如出一辙。这里,我们将首先概述一下求系数为 的次数为 的多项式 的问题。下文中,我们将保留前几节中使用的符号。
因为 恰好有 个元素,所以
并观察到该集合恰好有 个元素,因为 是 的根集,其阶为 。
现在,为了求出 在 上的值,只要知道 在每一个陪集 上的值就足够了。由于这些陪集有 个元素,如果我们能把这个问题简化为求出一个次数严格小于 的多项式 在 上的值(理想情况下是 ),那就太棒了。
为了获得这样的 ,以下观察结果很有用: a. 是 次多项式 的根集
b.该多项式的一个平移将在 处消失:
不相信请自己检查一下。
c.代数学基本定理指出, 除以 的商的余数是次数严格小 的多项式,且
成立。特别地,当 时,
这意味着在 上 。
Cantor 还概述了逆运算,即插值。如果已知多项式在 内所有点的值,则可以反转加法 FFT 算法的步骤来重构原始多项式的系数。此逆过程涉及类似的除法和加法求和技巧,但执行顺序相反。
Cantor 严格分析了他的算法的计算复杂性,将操作分为两类:
在 的所有点处计算次数为 的多项式:
A 操作的次数约为 。对于 ,可简化为大约 。
M 操作总次数约为 。
总而言之,向量子空间是加法 FFT 运算的“域”。该算法以递归方式划分这些域,并利用线性化多项式的线性性质(以及 Frobenius 自同构)来关联不同子空间之间的求值,从而实现高效的多点求值和插值。
这里我们总结了文中提到的线性多项式的大部分证明、定义和技术细节。我们从最初的定义开始,推导了一些所使用的性质。
定义(线性化多项式)
在有限域 上的线性化多项式具有如下形式:
这里我们将它们的一些主要性质收集起来并列成一个列表;其中大多数都是容易证明的事实,可以作为鼓励性的练习(同时也提醒我们基础线性代数的重要性):
它们是线性变换:如果 是一个系数在 上的线性化多项式,则映射 是一个从 到其自身的线性变换,将该扩张视为 上的 维向量空间。这意味着对于任意 和 都有:
(该性质源于将具有 个元素的域表征为多项式 的分裂域。)由于 是线性映射,因此它的根集构成一个 向量空间:
复合的神奇效应:通常,多项式的复合只会产生一个新多项式,而在一般情形下难以进一步描述。但由于线性化多项式可被视为线性映射,其复合带来以下惊人后果:
关于扩域塔的构造:将线性化多项式 与自身依次复合
会产生算法所作用的子集。根据线性映射的一般理论,若线性映射 可复合,则有
在本情形下,这意味着对应的核之间满足
即 。又因
可知 。将 限制到 ,视为 的自同态;由核-像维数定理及上述包含关系得
由于 与 次数不同,其在 中的根集也不同,故对应核异。由此可推得
又 ,由归纳可得 ,且 将 满射至 。
Cantor 在其论文中称为“定理 1.1”的结果,是其贡献的基石之一。为陈述该定理,需先作以下观察:固定素数 ,令 满足
然后:
a. 每个正整数 在 进制下均有唯一展开——存在非负整数 及 ,使得
记 ,将其视作通过“展开映射”得到的指数向量。
b. 令 为 向量中首个非零分量。
c. 设 ,对正整数 定义
并注意 。
事实证明,集合 具有极佳性质,归纳如下:
定理(Cantor’s 1.11 定理)
在上述语境下:
构成 的一组基,且 .
当 时,
全集 构成 的基。
这一特定基对理论研究十分重要,但在实际操作中,经常希望选取与映射 有良好兼容性的基;我们此前已遇到这样的一组基,即由 定义的那一组。令
作为 的基。对于每个 ,存在唯一的系数 ,使得
若将 ,则可定义一个“替换映射” ,将 映射为整数:
不难看出,此映射恰为前文所述“展开映射”的逆映射。该基选择的一个良好性质是:
在描述 FFT 算法时,这一性质将大为有用。