基于候选排序的低复杂度Tone Injection技术:原理、实现与在OFDM/AFDM中的应用
1. 项目概述与核心挑战
在无线通信领域,多载波调制技术,尤其是正交频分复用(OFDM),因其高频谱效率和对抗多径衰落的鲁棒性,已成为5G、Wi-Fi等现代通信标准的基石。近年来,为了应对高速移动场景下的信道挑战,一种基于啁啾子载波调制的新型波形——仿射频分复用(AFDM)——因其在双弥散信道中能提供全分集增益而备受关注。然而,无论是OFDM还是AFDM,都面临着一个共同的“阿喀琉斯之踵”:高峰均功率比(PAPR)。简单来说,PAPR衡量的是信号瞬时峰值功率与平均功率的比值。当这个比值过高时,信号在通过功率放大器(PA)时,极易进入非线性饱和区,产生严重的带内失真和带外频谱再生,最终导致系统误码率(SER)性能急剧恶化,通信质量下降。
为了解决PAPR问题,业界提出了多种技术,如削波滤波、选择性映射和预留子载波等。其中,Tone Injection(TI,音注入)技术因其“无失真”的特性而独具优势。它不像削波那样直接砍掉信号峰值引入非线性失真,也不像预留子载波那样需要牺牲宝贵的频谱资源。TI的核心思想非常巧妙:它在发送端对原始频域符号进行一个“整数倍”的平移(注入一个正交序列),这个平移量是事先约定好的。接收端在解调后,通过一个简单的模运算就能无损地恢复出原始符号。因此,TI在理论上可以在不损失任何信息(零误码率代价)和不占用额外带宽(零频谱效率损失)的前提下,通过精心设计这个“平移量”来重塑时域波形,从而压低信号峰值。
听起来很美好,对吧?但魔鬼藏在细节里。TI的终极优化目标,是在一个无限的整数格点空间中,为每一个子载波找到一个最优的平移量,使得合成后的时域信号峰值功率最小。这是一个典型的组合优化问题,其搜索空间随着子载波数量N呈指数级增长。穷举搜索在工程上完全不可行。因此,过去的研究主要集中在寻找低复杂度的次优算法上,主要分为两大流派:一类是基于随机候选生成的方法(如CE-TI),通过大量随机尝试来逼近最优解,但计算开销巨大,每次候选评估都需要一次快速傅里叶变换(FFT);另一类是基于削波噪声谱的方法(如DS-TI),它利用信号被“削波”后产生的噪声在频域的分布,来指导对哪些子载波进行TI操作,复杂度较低,但其性能受限于削波噪声谱本身在迭代过程中的变化,存在性能天花板。
这就引出了我们本次实践的核心:如何打破现有TI方案在性能与复杂度之间的权衡僵局?我们提出的方案是基于候选排序的低复杂度Tone Injection(CR-TI)及其滤波变体(FCR-TI)。这套方案的核心洞察在于,时域信号的局部峰值与其相邻样本是高度相关的。因此,我们不必在每次迭代中都关注整个长达LN点的时域波形,而只需聚焦于少数几个“局部峰值点”。通过为每一个可能的TI操作(即对某个子载波进行+1, -1, +j, -j四种平移之一)计算一个“分数”,这个分数量化了该操作对所有这些被监控的局部峰值的压制效果总和。我们只需选择分数最高的那个操作执行即可。这种方法将搜索的维度从“在全空间中找最优组合”降维到了“在每步中找最优单步操作”,复杂度得以大幅降低。更进一步,我们引入了深度优先搜索(DFS)来探索不同的操作路径,避免陷入局部最优。对于AFDM系统,由于其独特的啁啾变换特性,我们也对算法进行了适配和验证。
2. 核心原理:从局部峰值到候选排序
要理解CR-TI为何有效,我们需要深入两个关键点:一是为什么局部峰值能代表整个波形?二是我们如何量化一个TI操作对局部峰值的压制效果。
2.1 局部峰值:全波形的“温度计”
首先,我们定义什么是局部峰值。对于一个长度为LN的离散时域信号x[n],如果某个样本点n的幅度大于或等于其前后两个相邻样本点的幅度(考虑到循环前缀,首尾样本也视为相邻),即满足 |x[n]| ≥ max(|x[n-1]|, |x[n+1]|),那么我们就称x[n]是一个局部峰值。
为什么关注局部峰值就够了?这源于过采样(Oversampling)带来的样本相关性。当我们对信号进行L倍过采样(L>1)时,逆傅里叶变换(IDFT)或逆仿射傅里叶变换(IDAFT)矩阵不再是酉矩阵,这导致相邻的时域样本不再独立。从统计上看,一个样本点的功率与其附近样本点的功率存在正相关性。这个相关性的窗口大小大约是L个样本。这意味着,一个很高的局部峰值,其周围很大一片区域的信号幅度也大概率处于较高水平。反之,如果我们能成功压低这个局部峰值,那么它周围区域的信号幅度通常也会随之下降。因此,局部峰值就像整个信号包络的“突出部”或“温度计的最高刻度”,控制了它们,就在很大程度上控制了整个波形的PAPR。
在实际操作中,我们不需要跟踪所有LN个样本,只需要在每次迭代中,找出当前信号中幅度最大的前Np个局部峰值(例如Np=16或2logN)。这个数量远小于总样本数,是算法降低复杂度的第一个关键。
2.2 候选排序:量化“压制效果”的尺子
现在,我们面临一个选择:在当前的信号状态下,应该对哪个子载波、进行哪种平移(+1, -1, +j, -j),才能最有效地降低这些被监控的局部峰值呢?
假设我们考虑对第k个子载波进行一个平移操作,记为Δb(它是一个除了第k个元素为±1或±j外,其余全为0的向量)。这个操作在时域产生的变化Δx,可以通过IDFT/IDAFT矩阵A预先计算出来:Δx = δ A Δb。这里δ是平移的步长,对于M阶QAM调制,通常取δ = d√M,d是星座图的最小欧氏距离,以确保接收端能正确进行模运算恢复。
对于第i个被监控的局部峰值点,其当前幅度为|x[pi]|,相位为∠x[pi]。我们施加操作Δx后,该点的幅度将变为|x[pi] + Δx[pi]|。我们的目标是让这个新幅度尽可能小。通过数学推导,该点功率的减少量可以近似表示为:
功率减少量 ∝ -|x[pi]| * cos( ∠x[pi] - ∠Δx[pi] )
这个公式非常直观。cos( ∠x[pi] - ∠Δx[pi] ) 是当前峰值点相位与操作引起的相位变化之间的余弦相似度。
- 如果相位完全相反(相差180度),cos值为-1,那么
-|x[pi]| * (-1) = |x[pi]|,这是一个很大的正贡献,意味着这个操作能显著降低该峰值点的功率。 - 如果相位相同(相差0度),cos值为1,那么贡献是
-|x[pi]|,这意味着操作反而会增大该点的功率,这是我们绝对要避免的。
因此,我们定义第i个峰值点对于第j个候选操作的“负加权余弦相似度”(NWCS)为:
r_i,j = -|x[pi]|^β * cos( ∠x[pi] - ∠Δx[pi] )
其中β是一个大于0的指数(通常设为4),用于放大大峰值的影响力。一个大的峰值对PAPR的贡献更大,因此我们在排序时给予它更高的权重。
最后,一个候选操作(对应一个特定的子载波和平移方向)的总得分R_j,就是它对所有Np个被监控峰值点的NWCS之和:
R_j = Σ_{i=1}^{Np} r_i,j
候选排序(CR) 的核心步骤就是:在每次迭代中,遍历所有可能的候选操作(共4N个,对应N个子载波和4个平移方向),计算每个候选的得分R_j,然后选择得分最高的那个候选操作来执行。得分高,意味着这个操作能最大程度地、协同地压制所有被监控的局部峰值。如果所有候选的得分都小于等于0,说明没有任何一个单步操作能继续降低峰值,迭代终止。
注意: 这里有一个非常重要的工程实现细节。我们不需要在每次迭代中都重新计算整个Δx矩阵(即δ A C)。因为矩阵A和候选矩阵C(定义了所有可能的Δb)对于给定的系统配置(N, L, α1, α2)是固定的。我们可以在算法初始化阶段一次性计算出所有候选操作对应的时域变化向量Δx,并存储起来。在每次迭代的排序阶段,我们只需要对这些预计算好的向量进行点乘和求和运算,这避免了频繁调用FFT/IFFT,是复杂度降低的第二个关键。
2.3 滤波候选排序(FCR-TI):面向复杂度的进一步优化
CR-TI的复杂度主要来自于每次迭代需要计算4N * Np个NWCS值。当N很大时(例如1024),这个计算量依然可观。FCR-TI的目标是将复杂度降低到接近FFT的水平(O(N log N))。
其思路借鉴了DS-TI的思想:并非所有子载波对降低PAPR都有同等贡献。那些对当前信号“削波噪声”贡献大的子载波,更值得进行TI操作。具体步骤如下:
- 计算削波噪声谱:将当前时域信号x中,幅度超过某个门限η的样本点保留(视为“噪声”),其余置零,得到时域削波噪声f。然后将其变换回频域:g = A f。
- 子载波筛选:根据频域向量g的幅度|g[k]|对所有子载波进行降序排序。幅度越大的子载波,其对应的时域成分对信号峰值的“贡献”可能越大,因此是TI的优先候选目标。
- 缩小搜索空间:CR-TI需要遍历所有N个子载波(每个子载波4个方向,共4N个候选)。FCR-TI则只关注排序后最前面的Nc个子载波(例如Nc=32)。这样,候选数量就从4N锐减到4Nc。由于Nc是一个固定值或与logN成正比,整体复杂度得以大幅下降。
FCR-TI在绝大多数情况下能以微小的PAPR性能损失(通常小于0.3 dB),换来复杂度的显著降低,实现了更优的“性能-复杂度”权衡。
3. 算法实现与深度优先搜索集成
有了前面的理论铺垫,我们现在可以勾勒出CR-TI/FCR-TI算法的完整流程,并介绍如何集成深度优先搜索(DFS)来进一步提升性能。
3.1 核心算法流程
算法1清晰地描述了整个过程,这里我们结合工程实践进行解读:
-
初始化:
- 根据系统参数(子载波数N,过采样因子L,AFDM的啁啾参数α1, α2)计算变换矩阵A和基础候选矩阵C(定义所有可能的单位平移操作)。
- 计算所有候选操作对应的时域变化矩阵
C_tilde = δ A C并存储。这是预计算的关键一步,避免迭代中的FFT开销。 - 初始化TI序列b为全零向量,并计算初始时域信号
x = A s(s为原始频域符号)。
-
迭代优化(主循环):
- 步骤A:识别局部峰值。扫描当前时域信号x,找出所有满足局部峰值定义的样本点索引,并从中选出幅度最大的Np个,构成集合P。
- 步骤B:候选排序。对于每一个候选操作(共4N个,FCR-TI为4Nc个),根据公式计算其对于集合P中所有峰值点的总得分R_j。这里直接使用预存储的C_tilde矩阵中对应的列向量,与当前峰值点的值进行复数运算,效率极高。
- 步骤C:选择与执行。从所有候选操作中,选出得分R_j最高的一个。如果最高得分仍小于等于0,则终止迭代。否则,更新TI序列b和时域信号x:
b = b + Δb_selected,x = x + Δx_selected。 - 重复步骤A-C,直到达到预设的最大迭代次数T,或提前终止。
-
输出:最终得到的b即为优化后的TI序列,
s_tilde = s + δ b即为发送的频域符号。
3.2 深度优先搜索(DFS)的集成
基本的迭代算法是一种“贪婪”策略:每一步都选择当前看起来最好的操作。这很容易陷入局部最优。为了探索更优的解,我们引入了DFS。
我们可以把TI的迭代过程想象成一棵树:
- 根节点:初始状态(b=0)。
- 每一层:代表一次迭代。
- 每个节点:代表一个特定的TI序列b的状态。
- 分支:从一个父节点出发,到其子节点的边,代表执行了一个候选TI操作。
在贪婪算法中,我们每层只选择得分最高的分支往下走,走到底就结束了。DFS则不同:
- 从根节点开始,我们依然选择得分最高的分支走到下一层节点。
- 继续递归地应用这个“选择最优分支”的策略,直到到达一个叶子节点(即无法找到有效候选,或达到最大深度T)。记录下这个叶子节点对应的TI序列和最终的峰值功率。
- 然后,回溯到上一个父节点。
- 在该父节点,我们选择得分次高的分支(之前被忽略的“第二好”选择),然后继续深入探索。
- 重复这个过程,直到探索完所有有希望的分支,或者达到计算时间上限。
最终,我们从所有探索到的叶子节点中,选择那个能产生最低峰值功率的TI序列作为输出。
实操心得: DFS的引入相当于用计算时间换取了更好的性能。参数T在这里代表搜索树的最大深度(即最大迭代次数)。在实际实现中,我们通常不会进行完全搜索,而是设置一个合理的最大深度(如T=20)和可能的最大叶子节点数量限制。我们的仿真表明,即使进行有限的DFS(例如探索几十条路径),也能在贪婪算法的基础上获得额外的0.2-0.5 dB的PAPR性能增益,而复杂度增加可控。
3.3 复杂度分析与对比
我们来具体算一笔复杂度账,看看CR-TI/FCR-TI到底“低”在哪里。
- 初始化:主要开销是计算初始时域信号
x = A s和预计算C_tilde = δ A C。这需要通过FFT/IFFT实现,复杂度为O(LN log(LN))。对于FCR-TI,额外需要计算一次削波噪声谱g = A f,复杂度相同。 - 单次迭代:
- 识别局部峰值:需要遍历LN个样本并做部分排序,复杂度为
O(LN log Np)。 - 候选排序:需要计算
4Np * Nc个NWCS值(CR-TI中Nc=N,FCR-TI中Nc是常数或logN量级),复杂度为O(Np Nc)。
- 识别局部峰值:需要遍历LN个样本并做部分排序,复杂度为
- 总复杂度:
O(LN log(LN) + T * (LN log Np + Np Nc))。
与基线方案对比(假设迭代次数T, T_CE, T_DS量级相近):
- CE-TI:每轮迭代需要生成U个随机候选,每个候选都需要一次IFFT来评估PAPR,复杂度为
O(T_CE * U * LN log(LN)),通常U需要设得较大(如32)以保证性能,因此复杂度很高。 - DS-TI:基于削波噪声谱顺序注入,每轮迭代复杂度约为
O(T_DS * LN),复杂度较低,但性能有上限。 - CR-TI:通过参数设置(如令
Np * Nc ~ O(N log N)),可以将每轮迭代复杂度控制在O(LN log Np)量级。在最坏情况下(Np ~ O(N), Nc = N),复杂度上界为O(T N^2),与CE-TI的O(T N log N)在N很大时可比。但通过合理调参,实际运行复杂度远低于上界。 - FCR-TI:通过固定Nc,可以使
Np Nc ~ O(LN log Np),从而将总复杂度降至O(LN log(LN) + T * LN log Np),这与单次FFT的复杂度量级O(LN log(LN))相当,实现了“FFT级别”的复杂度。
4. 仿真验证与性能分析
理论再优美,也需要实验的检验。我们搭建了仿真平台,对OFDM和AFDM系统进行了全面的性能评估。系统配置如下:采用64-QAM调制(对非线性失真更敏感),过采样因子L=8以准确捕捉峰值,AFDM参数取c1=1/(2N), c2=0。对比的基线包括原始OFDM/AFDM、经典的CE-TI以及目前性能-复杂度权衡较优的DS-TI。
4.1 PAPR性能:增益显著且可扩展
我们首先关注互补累积分布函数(CCDF),它表示PAPR超过某个门限值的概率。这是衡量PAPR抑制技术的黄金标准。
- 对阵基线方案:在N=256的OFDM系统中,我们的CR-TI方案(T=20, Np=16)在CCDF曲线10^-3处(一个常用的评估点),比DS-TI(T_DS=64)获得了约1 dB的PAPR增益,而两者的计算复杂度处于同一量级。将CR-TI的迭代次数增加到T=40,Np=40,可以将10^-3 PAPR压低至5.4 dB,这比原始OFDM信号降低了整整6 dB。据我们所知,这是目前文献中在N=256条件下,TI类技术所报告的最佳PAPR性能。
- FCR-TI的权衡:FCR-TI(T=20, Np=16, Nc=32)在10^-3处达到了6 dB的PAPR,性能略低于CR-TI(约0.6 dB差距),但其复杂度显著低于DS-TI (T_DS=64),而与DS-TI (T_DS=16) 复杂度相当,却带来了明显的性能提升。这完美体现了FCR-TI在复杂度和性能间更优的折衷。
- 参数T的影响:将T从20减少到10会导致CCDF曲线尾部性能明显恶化。这表明足够的迭代次数对于充分探索搜索空间、压制那些出现概率低但破坏性大的极高峰值是必要的。T=20是一个较好的平衡点。
- 系统可扩展性:我们测试了子载波数N从128到1024的变化。为了公平比较,我们让CR-TI的复杂度按
O(N log N)缩放(设置Np ∝ log N),FCR-TI的复杂度按O(N)缩放(设置Np Nc ∝ N)。结果显示,在N≤512时,两种方案的PAPR性能随N增加而恶化的程度(<0.5 dB)与原始信号自身的恶化趋势基本一致,展现了良好的可扩展性。在N=1024时,性能下降略超预期,表明针对超宽带系统,参数可能需要进一步优化。
4.2 对AFDM的适配与挑战
我们将方案应用于AFDM系统。CR-TI表现出了与OFDM类似的优异性能和可扩展性。然而,FCR-TI在AFDM中遇到了挑战:在N较小时(如128),FCR-TI与CR-TI的性能差距从OFDM下的约0.3 dB扩大到了约1 dB。这意味着基于OFDM推导的削波噪声谱指导准则,在AFDM的啁啾变换下可能不是最优的。AFDM中信号的峰值结构与OFDM不同,导致那些对削波噪声贡献最大的子载波,并不一定是TI最有效的目标。这为未来的研究指明了方向:需要为AFDM设计更精准的候选预筛选机制。
4.3 实际系统性能:误码率(SER)提升
PAPR降低的最终目的是改善系统在非线性功率放大器下的性能。我们采用软限幅器来模拟PA的非线性失真,并测试了在加性高斯白噪声(AWGN)信道下的SER。
- 无TI的困境:原始OFDM信号由于高PAPR,在PA非线性作用下产生了严重的错误平层(Error Floor),SER在较高信噪比下停滞在3×10^-2左右,无法继续下降。
- TI的效果:所有TI方案都有效压制了错误平层。其中,我们的CR-TI和FCR-TI方案将错误平层压制到了3×10^-5和1×10^-5以下,比原始信号改善了超过三个数量级,也比CE-TI和DS-TI等基线方案改善了一个数量级左右。
- 信噪比增益:在SER为10^-3时,我们的方案相比CE-TI和DS-TI分别带来了超过2 dB和5 dB的信噪比增益。这意味着要达到相同的通信质量,我们的方案可以让发射机以更低的功率工作,或者接收机在更差的信道条件下保持连接,其实际工程价值非常显著。
一个有趣的现象是,CE-TI的PAPR性能虽然不如DS-TI,但其SER性能却更好。我们分析这可能是因为CE-TI引入的平均发射功率增量更小(见表II),且其随机搜索过程可能产生了更“平滑”的修正信号,对非线性失真不那么敏感。这提醒我们,PAPR本身是一个间接指标,最终还是要以系统级的SER或邻信道泄漏比(ACLR)等指标为准。
5. 工程实现要点与避坑指南
将CR-TI/FCR-TI从论文仿真落地到实际通信系统(如FPGA或DSP实现)中,需要注意以下几个关键点:
5.1 参数选择与调优
- 迭代次数T:这是性能与复杂度的直接权衡。T太小,性能不充分;T太大,收益递减且延迟增加。对于大多数应用,T在15到25之间是一个较好的起点。可以通过离线仿真,针对特定的N、调制阶数和目标PAPR门限,绘制性能-复杂度曲线来选择。
- 监控峰值数Np:Np决定了算法对波形细节的关注程度。太小的Np(如<8)可能错过一些重要峰值,导致性能下降;太大的Np(如>40)会增加排序计算量。建议设置为
2 * log2(N)到sqrt(N)之间,例如N=256时,Np=16是一个经验证有效的值。 - 滤波子载波数Nc(仅FCR-TI):Nc决定了搜索空间的宽度。太小会损失性能,太大则失去降低复杂度的意义。建议初始设置为32或64,然后根据性能需求调整。可以将其设置为与L和N相关的函数,如
Nc = floor(L * N / (8 * log2(N))),以保持复杂度线性增长。 - 权重指数β:β放大了大峰值在排序中的话语权。β=1是线性加权,β>1会更强力地压制最高峰。仿真表明β=4通常能取得较好效果。在实际中,如果发现算法过早陷入局部最优,可以尝试略微降低β(如到2或3),让算法更“平等”地关注多个峰值。
5.2 计算优化与定点实现
- 预计算与查表:
C_tilde = δ A C矩阵的预计算是核心优化。对于固定配置的系统,此矩阵可预先计算并存储在ROM中。此外,余弦函数cos(θ)的计算可以通过查找表(LUT)实现,尤其是当相位被量化为有限位宽时。 - 并行化候选评分:候选排序步骤(计算R_j)是高度并行的。每个候选的得分计算独立于其他候选。在硬件实现(如FPGA)或支持SIMD的处理器(如DSP、GPU)上,可以并行计算数百甚至上千个候选的得分,极大加速迭代过程。
- 定点精度考量:在实际硬件中,需使用定点数。需要仔细确定信号幅度、相位以及NWCS计算过程中的数据位宽,防止溢出和精度损失。特别是β次幂运算,可能需要采用分段线性近似或专用硬件单元。
5.3 与系统其他模块的协同
- 信道编码的影响:TI操作本质上是对发送符号的扰动。虽然接收端可通过模运算消除,但极个别情况下,在极低信噪比和强非线性失真下,这种扰动可能与信道噪声相互作用,影响前向纠错码(FEC)的译码性能。建议在系统级仿真中,将TI与FEC(如LDPC、Polar码)联合评估。
- 峰均比门限的设定:在实际系统中,TI算法不一定需要运行到无法找到有效候选为止。可以设定一个目标PAPR门限(如8 dB)。当算法将信号峰值压制到该门限以下时,即可提前终止迭代,节省处理时间和功耗。
- 对同步和信道估计的影响:TI注入的序列是已知的、结构化的。在接收端进行同步和信道估计时,理论上可以使用包含TI扰动的已知参考信号(如导频)。但需确保信道估计算法对此扰动不敏感,或在进行信道估计前先进行模运算恢复原始导频。
常见问题排查速查表
| 问题现象 | 可能原因 | 排查建议与解决方案 |
|---|---|---|
| PAPR性能远低于仿真结果 | 1. 过采样因子L设置过小。 2. 局部峰值检测算法有误,漏检了真峰值。 3. 权重指数β设置不当(如β=1)。 4. 定点实现中精度损失严重。 |
1. 确保L≥4,推荐L=8。 2. 验证峰值检测代码,确认循环边界处理正确。 3. 尝试增大β至3或4。 4. 检查关键运算(如余弦、乘法)的位宽,进行浮点/定点对比仿真。 |
| 算法运行时间过长 | 1. 迭代次数T设置过大。 2. 未对 C_tilde进行预计算,每次迭代都做FFT。3. 候选排序部分未做任何并行优化。 |
1. 根据性能-时间曲线,选择合适的T(通常20足够)。 2. 务必在初始化阶段预计算并存储 C_tilde。3. 考虑使用多线程、GPU或FPGA并行计算候选得分。 |
| 在AFDM系统中FCR-TI性能很差 | 削波噪声谱在AFDM中不是筛选候选的有效指标。 | 对于AFDM系统,优先使用CR-TI。或研究针对AFDM变换特性的新候选筛选方法(如基于瞬时频率的筛选)。 |
| 接收端误码率在低信噪比时反而升高 | TI引入的扰动在极低信噪比下可能与噪声混淆,影响模运算判决。 | 检查接收端模运算的实现是否正确(公式(4))。确保δ值设置正确(δ = d√M)。在系统设计时,评估TI与FEC联合工作的性能。 |
| 算法对某些特定输入序列效果不佳 | 贪婪算法+DFS可能仍会陷入某个局部最优,而该局部最优对此类序列不友好。 | 1. 增加DFS探索的路径数。 2. 考虑引入轻微的随机性(如以很小概率不选择最优候选)。 3. 对于关键帧,可以采用多次独立运行取最优结果的策略。 |
经过一系列的理论推导、算法实现和实验验证,基于候选排序的TI方案展现出了其强大的生命力。它从一个朴素的观察(局部峰值相关)出发,构建了一套高效、可扩展的优化框架。CR-TI提供了接近理论极限的PAPR性能,而FCR-TI则以微小的性能代价换取了工程上非常友好的FFT级复杂度。对于AFDM等新兴波形,虽然FCR-TI的预筛选策略需要调整,但CR-TI的核心框架依然适用。在实际部署中,参数调优、计算加速和系统联调是成功的关键。这套方案为未来追求极致能效和线性度的6G及Beyond无线通信系统,提供了一个极具竞争力的PAPR抑制工具箱备选方案。