Fractional-Order Subband p-Norm Adaptive Filter via Transformation Nearest Kronecker Product Decomposition for Active Noise Control

Tue, 19 May 2026 00:00:00 +0000

📄 Fractional-Order Subband p-Norm Adaptive Filter via Transformation Nearest Kronecker Product Decomposition for Active Noise Control

#自适应滤波 #有源噪声控制 #信号处理 #鲁棒性 #分数阶微积分 #Kronecker分解

学术质量 4/8 | 影响力 0.5/1 | 可复现性 0.5/1 | 置信度高

👥 作者与机构

第一作者：Jianhong Ye（未说明具体机构，仅显示“J. Ye”及邮箱yjh_zcl@163.com）
通讯作者：Haiquan Zhao（西南交通大学电气工程学院，磁悬浮技术与磁浮车辆教育部重点实验室）
作者列表：Jianhong Ye（未说明具体机构）、Haiquan Zhao*（西南交通大学电气工程学院）、Shaohui Lv（西南交通大学电气工程学院）、Yang Zhou（西南交通大学电气工程学院）

💡 毒舌点评

本文将NKP分解、分数阶SGD和子带p范数三个现有技术进行组合，并创新性地提出TNKP策略以调和NKP算法的快收敛与传统算法的低稳态误差矛盾，在多种非高斯/α稳定噪声及真实ANC场景下展现了优于基线算法的性能。然而，论文在理论推导的深度和严谨性上存在根本性短板：1) 分数阶链式法则（式36）的应用（式38）极其粗糙，直接将向量函数的β阶导数等同于对每个分量分别求导再取实部（式41），缺乏严格数学依据；2) β参数的理论范围推导（式51）完全基于确保一个特定期望项E{|e|^{2(p-β)}}有限的简化假设，忽略了算法收敛所需的更严格条件（如梯度期望均值收敛、方差有界），该推导过于启发式；3) TNKP策略的切换阈值ρ完全依赖于事后统计（取后5000点平均值），是一种工程化的后处理手段，而非具备在线自适应能力的真正算法创新，其有效性高度依赖于对系统稳态性能的先验了解。因此，论文的“新”更多停留在工程模块的拼接层面，理论贡献有限。

📌 核心摘要

要解决什么问题：传统的归一化子带p范数（NSPN）算法在处理（1）非高斯输入、（2）特征指数0<α≤1的α稳定噪声以及（3）稀疏系统辨识时性能会显著下降或失效。
方法核心是什么：提出一种基于最近Kronecker乘积（NKP）分解和分数阶随机梯度下降（FoSGD）的归一化子带p范数自适应滤波算法，即NKP-FoNSPN。该算法将长冲激响应分解为Kronecker乘积形式的低秩子分量，并利用分数阶梯度提升鲁棒性。此外，提出一种变换NKP（TNKP）分解策略，结合NKP的快速收敛和传统非NKP算法的低稳态失调。
与已有方法相比新在哪里：首次将NKP分解应用于子带自适应滤波框架；提出了结合NKP和FoSGD的新颖算法；设计了新型TNKP分解策略以降低稳态误差；为有源噪声控制（ANC）场景开发了相应的filtered-x变体（NKP-FxFoNSPN, TNKP-FxFoNSPN）。
主要实验结果如何：在多种噪声（粉红噪声、直升机噪声、枪声、打桩机噪声）下的单通道和多通道ANC仿真及实测实验中，TNKP-FxFoNSPN算法在收敛速度和稳态噪声降低（ANR）方面均优于FxLMS、FxFoNLMP、FxGMCC、FxAPLEHS等基线算法。在系统辨识中，TNKP-FoNSPN在α=0.75的α稳定噪声下取得了与小步长FoNSPN相当的最低稳态NMSD，同时保持了NKP-FoNSPN的快速收敛（论文图10）。
实际意义是什么：为存在强脉冲噪声、非高斯输入以及长冲激响应的ANC场景（如牵引变电站噪声控制）提供了一种潜在更鲁棒、收敛更快的自适应滤波解决方案。
主要局限性是什么：1）分数阶导数链式法则的应用（式38， 41）缺乏严谨的数学推导和理论依据；2）β参数的理论稳定范围（式51）推导基于粗糙假设，不够严格；3）TNKP策略中的切换阈值ρ选择完全依赖经验（取后5000点平均值），缺乏在线自适应指导，且AEC场景下失效（图15）；4）NKP技术要求待辨识系统为低秩结构，对高秩系统性能下降严重（论文图13）；5）算法性能对初始值ι敏感（图6b）。

🔗 开源详情

代码：论文中未提及代码链接。论文详细描述了所提算法（如 NKP-FoNSPN, TNKP-FoNSPN 等）的伪代码（见论文中 Table 4 和 Table 5）和推导过程，但未提供 GitHub 或其他代码托管平台的仓库链接。
模型权重：论文中未提及。本文为理论方法和算法设计论文，未涉及发布预训练模型或权重文件。
数据集：论文中未提及具体数据集名称或下载链接。仿真实验中使用的噪声（如粉色噪声、直升机噪声、枪声、打桩机噪声、牵引变电站噪声）被用作噪声源，但未指明其来源数据集或提供获取链接。
Demo：论文中未提及在线演示或交互式 Demo。
复现材料：论文中未提供训练脚本、配置文件、检查点文件等具体的复现材料包。论文提供了算法仿真的关键参数设置（如滤波器长度 D=500, 子带数 N=4 等）和详细的伪代码，可作为复现的依据。
论文中引用的开源项目：未提及。论文引用的参考文献主要为学术文献，未列出第三方开源软件库或工具的项目名称与链接。论文中提到的算法（如 FxLMS, FxGMCC, FoNLMP 等）为标准或已发表算法，未指明其具体开源实现。

🏗️ 方法概述和架构

本文提出的核心方法是NKP-FoNSPN算法及其在ANC中的应用变体。该算法是一个端到端的自适应滤波框架，其整体流程为：输入信号→分析滤波器组分解为子带信号→基于NKP分解的分数阶p范数误差准则更新子滤波器→合成总滤波器输出。

图1：NKP-FoNSPN算法结构图。图中展示了输入信号x_k经过分析滤波器组(F)分解为子带信号。核心是两个并行的子滤波器更新路径：一条使用更新后的滤波器权重m_{k,1}和输入信号构造新的子输入x_{k,j,2}，更新m_{k,1}；另一条使用m_{k,1}构造输入来更新m_{k,2}。两个子滤波器的输出通过Kronecker乘积合成总滤波器m_k的输出。误差信号e_{k,j,1}和e_{k,j,2}分别来自两个更新路径，并反馈用于指导权重调整。

主要组件详解如下：

子带分解模块
- 功能：将全带高相关输入信号和期望信号分解为多个近似白化的子带信号，以提升收敛速度。内部结构：采用基于余弦调制原理设计的分析滤波器组F，包含N个（通常为4或8）长度为L的滤波器。通过矩阵乘法实现：X_{k,s} = X_k F，其中X_k是包含L个历史输入向量的矩阵。
- 输入输出：输入为全带输入向量x_k和期望信号d_k；输出为子带输入矩阵X_{k,s}和子带期望信号向量d_{k,s}。
NKP分解与合成模块功能：将长为D的待辨识系统冲激响应m0近似表示为Q个低秩Kronecker乘积项的和，从而降低自适应滤波器的参数维数（从D降至D1+D2，其中D1D2≈D）。
- 内部结构：将总自适应滤波器m_k分解为两个子滤波器m_{k,1}（长度D1）和m_{k,2}（长度D2）。通过公式(21)-(23)，总滤波器输出可等价为对两个子滤波器的分别处理。子输入向量x_{k,j,2}和x_{k,j,1}分别由x_{k,j}与当前子滤波器权重通过Kronecker乘积运算构造而来，如式(26)和(29)。
- 输入输出：输入为子带输入x_{k,j}和当前子滤波器权重m_{k,1,q}, m_{k,2,q}；输出为构造的子输入向量x_{k,j,2}, x_{k,j,1}以及最终的总滤波器输出。
分数阶p范数误差准则与更新模块
- 功能：设计一个对非高斯输入和α稳定噪声具有鲁棒性的损失函数，并利用分数阶梯度下降法更新子滤波器权重。
- 内部结构：定义基于MPE准则的损失函数J1(k)和J2(k)（式32-33）。利用分数阶微积分的链式法则（引理1）和幂函数求导法则（引理2），推导出β阶梯度。然而，该推导过程存在重大简化：在式(38)中，将对向量函数求β阶导数等同于对误差项求β阶导数与对输入项求β阶导数的乘积；在式(40)中，对输入项的β阶导数被近似为对每个分量分别求实值β次幂（式41）。最终的子滤波器更新规则为式(43)和(44)。更新核心包含两个非线性项：一是对误差信号e_{k,j}的非线性函数g(·) = sgn(·)|·|^{p-β}，二是对输入信号x的β次幂项Re{(-x)^β}。归一化项||x_{k,j}||_p^p起到了稳定步长的作用。
- 输入输出：输入为子带误差e_{k,j,1/2}、构造的子输入x_{k,j,2/1}和当前子滤波器权重；输出为更新后的子滤波器权重m_{k+r,1}, m_{k+r,2}。
变换NKP分解策略（TNKP）
- 功能：在NKP-FoNSPN的稳态阶段，切换到传统的非NKP更新模式，以降低稳态失调。
- 内部结构：通过一个标志位flag控制（表2）。在瞬态阶段（flag=0），采用NKP-FoNSPN的快速更新规则（式43-44）。切换条件基于性能监控：当检测到归一化均方偏差（NMSD）或平均噪声衰减（ANR）低于预设阈值ρ时，切换至flag=1，并永久采用非NKP的FoNSPN更新规则（式47），使用独立步长μ_b。关键点：阈值ρ是启发式设定的，取为NKP算法稳态性能（如NMSD）最后5000个点的平均值，这意味着该策略在算法运行前需要预先知道或估计其稳态性能，不具备在线自适应能力。
- 输入输出：输入为当前性能指标（NMSD/ANR）和阈值ρ；输出为决定采用哪种更新模式的标志位flag。

组件间的数据流与交互：子带分解模块为后续所有模块提供去相关的输入信号。NKP分解模块利用当前的子滤波器权重构造特殊的子输入信号，并传递给分数阶更新模块。分数阶更新模块利用误差信号和这些构造的输入信号计算梯度，并更新子滤波器权重。更新后的权重又反馈给NKP分解模块，用于下一次的输入构造。TNKP策略模块则在监控整体性能后，向分数阶更新模块发送模式切换指令。

关键设计选择及动机：选择NKP分解是因为长冲激响应系统通常具有低秩特性，可以大幅降低计算复杂度和加速收敛（动机1）。选择分数阶SGD是因为它能处理传统MSE准则失效的α稳定噪声（0<α≤1）和非高斯输入（动机2）。设计TNKP策略是为了解决NKP算法固有的稳态误差较高的问题（动机3，由图2实验证明）。将以上技术结合并扩展至ANC场景（动机4），是为了提供一个更全面的解决方案。

💡 核心创新点

提出NKP-FoNSPN算法：首次将NKP分解技术引入子带自适应滤波框架，并结合分数阶SGD。这解决了传统NSPN在α≤1噪声、非高斯输入下的性能恶化问题，同时利用NKP提升了长冲激响应系统的收敛速度。
设计TNKP分解策略：提出一种自适应切换机制，在瞬态阶段利用NKP的快速收敛，在稳态阶段切换至非NKP的低失调更新模式。这有效调和了NKP算法快收敛与低稳态误差之间的矛盾（实验图8、图9-12验证）。然而，该策略的切换阈值ρ依赖于对NKP算法稳态性能的经验性后验统计，工程化色彩浓厚。
推导分数阶参数β的理论范围：基于α稳定噪声的特征指数α和p范数参数p，推导了确保算法收敛的分数阶β的理论取值范围（式51）。但该推导基于E{|e|^{2(p-β)}}需有限的粗糙要求，理论依据不充分。
开发Filtered-x变体并拓展至ANC应用：将NKP-FoNSPN和TNKP-FoNSPN算法成功扩展至有源噪声控制领域，形成NKP-FxFoNSPN和TNKP-FxFoNSPN，并通过多种真实噪声和实际/模拟ANC系统（单通道导管、多通道）验证了其有效性。

📊 实验结果

论文通过系统辨识（SI）、声学回声消除（AEC）和有源噪声控制（ANC）三大类场景，大量对比实验验证了所提算法的有效性。

系统辨识（SI）主要结果（以网络回声路径为例）：

在α=1.5的α稳定噪声下（图9）：NKP-FoNSPN（μ=0.0112）和TNKP-FoNSPN（μ=0.0112）的收敛速度均快于FoNSPN（μ=0.08）、FoNLMP、FoMVC和NKP-GHSAF。TNKP-FoNSPN最终达到了与FoNSPN（μ=0.006）相当的稳态NMSD，实现了速度与稳态的更好权衡。
在α=0.75的α稳定噪声下（图10）：NKP-NSPN（β=1）和NSPN（μ=0.1）因噪声特性而无法收敛。在可收敛的算法中，NKP-FoNSPN（μ=0.0112）收敛最快，但稳态误差高。TNKP-FoNSPN（μ=0.0112， μ_b=0.004）最终达到了FoNSPN（μ=0.006）的最低稳态误差，同时保持了快速收敛。
在非高斯输入（Cauchy噪声）下（图11）：NKP-NSPN和NKP-GHSAF不收敛。FoNSPN算法族表现良好。NKP-FoNSPN（μ=0.009）性能最优，TNKP-FoNSPN进一步提升了稳态性能。

有源噪声控制（ANC）主要结果：论文使用了多种真实噪声和多通道仿真进行验证。关键结果汇总如下表：

噪声类型	算法	评价指标	关键观察（来自图17-19，22，24）
粉红噪声 (图17)	FxLMS	ANR收敛/稳态	收敛最慢，稳态一般
	FxFoNLMP		收敛快于FxLMS
	FxGMCC		收敛适中，稳态优于FxFoNLMP
	FxAPLEHS		收敛快，稳态好
	NKP-FxFoNSPN		收敛最快，但稳态差
	TNKP-FxFoNSPN		收敛极快（接近NKP），稳态达到最佳（类似FxAPLEHS）
真实枪声 (图18)	对比算法	ANR曲线	FxAPLEHS和TNKP-FxFoNSPN表现最优，后者初期收敛更快
直升机/打桩机噪声 (图19)	对比算法	ANR曲线	TNKP-FxFoNSPN在所有噪声下均取得最佳噪声降低效果
真实牵引变电站噪声-单通道 (图22)	对比算法	ANR曲线	TNKP-FxFoNSPN在收敛速度和稳态ANR上均优于所有基线算法
多通道ANC (图24)	CFxLMS, MFxGMCC, MFxFoNLMP, MFxFoNSPN, NKP-MFxFoNSPN	ANR_s曲线	NKP-MFxFoNSPN收敛快但稳态差；TNKP-MFxFoNSPN收敛最快，稳态优于NKP版本

高秩系统（图13b）：当待辨识系统为非低秩随机系统时，所有NKP分解算法（NKP-FoNSPN, NKP-NSPN, NKP-GHSAF）性能均显著下降，而传统非NKP算法（FoNSPN, FoNLMP）表现更好，证实了NKP技术对系统低秩性的依赖。
声学回声消除（AEC）（图15）：在AEC场景下，TNKP-FoNSPN的效果不如NKP-FoNSPN，因为切换后的FoNSPN算法在该场景下稳态误差较高，导致TNKP策略未能带来优势。NKP-FoNSPN在此场景表现最优。

🔬 细节详述

训练数据：系统辨识中使用了两种标准回声路径IR（网络G.168和声学回声路径）。输入信号为零均值高斯噪声通过一阶自回归模型（极点0.9）生成，或直接使用Cauchy噪声（α=1）。ANC中使用了多种真实噪声录音（��红、直升机、枪声、打桩机、牵引变电站噪声）。多通道ANC仿真的传递函数在文中给出。
损失函数：核心为均p次幂误差（MPE）准则及其分数阶扩展，即J(k)=Σ|e_{k,j}|^p，及其分数阶梯度版本（式32-33，43-44）。
训练策略/关键超参数：
- 分析滤波器组：N=4，L=33。
- 自适应滤波器总长度D=500（SI），子滤波器D1=25， D2=20（Q通常取2）。
- 步长μ：根据算法和场景在0.001至0.1之间调整。
- p范数参数p：根据α值选择，通常满足1≤p<α≤2。对于α=1.5，p=1.4；对于α=0.75，p=0.7。
- 分数阶β：根据式(51)范围选择，例如对于α=1.5，p=1.4，β=1.1；对于α=0.75，p=0.7，β=0.65。
- TNKP切换阈值ρ：取NKP算法稳态NMSD最后5000个点的平均值（经验性设定）。
- TNKP切换后步长μ_b：通常小于主步长μ。子滤波器初始值：论文测试了两种初始化方法（Method-I: [ι, 0…0]^T; Method-II: ιI），并发现性能对ι敏感（图6b），但未给出选择ι的理论指导。
训练硬件：论文中未说明具体硬件环境。
推理细节：自适应滤波本身是在线学习过程，不涉及传统意义上的推理。算法伪代码见表4、5。
正则化/稳定技巧：归一化项||x_{k,j}||p^p和||x{k,j,2}||_p^p起到了归一化步长的作用，可稳定更新并控制步长，尤其在输入存在脉冲时能自适应减小步长。

⚖️ 评分理由

创新性：1.5/3 论文将NKP分解、分数阶SGD和子带p范数三个已有技术进行组合，并应用于一个新的组合问题（长冲激响应+非高斯/脉冲噪声环境下的自适应滤波）。TNKP策略的提出有一定新意，但其核心（阈值ρ）是启发式后处理，而非在线自适应算法。整体属于“组合式创新”，缺乏深刻的理论洞察或方法学上的本质突破。创新点成立但不算非常突出。

技术严谨性：0.5/2 推导存在严重瑕疵。1) 分数阶链式法则的应用（式38）极其粗糙，将向量函数的β阶导数简单处理为标量导数与向量导数的β次幂乘积，且对向量导数的β次幂处理（式40-41）缺乏严格数学定义和证明，直接取实部近似。2) β范围的推导（式50-51）仅基于确保E{|e|^{2(p-β)}}有限的单一假设，忽略了算法均值收敛和方差分析所需的其他必要条件，该推导是启发式的，不能作为可靠的理论保证。3) TNKP策略中阈值ρ的选择完全是后验经验统计，不具备在线自适应性，且在AEC场景下失效（图15）。

实验充分性：1.5/2 实验非常充分，覆盖了系统辨识、AEC和ANC三大场景，使用了多种标准IR、真实噪声源、单/多通道系统，对比算法全面（NSPN, FoNLMP, FoMVC, NKP-GHSAF等）。消融实验（如验证β范围、TNKP有效性、高秩系统）也较好地支撑了论点。主要不足是：1) 参数选择部分（图6）虽有展示，但未深入分析不同参数间的交互影响；2) 在AEC场景下TNKP策略失效（图15）虽被观察到，但未进行深入讨论或提出改进。

清晰度：0.5/1 论文结构完整，符号定义清晰（表1），算法流程和架构图（图1，4）能帮助理解。但存在一些问题：1) 核心推导（如式38-41，51）跳跃极大，可读性差且缺乏严谨性说明；2) 符号较多且有些复杂（如M_{k,1,q}, M_{k,2,q}），易混淆；3) 图1和图4的“Synthesizer”模块具体操作（如m_k = Σ m_{k,2,q} ⊗ m_{k,1,q}）应在图中或文字中更突出解释。整体可读但需要较高领域知识，且推导部分是重大缺陷。

影响力：0.5/1 研究领域相对小众（自适应滤波、ANC），但论文在该垂直领域内具有完整性和较好的应用价值。提出的TNKP策略对其他NKP类算法有参考意义。然而，对更广泛的音频处理社区（如语音识别、生成模型）读者相关性较低。潜在推动作用有限，更偏向于工程应用的改进。

可复现性：0.5/1 论文详细列出了大部分关键超参数（μ, p, β, N, L, r, Q, D1, D2等）和算法伪代码。提供了标准的回声路径IR。然而，论文中未提及任何代码链接、开源仓库或模型权重。核心参数“初始值ι”的选择（图6b）虽有实验，但未给出明确推荐值或理论依据，这为完全复现带来一定障碍。仅靠论文信息，复现需要较高的领域经验。

本篇论文工作扎实，在解决特定组合问题上取得了明确的性能提升，实验全面。但理论严谨性存在严重缺陷，推导过程存在根本性问题；创新性更多是技术组合而非范式突破；影响力限于特定子领域，且未提供代码，整体属于合格到良好范畴。

🚨 局限与问题

论文明确承认的局限：

NKP技术的低秩限制：论文在图13和相关分析中明确承认，所提出的NKP分解技术在待辨识系统为高秩（非低秩）时性能会显著下降，甚至不如传统算法。
TNKP策略在AEC场景的失效：论文在图15的分析中指出，在AEC场景下，TNKP-FoNSPN算法的性能不如NKP-FoNSPN算法，因为切换后的FoNSPN算法在该场景下稳态误差较高，导致TNKP策略未能带来优势。
参数选择依赖经验：论文中虽然探讨了部分参数（如N, r, ι）的影响，但多个关键参数（如p, β的具体选择，以及TNKP中的ρ, μ_b）仍高度依赖经验或对噪声特性（α）的先验知识。

审稿人发现的潜在问题：

理论推导的根本性缺陷：如前所述，分数阶链式法则的应用（式38-41）是论文理论部分的核心，但其处理方式（特别是对向量函数求β阶导数）在数学上是不严谨的，近似步骤（式41）缺乏充分论证。这严重削弱了整个算法推导的可信度。β参数范围的推导（式51）同样缺乏收敛性分析所需的严格证明。
TNKP策略的工程化本质与鲁棒性问题：切换阈值ρ基于历史性能平均值，这要求算法已经运行到稳态才能计算，且对系统变化敏感。在实际非平稳环境中，无法自适应确定切换时机。论文未讨论若ρ设置不当（过高或过低）对算法性能的影响，也未分析切换过程本身可能引入的瞬态波动。
实验对比的公平性：在对比实验中，不同算法采用了不同的步长μ以追求各自最佳性能。虽然这是常见的做法，但在公平性上可进一步探讨：在相同计算复杂度预算或相同最终稳态误差下，比较算法的收敛速度。
计算复杂度分析的实用性：论文提供了详细的复杂度分析（表3，图3），但NKP和TNKP引入的额外结构（如Kronecker乘积运算）在实际硬件（如DSP）上实现的额外开销和延迟是否被充分考虑？文中未提及。TNKP策略增加的监控和切换逻辑也带来了额外的实现复杂度。
算法初始化敏感性：论文通过图6(b)展示了算法性能对子滤波器初始值ι敏感，但未提供选择最优ι的理论或实用指南，这给实际应用带来不确定性。

← 返回 2026-05-19 论文速递

分数阶微积分 on 语音/音频论文速递