Effective Depth in Joint Source-Channel Coding: An Implicit Equilibrium Analysis
📄 Effective Depth in Joint Source-Channel Coding: An Implicit Equilibrium Analysis #语音编码 #多模态模型 #信号处理基础 7.0/10 | 创新 8/2 | 严谨 7/1.5 | 实验 7/1.5 | 清晰 7/1 | 影响 6/1.5 | 开源 0/1.5 | 复现 7/0.5 | 工程 7/1.5 ✅ 7.0/10 | 前50% | #语音编码 | #多模态模型 | #信号处理基础 | arxiv 👥 作者与机构 作者: Kaiwen Yu, Gang Wu, Xiaodong Xu, Yi Ma, Rahim Tafazolli 单位: 电子科技大学 (国家无线通信重点实验室),北京邮电大学 (网络与交换技术国家重点实验室),鹏城实验室,萨里大学 (5GIC & 6GIC) 邮箱: yukaiwen@uestc.edu.cn; wugang99@uestc.edu.cn; xuxiaodong@bupt.edu.cn; y.ma@surrey.ac.uk; r.tafazolli@surrey.ac.uk 💡 毒舌点评 这篇论文的立意是好的,试图解决Deep JSCC中“固定深度”的痛点。但把DEQ和NNGP这套组合拳用在图像JSCC上,就像是用高射炮打蚊子——理论很漂亮,实际收益存疑。作者声称“参数复杂度与有效深度无关”,但实验里的表格显示其参数量远超最简单的DeepJSCC,只是比SwinJSCC小。那个深度-SNR理论模型,校准过程依赖一个特定的验证集,换个数据集恐怕就得重新标定,通用性要打个大问号。最关键是,整篇论文围绕图像传输,跟本领域(语音/音频)的结合点在哪里?一个处理RGB像素的框架,能直接套到梅尔频谱或波形上吗?结论下得太早,影响力有限。 ...