Mitigating Shared-Private Branch Imbalance via Dual-Branch Rebalancing for Multimodal Sentiment Analysis
📄 Mitigating Shared-Private Branch Imbalance via Dual-Branch Rebalancing for Multimodal Sentiment Analysis #多模态模型 #对比学习 #跨模态 #情感分析 #基准测试 ✅ 7.5/10 | 前25% | #多模态模型 | #对比学习 | #跨模态 #情感分析 | arxiv 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.2 | 置信度 高 👥 作者与机构 第一作者:Chunlei Meng(复旦大学智能机器人与先进制造学院) 通讯作者:Chun Ouyang(复旦大学智能机器人与先进制造学院,邮箱标为*) 作者列表:Chunlei Meng(复旦大学)、Jiabin Luo(北京大学)、Pengbin Feng(南加州大学)、Zhenglin Yan(复旦大学)、Chengyin Hu(中国石油大学北京克拉玛依校区)、Zhongxue Gan(复旦大学)、Chun Ouyang(复旦大学) 💡 毒舌点评 亮点:论文对现有共享-私有分解方法中“分支不平衡”问题的诊断非常精准,提出的两个针对性模块(处理共享冗余的TSF和防止私有特征稀释的AGPR)逻辑清晰,并通过可视化证据(如t-SNE、注意力分布)有力支持了其论点。短板:整体框架模块较多,增加了理解和调参的复杂度;此外,方法在很大程度上依赖于作为基础的“标准多模态解码”阶段,对该阶段质量的敏感性未被充分探讨。 📌 核心摘要 问题:论文指出,在多模态情感分析的共享-私有分解框架中,模态异质性并未被消除,而是导致了“共享-私有分支不平衡”:共享分支积累冗余且偏向主导模态的模式,而私有分支在交互中逐渐同质化,丧失判别性。 方法核心:提出双分支再平衡框架(DBR)。它在标准多模态解码(MD)后,用时序-结构分解(TSF) 模块在共享分支中分离并自适应融合时序与结构信息,抑制冗余;用锚点引导的私有路由(AGPR) 模块在私有分支中保留模态特异性并调控跨模态借用;最后用双向再平衡融合(BRF) 模块将两个正则化后的分支进行上下文感知的集成。 创新点:与现有方法侧重于更干净的分解或更强的交互不同,DBR首次将“分支不平衡”作为统一问题进行诊断和协同治理,其创新在于提出了一套针对性的“再平衡”机制,而非简单增加交互强度。 实验结果:在CMU-MOSI、CMU-MOSEI和MIntRec三个基准上,DBR在所有评估指标上均超越了现有方法。例如,在MOSI上,DBR的Acc-7达到49.26%,比次优方法高2.18%;在MOSEI上,Acc-7达到55.62%,MAE降至0.526。消融实验显示,移除任一模块(TSF, AGPR, BRF)均会导致性能下降,其中AGPR影响最大。 实际意义:该工作为解决多模态表示学习中的信息冗余与特异性丧失提供了新的视角和有效框架,有助于提升模型对复杂情感的理解鲁棒性,对情感计算、人机交互等领域有推动作用。 主要局限性:框架由多个模块组成,增加了计算和实现的复杂性(尽管效率分析显示其每轮时间与近期SOTA相当);论文主要关注情感分析任务,方法在其他多模态任务上的泛化能力有待验证。 🏗️ 模型架构 DBR框架建立在一个标准的多模态解码(MD)阶段之上,整体流程为:多模态特征编码与解码 -> 双分支(共享/私有)再平衡 -> 双向融合与预测。 ...