Latent-Hysteresis Graph ODEs: Modeling Coupled Topology-Feature Evolution via Continuous Phase Transitions

📄 Latent-Hysteresis Graph ODEs: Modeling Coupled Topology-Feature Evolution via Continuous Phase Transitions #图神经网络 #图神经微分方程 #连续深度模型 #特征崩溃 🔥 8.0/10 | 前25% | #图神经网络 | #图神经微分方程 | #连续深度模型 #特征崩溃 | arxiv 学术质量 6.0/7 | 选题价值 1.5/2 | 复现加成 0.5 | 置信度 高 👥 作者与机构 第一作者:Qinhan Hou(未说明) 通讯作者:未说明 作者列表:Qinhan Hou(未说明)、Jing Tang(未说明) 💡 毒舌点评 这篇论文的亮点在于敏锐地抓住了连续深度图模型(Graph ODE)在理论上的一个致命弱点——“单调性陷阱”,并受物理学启发,设计了一套精巧的迟滞动力学机制从原理上进行规避。其短板在于,虽然在多个基准上验证了有效性,但提出的耦合ODE系统增加了显著的计算复杂度和调参难度,且“候选边池”的设计在理论保证与工程可扩展性之间做出的妥协,可能削弱了部分理论结论的普适性。 📌 核心摘要 这篇论文首先从理论层面指出,一类重要的图神经微分方程(Graph ODE)在长时演化下会面临“单调性陷阱”:当传播算子满足行随机且严格正时,所有节点特征会不可避免地收敛到一个全局共识状态,导致信息泄漏和特征崩溃。为解决此问题,作者提出了迟滞图微分方程(HGODE),其核心创新是将图的拓扑结构建模为一个与特征共同演化的连续动力状态。通过为每条边引入一个由“双阱势”驱动的潜势变量,并利用一个可学习的力函数进行调控,HGODE能够实现可微分的拓扑相变,使边极化为“连通”或“绝缘”两种状态,从而动态改变混合结构,避免全局共识。在理论分析、合成的随机块模型(SBM)诊断实验以及多个真实世界的节点和图分类基准(如Chameleon, ogbn-proteins, ZINC)上,HGODE均表现出优于现有连续深度基线的性能,特别是在异配性和长程依赖建模方面。 🏗️ 模型架构 HGODE的核心架构是耦合的特征-拓扑ODE系统,它联合演化节点特征矩阵 H(t) 和一个潜在的边势能矩阵 U(t)。 整体流程: 初始化:给定一个初始图,构造一个稀疏的候选边集合 $\mathcal{E}{cand}$(例如包含原始边、2跳邻居、拉普拉斯随机游走邻居等)。为候选边初始化潜势 $U{ij}$。 耦合动力学演化:在连续时间 $t$ 内,系统通过以下ODE同步演化: 特征演化方程:$\tau_{feat} \frac{d\mathbf{H}(t)}{dt} = \mathcal{G}{\phi}(\mathbf{H}(t), \mathbf{A}(t)) - \gamma \mathbf{H}(t)$。其中 $\mathcal{G}{\phi}$ 是一个图神经算子(如基于扩散的),它根据当前有效邻接矩阵 $\mathbf{A}(t)$ 聚合邻居信息。$\gamma$ 是特征衰减系数。 拓扑势能演化方程:$\tau_{topo} \frac{d\mathbf{U}(t)}{dt} = (1-\lambda)\mathbf{U}(t) - \mathbf{U}(t)^3 + \mathcal{F}{\theta}(\mathbf{H}(t))$。这是一个受力驱动的双阱动力学。$\mathcal{F}{\theta}$ 是一个由节点特征计算出的力函数(例如,通过一个MLP处理拼接的节点特征 $[h_i || h_j]$ 得到),它打破了势能的对称性,引导边潜势向正(连通)或负(绝缘)稳定点演化。参数 $\lambda$ 控制势阱的深度。 潜势到有效传播权重的转换:有效邻接矩阵 $\mathbf{A}(t)$ 通过一个门控函数从 $\mathbf{U}(t)$ 得到:$\mathbf{A}{ij}(t) = \sigma(U{ij}(t)/\tau) \cdot \mu(t) \cdot \mathbf{1}[(i,j) \in \mathcal{E}_{cand}]$。其中 $\sigma$ 是sigmoid函数,将潜势映射到(0,1)区间;$\tau$ 是温度参数;$\mu(t)$ 是结构退火调度,用于逐渐抑制弱连接。 最终预测:ODE求解器积分上述系统至设定时间 $T$,取终态 $\mathbf{H}(T)$ 作为节点表示,用于下游任务。 关键组件交互:特征演化依赖于由拓扑势能生成的时变图结构;而拓扑势能的演化又反过来由当前的节点特征驱动。这种双向耦合形成了闭环,使得图结构能够根据特征信息动态调整,并通过迟滞动力学保持结构记忆,避免频繁切换。求解器采用自适应步长的Dormand-Prince方法(dopri5),以处理在分岔点附近可能出现的快速变化。 ...

2026-04-28

语音/音频论文速递 2026-04-28

语音/音频论文速递 2026-04-28 共分析 24 篇论文 ⚡ 今日概览 📥 抓取 24 篇 → 🔬 深度分析完成 🏷️ 热门方向 方向 数量 分布 #语音合成 2篇 ██ #语音伪造检测 2篇 ██ #音视频 1篇 █ #音频大模型 1篇 █ #语音生物标志物 1篇 █ #语音生成 1篇 █ #语音情感识别 1篇 █ #图神经网络 1篇 █ 📊 论文评分排行榜(24 篇,按分数降序) 排名 论文 评分 分档 主任务 🥇 Hallo-Live: Real-Time Streaming Joint Audio-Video Avata 8.5分 前25% #音视频 🥈 HeadRouter: Dynamic Head-Weight Routing for Task-Adapti 8.0分 前25% #音频大模型 🥉 Comparison of sEMG Encoding Accuracy Across Speech Mode 8.0分 前25% #语音生物标志物 4. Scaling Properties of Continuous Diffusion Spoken Langu 8.0分 前25% #语音生成 5. Psychologically-Grounded Graph Modeling for Interpretab 8.0分 前25% #语音情感识别 6. Latent-Hysteresis Graph ODEs: Modeling Coupled Topology 8.0分 前25% #图神经网络 7. Meta-Ensemble Learning with Diverse Data Splits for Imp 8.0分 前25% #音频分类 8. CineAGI: Character-Consistent Movie Creation through LL 8.0分 前25% #跨模态 9. Listening with Time: Precise Temporal Awareness for Lon 8.0分 前25% #音频场景理解 10. An event-based sequence modeling approach to recognizin 7.5分 前25% #音乐理解 11. Speech Enhancement Based on Drifting Models 7.5分 前25% #语音增强 12. Talker-T2AV: Joint Talking Audio-Video Generation with 7.5分 前25% #语音合成 13. Explainable AI in Speaker Recognition – Making Latent 7.5分 前25% #说话人识别 14. Predictive Directional Selective Fixed-Filter Active No 7.5分 前25% #声源定位 15. RAS: a Reliability Oriented Metric for Automatic Speech 7.5分 前25% #语音识别 16. Robust Audio-Text Retrieval via Cross-Modal Attention a 7.5分 前25% #音频检索 17. RTCFake: Speech Deepfake Detection in Real-Time Communi 7.0分 前25% #语音伪造检测 18. MAGIC-TTS: Fine-Grained Controllable Speech Synthesis w 7.0分 前25% #语音合成 19. TTS-PRISM: A Perceptual Reasoning and Interpretable Spe 7.0分 前25% #语音合成评估 20. All That Glitters Is Not Audio: Rethinking Text Priors 6.5分 前50% #音频问答 21. Opening the Design Space: Two Years of Performance with 6.5分 前50% #音乐生成 22. Spectro-Temporal Modulation Representation Framework fo 6.5分 前50% #语音伪造检测 23. Come Together: Analyzing Popular Songs Through Statisti 6.5分 前50% #音乐信息检索 24. A Functorial Formulation of Neighborhood Aggregating De 6.5分 前25% #理论分析 📋 论文列表 🥇 Hallo-Live: Real-Time Streaming Joint Audio-Video Avatar Generation with Asynchronous Dual-Stream and Human-Centric Preference Distillation 🔥 8.5/10 | 前25% | #音视频 | #扩散模型 | #知识蒸馏 #流式处理 | arxiv ...

2026-04-28