数据集对齐

ICASSP 2026 - 数据集对齐共 1 篇论文 ← 返回 ICASSP 2026 总览排名论文评分分档 🥇 Structure-Aware Diffusion Schrödinger Bridge 7.7分前50% 📋 论文详情 🥇 Structure-Aware Diffusion Schrödinger Bridge ✅ 7.7/10 | 前50% | #数据集对齐 | #扩散模型 | #领域适应 👥 作者与机构第一作者：未说明通讯作者：未说明作者列表：Dawnlicity Charls (新南威尔士大学电气工程与电信学院)、Tharmakulasingam Sirojan (新南威尔士大学电气工程与电信学院)、Vidhyasaharan Sethu (新南威尔士大学电气工程与电信学院)、Beena Ahmed (新南威尔士大学电气工程与电信学院) 💡 毒舌点评亮点：巧妙地将Gromov-Wasserstein距离的核心思想（保持相对结构）转化为一个可直接加入扩散模型训练的正则化损失项，用最小的“补丁”解决了Schrödinger Bridge在数据对齐中破坏数据拓扑的实际痛点。短板：整篇论文的实验说服力严重依赖“在合成数据上效果好”这一环，若没有在如MRI-CT转换、跨域图像翻译等真实且公认的挑战性任务上展示其“结构保持”带来的下游性能提升（如分类准确率），这篇工作更像一个“技术上可行、但尚未证明实用价值”的实验性探索。 🔗 开源详情代码：论文中未提及本工作（SDSB）的代码仓库链接。模型权重：未提及公开模型权重。数据集：使用了合成数据集，未提及是否公开具体生成脚本或数据文件。 Demo：未提供在线演示。复现材料：论文提及了基于DSBM [8]的代码库进行实现，并给出了关键超参数（λ=100，内/外层迭代次数，网络结构等），但未提供完整的训练配置文件或详细步骤。论文中未提及开源计划。论文中引用的开源项目：明确引用并基于 [8] Diffusion Schrödinger Bridge Matching 的代码库进行实验。 📌 核心摘要 ...

📄 Structure-Aware Diffusion Schrödinger Bridge #数据集对齐 #扩散模型 #领域适应 ✅ 7.7/10 | 前50% | #数据集对齐 | #扩散模型 | #领域适应学术质量 6.2/7 | 选题价值 1.5/2 | 复现加成 0.0 | 置信度中 👥 作者与机构第一作者：未说明通讯作者：未说明作者列表：Dawnlicity Charls (新南威尔士大学电气工程与电信学院)、Tharmakulasingam Sirojan (新南威尔士大学电气工程与电信学院)、Vidhyasaharan Sethu (新南威尔士大学电气工程与电信学院)、Beena Ahmed (新南威尔士大学电气工程与电信学院) 💡 毒舌点评亮点：巧妙地将Gromov-Wasserstein距离的核心思想（保持相对结构）转化为一个可直接加入扩散模型训练的正则化损失项，用最小的“补丁”解决了Schrödinger Bridge在数据对齐中破坏数据拓扑的实际痛点。短板：整篇论文的实验说服力严重依赖“在合成数据上效果好”这一环，若没有在如MRI-CT转换、跨域图像翻译等真实且公认的挑战性任务上展示其“结构保持”带来的下游性能提升（如分类准确率），这篇工作更像一个“技术上可行、但尚未证明实用价值”的实验性探索。 🔗 开源详情代码：论文中未提及本工作（SDSB）的代码仓库链接。模型权重：未提及公开模型权重。数据集：使用了合成数据集，未提及是否公开具体生成脚本或数据文件。 Demo：未提供在线演示。复现材料：论文提及了基于DSBM [8]的代码库进行实现，并给出了关键超参数（λ=100，内/外层迭代次数，网络结构等），但未提供完整的训练配置文件或详细步骤。论文中未提及开源计划。论文中引用的开源项目：明确引用并基于 [8] Diffusion Schrödinger Bridge Matching 的代码库进行实验。 📌 核心摘要解决什么问题：现有的基于Schrödinger Bridge (SB)的数据集对齐方法在学习分布间的映射时，缺乏对数据内在几何结构（如聚类、相对距离）的感知，可能导致在传输过程中破坏这些对下游任务至关重要的结构。方法核心：提出Structure-aware Diffusion Schrödinger Bridge (SDSB)，在原始Diffusion Schrödinger Bridge (DSB)的训练损失中，加入一个基于Gromov-Wasserstein (GW) 距离的结构正则化项。该正则化项通过最小化每个扩散步前后样本距离矩阵的差异，迫使模型在传输分布的同时保持样本间的相对关系。与已有方法相比新在哪里：与需要成对数据的SB-ALIGN相比，SDSB完全无监督；与解决离散最优传输的Gromov-Wasserstein方法相比，SDSB能在连续空间操作；最重要的是，与标准DSB相比，SDSB通过显式约束改变了优化目标，从纯粹的熵最优传输变为结构感知的传输。主要实验结果：在合成数据集（双月形、高斯混合）上验证了SDSB的有效性。几何保持：将月牙数据旋转60°时，DSB会分裂月牙，而SDSB保持了其完整形状（如图2所示）。尺度不变性：将月牙数据旋转并缩放时，SDSB能更好地学习旋转变换，生成的样本更贴合目标分布（如图4所示）。聚类保持：在高斯混合模型传输实验中，SDSB的聚类传输分数显著高于DSB，更接近理想值，表明其更好地保持了聚类结构（定量结果见下表）。维度 DSB SDSB (本文) 真实分布 2 -21.8 -3.8 -2.8 5 -31.3 -9.3 -7.1 10 -38.8 -17.4 -14.2 20 -50.2 -32.7 -28.4 50 -100.8 -76.7 -71.0 表：高斯混合模型聚类传输分数（越高越好）。 5. 实际意义：为需要保持数据内在结构（如类别、相对关系）的数据集对齐任务（如无监督域适应、跨域图像翻译）提供了一种新的、完全无监督的算法选择。 6. 主要局限性：论文所有验证均在低维合成数据集上进行，未在任何真实世界的高维数据集（如图像、语音）上进行评估，其实用性和泛化能力未得到证明。训练时间加倍也是潜在的应用障碍。 🏗️ 模型架构本文未提出全新的神经网络架构，而是在现有的Diffusion Schrödinger Bridge (DSB)训练框架上添加了一个正则化项。SDSB的整体架构/训练流程如下： ...