CHSIM数据集当前大部分模型对于Acc_3和Acc_2的准确率有多高
Creato il: 22 marzo 2026
Risposto usando GPT-5.4 Thinking da Chat01
Creato il: 22 marzo 2026
Risposto usando GPT-5.4 Thinking da Chat01
CHSIM数据集当前大部分模型对于Acc_3和Acc_2的准确率有多高
如果你问的是 CH-SIMS(原版 1.0),按近几年论文里最常见的公开结果看,大部分模型的 Acc_2 大约在 78%–82% 之间,Acc_3 大约在 65%–70% 之间;更强的一档通常在 Acc_2≈81%–82%、Acc_3≈69%–70%。(arXiv)
更细一点看:
早期/经典模型大多在这个水平:
TFN、LMF、MulT、MISA、Self-MM 这类模型,Acc_2 大致从 76.5% 到 80.0%,Acc_3 大致从 64.7% 到 66.1%。例如 EMT 统一复现实验里,TFN/LMF/MulT/MISA/Self-MM 的 Acc_2 分别约为 77.1/77.4/78.6/76.5/80.0,Acc_3 能看到的大概在 65.7、66.1 这一档;EMT 自己做到 Acc_2=80.1、Acc_3=67.4。(arXiv)
2023–2025 的较强模型已经把上限推到 70 左右的 Acc_3:
ALMT 在 CH-SIMS 上报告 Acc_2=81.19、Acc_3=68.93;ConFEDE 报告 Acc_2=82.23、Acc_3=70.15;SFTTR 报告 Acc_2=81.62、Acc_3=70.24。所以如果你说“现在强一点的主流模型”,我会把它们概括成 Acc_2 约 81–82,Acc_3 约 69–70。(arXiv)
不同论文的统一复现设定差异很大,所以也会看到一些数值没那么高:
例如 DEVA 报告 Acc_2=79.64、Acc_3=65.42;DashFusion 报告 Acc_2=79.21、Acc_3=66.82;FeaDA 报告 Acc_2=79.43、Acc_3=65.43。这说明 CH-SIMS 上的结果对 特征抽取、是否统一复现、是否使用单模态标签、训练细节 很敏感,不能只看单篇论文横向比较。(arXiv)
所以一个比较实用的概括是:
如果你要,我可以下一条直接给你整理一份 CH-SIMS 上 10 个代表模型的 Acc_2 / Acc_3 对照表。