CHSIM数据集当前大部分模型对于Acc_3和Acc_2的准确率有多高

如果你问的是 CH-SIMS（原版 1.0），按近几年论文里最常见的公开结果看，大部分模型的 Acc_2 大约在 78%–82% 之间，Acc_3 大约在 65%–70% 之间；更强的一档通常在 Acc_2≈81%–82%、Acc_3≈69%–70%。(arXiv)

更细一点看：

早期/经典模型大多在这个水平：
TFN、LMF、MulT、MISA、Self-MM 这类模型，Acc_2 大致从 76.5% 到 80.0%，Acc_3 大致从 64.7% 到 66.1%。例如 EMT 统一复现实验里，TFN/LMF/MulT/MISA/Self-MM 的 Acc_2 分别约为 77.1/77.4/78.6/76.5/80.0，Acc_3 能看到的大概在 65.7、66.1 这一档；EMT 自己做到 Acc_2=80.1、Acc_3=67.4。(arXiv)
2023–2025 的较强模型已经把上限推到 70 左右的 Acc_3：
ALMT 在 CH-SIMS 上报告 Acc_2=81.19、Acc_3=68.93；ConFEDE 报告 Acc_2=82.23、Acc_3=70.15；SFTTR 报告 Acc_2=81.62、Acc_3=70.24。所以如果你说“现在强一点的主流模型”，我会把它们概括成 Acc_2 约 81–82，Acc_3 约 69–70。(arXiv)
不同论文的统一复现设定差异很大，所以也会看到一些数值没那么高：
例如 DEVA 报告 Acc_2=79.64、Acc_3=65.42；DashFusion 报告 Acc_2=79.21、Acc_3=66.82；FeaDA 报告 Acc_2=79.43、Acc_3=65.43。这说明 CH-SIMS 上的结果对 特征抽取、是否统一复现、是否使用单模态标签、训练细节 很敏感，不能只看单篇论文横向比较。(arXiv)

所以一个比较实用的概括是：

普通主流模型：Acc_2 约 78–80，Acc_3 约 65–67
较强主流模型：Acc_2 约 81–82，Acc_3 约 69–70
当前 very recent 结果：有 2026 年新论文声称在 CH-SIMS 上比此前最佳再提升 +2.72 Acc_2 和 +7.17 Acc_3，但我现在拿到的公开摘要片段里没有完整表格，所以不想直接替你报一个未经核实的绝对值。(ScienceDirect)

如果你要，我可以下一条直接给你整理一份 CH-SIMS 上 10 个代表模型的 Acc_2 / Acc_3 对照表。

Domanda