国际象棋引擎ai的elo是如何计算的,和人类elo有什么可比性吗
Creato il: 17 giugno 2025
Creato il: 17 giugno 2025
国际象棋引擎ai的elo是如何计算的,和人类elo有什么可比性吗
核心结论先行
举例 | 数据量 | 评分工具 | 重要约定 |
---|---|---|---|
CCRL 40/15 | 1 967 497 局,3 973 程序 | BayesElo | 同一台 i7-4770K,40 步/15 分,Ponder Off computerchess.org |
TCEC | 每季全部现场赛局 | Ordo | 所有参赛引擎同一 Linux 服务器,统一开局库,生成赛季 Elo 表 en.wikipedia.org |
流程(以 CCRL 为例)
readpgn …
elo
→ mm
(最大似然迭代)。offset 2800 Fruit
给某个参照引擎定“零点”,让数值看起来接近人类标尺 remi-coulom.fr。ratings
,同时给出 ±σ(统计误差)。小结:同一榜单内相对差值很可信(>10 万盘对局时误差常 ±5-15 分);不同榜单或不同硬件上的分数不能横向直接比。
影响因素 | 引擎榜单 | 人类 FIDE |
---|---|---|
对局池 | 只有引擎彼此 | 只有人类彼此 |
硬件/时限 | 人为锁定:例 4 CPU 或 GPU + 40/15 | 场地多样,长短时限均入表 |
更新频率 | 统计后不再变;新版本视为“新棋手” | 每盘都实时加减 |
基准点 | 常“手调”或历史版本 | 1970 年的玩家均值≈2200 |
由于几乎**没有严肃的“人机混合赛事”**来校准两张分布,跨池映射存在数百分误差。正如 Chess Stack Exchange 上高赞答案所言,给引擎贴上“2200”往往只是方便的标签,其真实强度可能相差几百分 chess.stackexchange.com。