下面先帮你「体检」一下方法是否合理,再指出和右侧技术路线图不一致的地方,最后给出一版可直接照搬的修改稿(含每一步该做什么与判定条件),这样你的文字版研究方法就能与路线图对齐。
1) 方法是否正确?——总体评价与关键注意点
你的思路总体是对的:
收集 AP / SIRS(或以脓毒症替代) / ARDS 的 GWAS 摘要数据 → 统一与质控 → 用 LDSC 做单表型 h² 与跨性状遗传相关 (r_g) → 再做下游生物学解释(通路富集)与因果推断(MR、共定位/精细定位)。
需要补强的要点:
- 表型定义要统一且可获得 GWAS 数据:图上写 SIRS,文字里写 “SIRS/败血症(sepsis)”。SIRS 与 sepsis 并非同义(sepsis≈感染诱导的 SIRS),多数公开 GWAS 是 sepsis,几乎没有 SIRS 的正式 GWAS。建议全程统一为“Sepsis(SIRS 的代理表型)”,并在方法里明确“采用 sepsis 作为 SIRS 的替代”。
- LDSC 的前置条件:
- 病例-对照性状需要换算到责任度量 (liability scale);
- 需报告并检查 h2_z ≥ 4 才有足够功效继续做 r_g;
- 单性状与跨性状 intercept 用来判断群体结构/样本重叠混杂,明显偏离 1 时要谨慎解读或改用 block jackknife SE、分层分析等。
- 多重校正要覆盖所有组合:r_g 三组两两组合 + 通路/基因集分析(FDR 更合适;若预注册的假设很少,Bonferroni 也可)。
- MR 可行性:AP、ARDS、sepsis 的全基因组显著工具变异可能较少,需提前评估工具强度 (F-stat);若工具不足,加入 GSMR/CAUSE/LCV 等多基因 MR/因果方法,或将 MR 明确写成“在具备足够工具变异的前提下进行”。
2) 不一致之处在哪里?
- 术语不一致:图上“SIRS”,文字里“SIRS/败血症”。
- 步骤粒度不一致:右图包含 Pathway enrichment 与 Causal inference 两层,左侧方法只写到“遗传相关”,缺少与右图对应的两节内容及其判定/参数。
- 顺序呈现不一致:右图从“遗传相关 → 富集 → 因果”,左侧方法写成“单表型遗传力 → 遗传相关”,但没有把“质控/统一、遗传力检查”明确画进路线图。
- 箭头语义容易误导:右图 AP→SIRS→ARDS 表示临床进展,但遗传相关是对称的,不带方向;MR 才是方向性检验。需要在图或方法里说明“箭头仅代表临床演进,统计分析会同时做双向 MR(含反向)”。
3) 具体怎么改?——对齐后的“方法+路线图”模板
3.1 文本版研究方法(建议直接替换你的 01–04,并补充到 07)
01 数据准备
- 收集三种性状的 GWAS 摘要数据:Acute Pancreatitis (AP)、Sepsis(作为 SIRS 的代理)、Acute Respiratory Distress Syndrome (ARDS)。记录祖源、样本量、病例/对照数、表型定义与来源。
- 若多祖源,先做祖源分层分析,再考虑跨祖源整合。
02 质控与标准化
- 统一参考基因组构建与等位基因方向;去除 INDEL、基因组难区、MHC(可选);去除歧义位点 (A/T、C/G);
- 过滤低质量变异(INFO≥0.8 或 0.9,MAF≥0.01;与 LDSC 推荐一致);
- 计算并输出:SNP 数、INFO/MAF 阈值、病例/对照数、有效样本量 N_eff;病例对照性状换算到责任度量。
03 遗传架构体检(单性状)
- 用 LDSC 估计 h²、SE、h2_z 与单性状 intercept;
- 判定:h2_z ≥ 4 方进入下一步;若不足,标注“功效受限”,后续仅报告探索性结果或改用更大样本/合并 GWAS。
04 遗传相关(跨性状)
- 对 AP–Sepsis、Sepsis–ARDS、AP–ARDS 分别用 LDSC 估计 r_g、SE、p 值,同时报告 cross‑trait intercept 评估样本重叠/混杂;
- 多重校正:对三组 r_g 进行 FDR(或 Bonferroni)。
05 基因/通路富集(与右图对齐)
- 逐性状做 MAGMA 基因分析(1000G/UKB 对应祖源 LD 参考;SNP→基因 ±50kb 或按 eQTL 映射);
- 基因集富集(GSEA/GO/KEGG/MSigDB),报告 FDR<0.05 的通路;
- 可选:对三性状做共享基因/通路的交集或元分析,及组织/细胞类型富集(MAGMA gene‑property / LDSC‑seg)。
06 因果推断(与右图对齐)
- 双向两样本 MR:AP→Sepsis、Sepsis→ARDS、AP→ARDS 及三组的反向 MR;
- 工具选择:p<5×10⁻⁸(必要时放宽至 5×10⁻⁶ 并做弱工具敏感性),r²<0.01、10,000 kb 剔除连锁,去除回文位点;
- 主要方法:IVW;稳健性:MR‑Egger、加权中位数/加权模式、异质性(Q)/MR‑PRESSO;
- 工具不足时,补充 GSMR/CAUSE/LCV 等多基因方法;
- 报告方向一致性、效应量、敏感性结果与样本重叠评估。
07 共定位 / 精细定位(与右图对齐)
- 对跨性状共享位点与 MR 关键位点做 COLOC 或 SuSiE‑COLOC;
- 用 FINEMAP/SuSiE 得到 95% 可信集合;
- 结合 GTEx eQTL(胰腺、肺、血液等相关组织) 解释可能因果基因。
以上 01–07 与右图三层模块是一一对应的:
01–02 = 数据统一与质控;03–04 = Genetic correlation(含单性状体检作为前置);05 = Pathway enrichment;06–07 = Causal inference(MR)+ Colocalization/Fine‑mapping。
3.2 路线图怎么改?
- 在最上游增加一块“Data QC & Harmonization / Heritability check”(对应步骤 01–03),放在 “Genetic Correlation” 之前。
- 把 SIRS 全部改成 Sepsis(SIRS 的代理),并在图角落加一句小字说明:“Sepsis 用作 SIRS 的替代表型”。
- 箭头说明:保留 AP→Sepsis→ARDS 作为临床进展(可用虚线箭头或加注“clinical course”),分析模块右侧注明:“r_g 为相关性(无方向);方向性由 MR 检验,并进行双向分析”。
- 维持右侧三层蓝色模块,但在最下层“Causal Inference”下加上小字:“Two‑sample MR(IVW+敏感性)→ Colocalization / Fine‑mapping”,与文字 06–07 完全一致。
4) 快速检查清单(落地时别忘了)
小结
你的核心思路没问题,不一致主要来自术语与步骤粒度/顺序。按上面 01–07 的文本方法与路线图微调后,两者就能完全对齐,而且每一步都有明确的判定条件与下一步衔接标准,可直接用于论文“方法学”与图注。