在当前国际政治环境下,seer数据库是不允许中国学者访问吗?

Created on: July 11, 2025

Answered using O3 by Chat01

Question

在当前国际政治环境下,seer数据库是不允许中国学者访问吗?

Thought

Thought for 33 seconds

Answer

简短结论

  • 最基础的 SEER Research Data: 自 2025 年 6 月 13 日起已重新开放,只要有正规机构邮箱即可申请,不再按国别限制,中国学者在中国境内也能下载这一去标识化版本。SEER
  • 受控数据(SEER Research Plus、NCCR 及各类 Specialized Databases): 仍受 NIH 对“countries of concern” 的技术封锁;位于中国(含港澳)的机构账号无法登录或新申请。SEER
  • 封锁背景: NIH 依据 2024 年底的美国总统令 EO 14117 及 28 CFR Part 202,于 2025 年 4 月 4 日暂停中国、俄罗斯等国研究者访问所有 NIH Controlled-Access Data Repositories(CADRs),SEER 是名单中的重点库之一。

具体含义与可行做法

数据产品中国境内能否直接申请说明与替代方案
SEER Research Data✅ 可去除月/县级等敏感变量;足以做大部分流行病学分析。
SEER Research Plus / NCCR❌ 禁止需登录 eRA Commons 或 HHS 账号且客户端 IP 不在中国等国家;可考虑:<br>① 与境外合作者共同申请,由对方负责下载与分析;<br>② 在境外服务器(合法合规)远程运行 SEER*Stat。
Specialized Databases❌ 禁止更细粒度或基因等数据,除上列要求外,还要提供研究计划、IRB 批文等。

注意:无论数据级别,所有团队成员都必须各自签署 SEER Data Use Agreement,且公开发表时仍需遵守最小单元脱敏规则。


如果您是中国学者,实际操作建议

  1. 先确认研究是否一定需要受控变量(例如县级、月级或特定基因标记)。很多临床-流行病学课题用公开版即可满足。
  2. 若必须用受控数据,可通过两条途径:
    • 与境外(非“countries of concern”)合作伙伴联合申请,由其负责账号注册与数据提取。
    • 在境外云主机/服务器上搭建 SEER*Stat 环境,确保登录与存储均在美国或第三国合规节点。
  3. 留意后续政策更新。NIH 已在官网承诺“会定期评估安全要求”;若安全评估结果改善,受控数据也可能重新对所有国家开放。

延伸资源

  • SEER Data Access Policy 官方全文及常见问题
  • eRA Commons 账号与 HHS Login 注册指南
  • 国内可替代的癌症登记处数据(如国家癌症中心、中国 CDC 肿瘤登记年报等)

如需帮助编写 SEER*Stat 代码、变量映射或寻找替代数据,请告诉我!

Question

我能够访问MIMIC数据库,也能够进行分析,那么我能够以此发文章纂写论文吗?这个是以期刊杂志社的要求来吧,和国家与国家之间的政策无关吧,我在之前已经获得了数据库的访问权限以及下载资格,并且有合格证明通过了考试

Thought

For MIMIC DUA, although there's no specific mention of small cell counts, it's a good practice to avoid exposing counts under 10 to prevent re-identification risks. Here's a plan:

  1. Confirm they can publish with MIMIC after getting access and completing training; policies apply mainly to DUA and journals.
  2. Summarize the DUA obligations, such as maintaining training, avoiding re-identification, and not sharing data with unauthorized parties.
  3. Mention the importance of sharing analysis code and handling derived datasets responsibly.

Thought for 1m 5s

Answer

可以——前提是同时满足 MIMIC “数据使用协议(DUA)”和期刊的科研伦理规范


1 MIMIC 官方许可:已获得账号+培训即可公开发表

  • DUA 允许发表科研成果,但对使用方式作了硬性约束:
    1. 不得尝试重新识别任何个人或医疗机构;在论文、海报等公开材料中也不能泄露可识别信息。
    2. 必须保持人类受试者保护 / HIPAA 课程(CITI Program 等)“持续有效”。
    3. 发表论文时,须把生成结果的分析代码上传到公开仓库(PhysioNet 或 GitHub 等)。
    4. 不得把数据转交给未授权人员/服务,包括把原始数据传给在线 API 或 LLM。PhysioNet PhysioNet

✅ DUA 没有按国籍或所在国设限;只要账号通过审核,就享有与全球用户同等的研究发表权。


2 期刊/机构伦理要求:通常把 MIMIC 视为“可公开获取、已去标识的人群数据”

发表环节常见做法说明
伦理审查多数医学期刊接受“IRB 免审”或“豁免”声明;部分要求附上校/院 IRB 的正式豁免函。公开可获取、完全去标识的数据通常不再被视为 “人类受试者研究” ICMJE
数据共享声明ICMJE 系列期刊须在手稿中写明数据来源、获得方式、代码仓库链接。临床期刊 2018 年起强制 Data Sharing Statement turn8search0
隐私保护细节发布表格/图表时,最好对样本量 <10 的单元格做合并或“<10” 处理,防止潜在再识别风险(虽非 DUA 明文规定,已成同行惯例)。
引用格式在方法或数据可用性段落写明:<br>“We used the MIMIC-IV v3.1 database (accessed on 2025-05-xx, credentialed via PhysioNet, DOI: 10.13026/...)”。

3 写作与投稿实务清单

  1. 保留所有合规文件:CITI 证书、PhysioNet 审批邮件、DUA PDF、(如有)IRB 免审函。
  2. 写清 4 项标准信息:数据库版本、访问日期、DUA 合规、分析代码仓库链接。
  3. 结果呈现
    • 避免在正文或补充材料中列出可追溯到单个患者的细节(时间序列截图、罕见病统计等要格外留意)。
    • 若确需展示示例病例,可用 MIMIC 官方 Demo 或生成伪造示例,不用真实记录。
  4. 合作者权限:只能与同样完成 MIMIC 培训/签署 DUA 的合作者共享数据;不允许把完整数据包直接发给审稿人,必要时提供代码和查询脚本即可复现结果。
  5. 派生数据/模型的公开:若您计划发布处理后子集或训练好的模型,需遵循“派生数据指南”——同样上链到 PhysioNet,并保持受 DUA 约束。5

4 常见问答

问题简答
需要美国/医院 IRB 吗?通常不需要;多数中国高校/医院 IRB 会出具“二次公开去标识数据豁免”函。
可以把数据放到国外云服务器跑分析吗?只要服务器归您或团队控制、并采取访问控制措施即可。但禁止把原始数据上传到第三方 AI 平台或公共数据湖。
合作者拿不到账号怎么办?让其完成 CITI 培训并在 PhysioNet 提交申请;或由已授权成员在安全环境中运行分析、共享汇总结果与代码。
投稿时要上传完整数据吗?不需要。提供 DOI、访问指引和开源代码即可满足重现性要求。

结论

  • 只要继续遵守 DUA 条款和期刊伦理规范,就完全可以用 MIMIC 数据撰写并发表论文。这与中美政策摩擦无关,也不存在国籍限定。
  • 若需要模板式伦理声明、代码开源示例或小样本脱敏技巧,随时告诉我!

Question

我需要哪些伦理证明呢?分别在哪些网站上?

Thought

Clarifying ethical proofs and sources

We can refer to general IRB exemptions based on U.S. guidelines like 45 CFR 46, though for Chinese context, local IRBs might have their own requirements. We should explain the three main types of ethical documentation:

  1. 数据使用协议 (DUA) – MIMIC license, downloadable.
  2. 人体受试者保护培训证书 – CITI Program certification.
  3. 伦理豁免证明 (IRB Exemption/waiver) – From your institution’s ethics committee.

For open-source code repositories, though not required for ethics, we can mention options like publicly deposited research code. We'll provide sources for MIMIC DUA and CITI Program.

Thought for 35 seconds

Answer

下面把常见期刊在使用 MIMIC 数据时会要求、或作者最好主动准备的几类伦理文件列成清单,并说明各自应去哪里下载/生成。你可以依此一次性备齐,投稿时按期刊“Author Guidelines / Ethics statements”里的模板粘贴即可。

序号必要性文件名称 & 作用取得/下载网址或系统备注
1强制MIMIC Data Use Agreement (DUA) 电子版 <br>● 证明你已同意并受《PhysioNet Credentialed Health Data Use Agreement 1.5.0》约束<br>● 稿件审稿人或编辑如有疑问,可随时上传或邮件提供登录 PhysioNet → 右上角头像 → “My Credentials” → “view-dua” 链接可下载 PDF 原件 PhysioNet下载文件名常含“mimiciv_dua_signed.pdf”,留意 DU ID 与签署日期
2强制人体受试者保护培训证书(CITI Program) <br>● 多数期刊要求附在“Supplementary Material”或投稿系统“Ethics approval”栏<br>● 中国作者常选 Biomedical Research – Basic 课程https://about.citiprogram.org 注册 → 依提示选 Human Subjects Research (HSR) 课程 → 完成测验后可生成带证书号的 PDF 1turn0search7证书 3 年有效;期刊通常接受英文版 PDF
3视期刊而定机构伦理委员会 IRB 豁免函 <br>● 说明“二次分析已公开、完全去标识数据,不属于《人类受试者保护条例》(45 CFR 46)所定义的受试者研究”<br>● 部分国内医院/高校或国内期刊会坚持要此函向所在单位 IRB/伦理办线上系统提交简易申请 → 选择“分类 4:既存公开去标识数据”豁免条款(45 CFR 46.104 d 4)若期刊仅需作者声明,可在手稿“Ethics approval”段落写明“IRB waived because data are publicly available and de-identified.”
4强制Data Sharing Statement <br>● ICMJE 系列医学期刊自 2018-07-01 起必须附<br>● 说明数据来源、获取方式、是否共享派生数据 & 代码仓库参照 ICMJE 模板填写,放在稿件末或“Data Availability”栏;模版见 https://icmje.org turn0search5建议同时注明代码仓库 URL(如 GitHub/PhysioNet mimic-code) 6
5良好实践分析代码公开仓库(ZIP + README) <br>● 满足 DUA 第 6 条“公开结果→须公开代码”<br>● 方便审稿人复现① 在 GitHub 建库<br>② 或在 PhysioNet “Upload Project” 创建派生项目仓库应包含 SQL 查询 / Python/R 脚本 + 分析日志;禁止上传原始 CSV/Parquet 数据

投稿前的快速核对清单

  1. DUA PDFCITI 证书:在稿件提交系统 “Ethics / Compliance” 页面上传。
  2. IRB 豁免函:若期刊要求即上传;如无,正文或附录内写清豁免理由。
  3. Data Sharing Statement:正文固定小节;记得给出 MIMIC DOI、访问日期、代码仓库 DOI/URL。
  4. 代码仓库:公开或设置 “reviewer‐access” 链接;确保不含患者原始表。
  5. 表格脱敏:任何单元格样本数 < 10 时合并或标注 “<10”。

只要把以上 3 — 5 个 PDF 或链接准备齐,主流医学与工程期刊都会认为伦理合规。若具体期刊另有特殊格式(如 Elsevier 的新 “Data Availability Form”),按其模板再转录一遍即可。祝顺利投稿!

Share this Q&A