英国国家筛查委员会在《英国医学杂志》(BMJ)上发表了一份立场文件,阐述了评估多癌种癌症检测所需的证据。这些检测旨在通过单一样本(例如血液、尿液、粪便或影像数据)同时检测多种癌症的迹象。
该文件的主要信息是,此类检测确实可能成为癌症筛查的新方向,但不能用“发现的癌症越多越好”这种简单的逻辑来评估它们。对于筛查而言,重要的是要证明该检测带来的益处大于弊端:它能降低或显著降低死亡率,并且不会造成过多的假阳性、不必要的检查、过度诊断或加重医疗系统的负担。
这份立场文件发表之际,正值多癌种检测技术快速发展之时。《英国医学杂志》(BMJ)集团指出,目前有多种此类技术正处于不同的研发和评估阶段,一项名为“NHS Galleri”的大型随机试验正在英国进行,旨在研究一种基于血液的多癌种筛查检测方法。据Medical Xpress报道,该试验已招募了约14万名参与者。
作者强调,目前还没有任何国家将多癌种筛查作为一项系统性的筛查项目实施。这一点至关重要,因为对健康人群进行筛查所需的证据级别远高于对有症状患者或已知高危人群进行筛查。
| 关键点 | 文章及相关材料中所述内容 |
|---|---|
| 杂志 | 英国医学杂志 |
| 出版类型 | 英国国家筛查委员会的立场声明 |
| 话题 | 评估多癌种检测所需的证据 |
| 什么是多癌种检测? | 可以在单个样本中检测多种癌症迹象的检测方法 |
| 大型研究示例 | 英国国民医疗服务体系 Galleri 试验 |
| 主要原则 | 筛查必须证明其益处与危害之间的平衡,而不仅仅是检测癌症的能力。 |
| DOI | 10.1136/bmj-2026-089868 |
为什么多癌种检测会引起如此大的关注?
多癌种检测的概念极具吸引力:一次检测即可同时发现多种肿瘤,包括目前尚无广泛筛查项目的癌症。这对于那些往往发现较晚的癌症尤为重要,因为晚期治疗难度更大、费用更高、效果更差。
这类检测通常被视为“癌症早期检测”策略的一部分。理论上,它们有助于在症状出现之前,即肿瘤较小、治疗效果更佳的时候,发现癌症。因此,研究人员、开发人员、医疗系统和患者对这类检测的兴趣日益浓厚。
但在筛查中,早期发现本身并不足以证明其益处。检测可能会发现更多肿瘤,但其中一些可能永远不会危及生命。在这种情况下,患者会接受不必要的诊断、焦虑、活检、手术或治疗。正因如此,国家筛查委员会的立场是基于权衡利弊。
多癌种检测的一大挑战在于,不同类型的癌症具有不同的生物学特性。有些肿瘤生长缓慢,有些则生长迅速;有些癌症已有有效的筛查方案,而有些则尚无;有些癌症在检测结果呈阳性后更容易确诊,而有些则需要复杂的诊断流程。因此,单一的“阳性”多癌种检测结果可能代表截然不同的临床情况。
| 为什么这个想法如此吸引人 | 为何需要谨慎 |
|---|---|
| 一次检查可以检测多种类型的癌症。 | 不同类型的癌症具有不同的生物学特性和预后。 |
| 有可能在症状出现之前就发现肿瘤。 | 早期发现并不总能降低死亡率。 |
| 即使没有现有的筛查手段,也有可能发现癌症。 | 可能出现假阳性结果。 |
| 该测试可能比许多单独的程序更方便。 | 阳性结果可能需要复杂的诊断。 |
| 科技发展日新月异 | 一旦筛查成为系统的一部分,就很难逆转。 |
英国国家筛查委员会的具体提议是什么?
英国国家筛查委员会就是否应引入新的筛查项目向政府提出建议。《英国医学杂志》(BMJ)集团指出,一项议题可以通过多种途径进入评估流程:例如,对现有指南进行计划性审查、提交公开筛查提案或接受外部机构的投稿。之后,委员会将采用结构化的证据审查流程。
对于多癌种筛查,作者建议预先明确筛查的预期目的。这可以是面向全体人群的大规模筛查、针对高危人群的筛查,或是现有乳腺癌、结直肠癌和宫颈癌筛查项目的补充。如果没有明确的方案,就无法客观评估其益处、危害、成本和系统性影响。
这项要求尤为重要,因为筛查项目一旦实施就很难撤销。如果公众、医生、实验室和诊所都习惯了这项检测,那么在出现不利数据后撤回检测可能会在政治、组织和心理层面都带来挑战。因此,作者主张在证据基础仍在完善之际,谨慎且可逆地实施该检测。
该立场还强调,针对所有癌症类型的单一总体结果可能并不充分。如果一项检测显示总体益处,那么了解哪些特定癌症类型对此有贡献,而其他癌症类型贡献甚微或危害更大,就显得尤为重要。因此,即使罕见肿瘤的统计效力不足,也建议分别呈现特定癌症类型的结果。
| 要求 | 为什么需要它? |
|---|---|
| 明确指出应用场景 | 大规模筛查、高危人群筛查以及补充现有项目是不同的任务。 |
| 权衡利弊 | 高检出率并不能保证改善治疗效果。 |
| 制定可逆实施计划 | 一旦启动筛选,就很难逆转。 |
| 按癌症类型分析结果 | 总体结果可能掩盖了哪些肿瘤实际上能带来益处。 |
| 考虑现有方案 | 新测试方法有望与成熟方法相媲美。 |
为什么“发现癌症”并不等同于“拯救生命”
在癌症筛查中,传统上认为,在合适的试验环境下,癌症死亡率或总体死亡率的降低是评估筛查获益的主要证据。国家筛查委员会指出,诸如晚期癌症发生率降低等替代终点指标可以辅助评估,但目前尚不能完全取代死亡率作为筛查有效性的最终指标。
这一点很重要,因为筛查可能会造成成功的假象。如果一项检测能更频繁地发现早期肿瘤,分期统计数据可能会看起来更好,但这并不一定意味着患者的寿命更长。一些被检测到的肿瘤可能根本不会导致死亡,而一些侵袭性肿瘤即使被早期发现,仍然可能继续发展。
对于多癌种检测而言,这个问题更为突出。作者指出,此类检测可能优先检测出更具侵袭性的肿瘤,从而通过减少晚期诊断而造成获益的假象,但实际上并未降低死亡率。因此,应格外谨慎地解读该领域的替代指标。
此外,即使是理想的替代指标也无法反映全部情况。评估筛查效果时,必须考虑假阳性率、过度诊断、生活质量、焦虑、后续检查、不必要的治疗以及对现有筛查项目参与度的潜在影响等因素。
| 指标 | 为什么单靠它还不够 |
|---|---|
| 发现的肿瘤数量 | 可能包括临床良性肿瘤 |
| 早期阶段的比例 | 但这并不总是意味着死亡率的降低。 |
| 减少后期阶段 | 这可能是一个有用的信号,但需要进一步确认。 |
| 测试的灵敏度 | 高灵敏度可能伴有假阳性结果 |
| 测试的特异性 | 即使在大规模筛查中具有很高的特异性,也可能产生许多误报。 |
| 总体结果良好 | 需要了解可能患的是哪种癌症以及如何确诊。 |
实施前需要哪些证据?
国家筛查委员会的立场实际上表明,这项多癌种筛查检测不应被视为一项实验室创新,而应被视为一项潜在的公共卫生项目。我们需要的数据不仅包括检测的准确性,还包括阳性结果之后的情况:例如,会安排哪些检查、有多少人接受侵入性手术、有多少诊断得到确诊,以及在此过程中会造成多少伤害。
作者强调,评估必须涵盖假阳性率、诊断负担、获取途径的公平性、公众接受度以及成本效益。这意味着,开发商仅仅展示令人瞩目的实验室灵敏度是不够的;他们还必须证明从检测到诊断和治疗的整个流程都能安全、公平、高效地运行。
此外,还需要结合不同类型的数据。评估需要来自临床试验、定性研究、实施研究和经济模型的数据。这种方法是必要的,因为单一的随机试验可以回答一些问题,但并不总能揭示该项目在真实医疗体系中大规模实施时的实际效果。
公平获取途径是一个需要特别考虑的因素。如果检测主要面向高收入人群、大城市或特定医疗网络,则可能加剧而非减少早期癌症筛查方面的不平等。因此,评估时不仅要考虑平均效果,还要考虑不同人群之间的差异。
| 证据类型 | 我应该展示什么? |
|---|---|
| 随机试验 | 筛查是否会影响重要结果(包括死亡率)或重要的中间指标? |
| 准确数据 | 每种癌症的敏感性和特异性分别是多少? |
| 诊断链数据 | 如果检测结果呈阳性会发生什么? |
| 定性研究 | 这项测试对人们来说有多容易理解和接受? |
| 实施研究 | 该项目在实际医疗保健系统中的运作方式 |
| 经济模型 | 这种收益是否值得付出成本和给系统带来的负担? |
| 公平性分析 | 该测试是否会加剧机会和结果方面的不平等? |
为什么这对患者和医生来说很重要?
对患者而言,这条消息意义重大,因为它抑制了人们对“单一检测即可筛查所有癌症”的过度兴奋。虽然这个想法听起来很有吸引力,但对健康人群进行筛查并非标准诊断测试。许多癌症患者早期并无症状,因此证据门槛必须非常高:任何干预措施都不应在没有真正提高生存率和生活质量的情况下,将健康人群变成患者。
对于医生而言,该文件强调了谨慎沟通的必要性。多癌筛查阳性结果并不总是意味着确诊癌症,而阴性结果也不应造成虚假的安全感。此外,如果结直肠癌、宫颈癌或乳腺癌筛查等已证实有效的筛查项目的益处已得到单独验证,则此类筛查不应自动取代这些项目。
对医疗系统而言,首要关注点是资源负担。即使在对数百万人进行大规模检测时,假阳性率很低,也可能导致大量的额外影像检查、内窥镜检查、活检、会诊和重复检测。如果事先未能对这种负担进行充分评估,检测可能会减少有症状患者获得诊断服务的机会。
该文件为检测开发者设定了更严格的框架:他们不仅要证明技术上的准确性,还要证明其临床实用性。检测必须整合到清晰的诊断流程中,针对特定癌症类型提供证据,考虑潜在危害,并且在应用系统中具有经济可行性。
| 为了谁 | 实际意义 |
|---|---|
| 患者 | 不要把多癌种检测当作“癌症治愈”的保证检测。 |
| 医生 | 需要解释假阳性和假阴性结果的风险。 |
| 放映组织者 | 有必要事先评估诊断负担和成本。 |
| 开发者 | 我们需要的是临床获益方面的数据,而不仅仅是可检测性方面的数据。 |
| 监管机构 | 必须考虑危害、机会公平性和对现有项目的影响。 |
| 研究人员 | 应该公布针对不同癌症类型的研究结果,而不仅仅是总体结果。 |
在NHS Galleri的背景下,什么尤为重要?
英国国家医疗服务体系 (NHS) 的 Galleri 试验是评估多癌种检测在真实筛查环境中应用的最显著案例之一。《英国医学杂志》(BMJ) 集团指出,这是一项在英格兰开展的随机对照试验,约有 14 万名参与者。如此规模表明医疗系统对这项技术的重视程度。
但这项研究的规模之大并不意味着该检测方法已经证实具有临床益处。恰恰相反,我们需要这类研究来了解该检测方法是否能降低死亡率、减少延误诊断、避免产生过多的误报以及减轻诊断基础设施的负担。
国家筛查委员会的立场也至关重要,因为它在大规模试验结果开始对政策产生实际影响之前就制定了规则。如果评估标准没有事先明确,就有可能在技术乐观主义、商业利益或公众“对所有疾病进行早期检测”的期望等压力下做出决策。
从这个意义上讲,《英国医学杂志》(BMJ)发表的这篇文章并非在报道一种现成的检测方法,而是在探讨证据标准。文章指出:多癌种筛查或许前景可期,但在出现令人信服的数据证明其对人群的真正益处之前,推广实施的过程必须严谨、透明且可逆。
| 问题 | 为什么这对 NHS Galleria 和类似研究很重要? |
|---|---|
| 该检测能降低死亡率吗? | 这是筛查获益的主要标准。 |
| 它能减轻晚期症状吗? | 这是一个有用的信号,但不能替代死亡率。 |
| 有多少假阳性? | 确定报警和诊断负载 |
| 实际能检测出哪些癌症? | 总体结果可能掩盖了不同癌症类型产生的不同影响。 |
| 检测结果呈阳性后会发生什么? | 需要一条安全清晰的诊断途径。 |
| 如果数据不利,是否可以停止程序? | 该实现必须是可逆的 |
局限性和谨慎解读
需要注意的是,《英国医学杂志》(BMJ)发表的这篇文章是一份立场声明,而非针对特定检测方法有效性的临床试验。它并未报告某种特定的多癌种筛查方法已经能够降低死亡率,也未提倡立即对所有人进行此类筛查。其目的是明确在做出政治或临床决策之前需要收集哪些证据。
第二个局限性与技术的快速发展有关。多癌种检测在生物学基础、算法、靶肿瘤数量、预测肿瘤起源的能力以及阳性结果后的诊断流程等方面可能存在差异。因此,“多癌种检测”这一通用术语并不意味着所有此类检测都可以进行同等评价。
第三个局限性在于替代终点指标仍存在不确定性。晚期病例的减少可能是一个重要的阶段性信号,但作者强调:目前尚无可靠的筛查方法能够以替代终点指标可靠地替代死亡率。
第四个局限性在于研究结果在英国以外地区的适用性。虽然该文件是在英国国家筛查委员会的指导下编写的,但其中许多原则具有普遍性:权衡利弊、临床获益的证据、假阳性评估、成本效益以及公平获取医疗服务对于任何医疗保健系统都至关重要。
| 局限性 | 这是什么意思? |
|---|---|
| 这是一份立场声明。 | 它设定了评估标准,但并不能证明特定测试的有效性。 |
| 测试内容差异很大。 | 一项测试的结果不能推广到所有技术。 |
| 替代终点指标尚未得到充分验证。 | 减少晚期疾病并不总是等同于降低死亡率。 |
| 英国背景 | 这些原则具有更广泛的适用性,但解决方案取决于医疗保健系统。 |
| 快速的技术发展 | 随着新数据的出现,评估标准也应随之更新。 |
| 公众期望很高 | 决策应该基于证据,而不是市场营销。 |
主要结论
英国国家筛查委员会在《英国医学杂志》(BMJ)上发表的立场声明中,明确阐述了对多癌种检测的严格态度:在将其纳入系统性筛查之前,必须证明其不仅能够检测出肿瘤,而且在可接受的风险水平下,还能带来真正的临床获益。死亡率、晚期、假阳性结果、诊断负担、过度诊断、生活质量、公平获取以及成本效益等因素尤为重要。
这条新闻的实际意义在于,“一种检测方法可筛查多种癌症”目前还不应被视为一种现成的、可大规模预防癌症的技术。这固然是一种很有前景的方法,但它需要比针对单一癌症的检测方法更为复杂的评估,因为每种肿瘤类型都有其自身的生物学特性、诊断途径、预后以及获益风险比。
对读者而言,最合理的方案是:多癌种检测可能会改变癌症筛查的未来,但只有在经过大规模研究的透明验证,并制定了继续或终止该项目的预先规则之后,才能实施。在筛查健康人群时,主要问题不是“我们是否发现了癌症?”,而是“我们最终是否让人们更健康、更安全?”
新闻来源:Sarah Batson 等人。英国国家筛查委员会关于多癌检测所需证据的立场声明。《英国医学杂志》,2026;393:e089868。DOI:10.1136/bmj-2026-089868。

