接下来,中山大学肿瘤防治中心分子诊断科邵建永教授与大家分享了他在NGS数据注释中的宝贵经验。NGS测序会产生大量的原始序列数据,拿到原始序列数据后对数据进行初级处理,对剩下的数据进行序列比对进而计算出覆盖度以及变异识别即精准捕捉基因点突变、缺失、插入等多种变异信息,并注释。拿到注释结果后做与疾病相关的解析,由此可以进行早期分子分型诊断,帮助患者后续全程管理,及早发现患者的基因亚型,对于后续疾病复发、耐药等策略制订个体化方案。因此,NGS数据注释和解读是肿瘤精准医疗中的难点和关键点。
邵建永教授讲到,NGS数据注释存因基因变异的复杂性而存在许多陷阱。其中包含肿瘤基因组变异的复杂性及基因变异鉴定和分析的复杂性。美国医学遗传学与基因组学学会(ACMG)指南提供了遗传基因变异注释的解读标准及指导原则,使用高通量测序检测孟德尔遗传病致病基因时,整合连锁分离、新发变异、等位基因数据、其他数据库、人群中分布频率、计算和预测数据、功能验证情况这8类研究证据将变异分为五类:致病的(Mut)、可能致病的(VLM)、致病不明的(VOUS)、可能良性的(VLB)、良性的(Poly)。
随后,邵建永教授结合了自己的经历来帮助大家理解ACMG标准。一例女性卵巢癌乳腺癌双原发、一例男性肺癌均检测出携带BRCA2基因遗传系变异,而该变异未在任何数据库或文献中有过报道,通过规范基因注释流程及后期功能验证,如果功能实验证实该突变是有临床意义的(即为VLM型),将会是世界上首次对BRCA2基因变异进行报道,从而实现了临床到科研的转化。
邵建永教授讲到了目前正在与思路迪公司合作进行的近600例肠癌患者的遗传性肠癌易感基因变异类型研究初步结果表明,MSH1、MSH6两个MMR基因的变异均诱导肠癌突变增多,且MMR基因缺陷的mCRC患者用PD-1单抗治疗获益更明显。同样的,今年发表的InSiGHT数据库中遗传性肠癌MSH1、MSH6基因的变异频率同样很高。
不完善的流程和不结构化的数据库对注释造成很大误导,规范的注释流程结合人工判读有助于临床医生发现更多新的信息(如,基因变异具有的潜在价值)。以VOUS功能预测为例(图1),大批量样本基因变异注释完后因为数量较多,不可能对所有变异进行功能验证,通过功能预测后,可优先对其中可能的有害变异进行实验验证。
图1 VOUS功能预测