来自德国慕尼黑感染研究中心(DZIF)与慕尼黑理工大学病毒学研究所研究人员分析了公开全长HBV序列,并获得全球临床相关HBV变异频率。这项研究对乙肝病毒感染的基因型和慢性肝病进展做了详细介绍,并发表在2020年11月23日科学杂志《Viruses》上。
乙肝基因型E–I序列被低估,3种不同突变,干扰替诺福韦易感性
德国研究人员发现,乙肝病毒基因型在试验数据库中以不同的序列数表示。基因型A-D的每个基因型都有1004-2700个序列。但是,剩下的基因型(44到312)可用的序列较少。虽然,这在很大程度上反映了全球分布情况,正如此前报道的,基因型E-I序列在我们的数据库中被低估了!测序分离株中,基因型频率的差异可能是由于高收入国家和低收入国家的流行率不同造成的。
因为测序,至少在使用现代技术进行测序时,成本很高。然而,可用于某些基因型的相对较少的序列质疑计算频率的精确度。对此发现已经得到观察的支持,即在可用序列较少基因型中,许多乙肝病毒突变根本没有被发现。因此,在这些少数基因型中,低频突变可能被忽视。这对于分析HBV变异的区域分布更为重要,因为在某些区域,相对较少的序列(20到2811)是可以使用的。
另一个需要考虑的重要因素是,大多数序列可能通过从慢性乙肝患者血清中,提取的核酸的经典Sanger测序来确定的。这种方法的敏感性是有限的,在可靠检测到的乙肝病毒群中,只有变异出现的频率大于20%。决定哪些突变位于同一个病毒基因组上,使用传统上读取时间更短的下一代技术要困难得多。下一代测序(NGS)技术的最新进展是,利用了更长的读取时间和重叠序列,使得在同一病毒基因组上的突变的识别具有很高可信度。
NGS技术能够实现较高的序列深度,很容易检测到病毒群体中的低频变异。然而,德国研究人员介绍,我们需要仔细评估这些罕见人群的临床相关性,这些人群可能只是高精度测序技术的产物。产生偏差的另一个可能原因是,在验证中所包含的序列质量方面存在困难。虽然,序列质量的信息在大多数情况下是不可用的,但德国研究人员试图通过排除数据库条目来解释这一点。
但是,在采样、排序或数据库输入过程中,还不能排除其他可能的偏差。因此,基于低频突变的结论不应该被过度解释。在分析乙肝表面抗原突变体频率时,发现这些突变的总体频率相对较低,任何基因型都没有显著的富集。唯一例外是127位突变,这些突变与隐性乙肝病毒感染有关,似乎是基因型E、F和H的野生型。重要的是,乙肝表面抗原的127位氨基酸也是HBV血清型的决定因素之一,在ayw4和adw4血清型。
对核苷类似物(NA)耐药突变,发现M204V/I和L180M表现出研究为止最高频率,这与它们介导对目前用于乙肝治疗的大多数NA包括拉米夫定耐药性。与这些突变相关的相对较低的抗药性屏障,可能导致相对较高的发病率,尤其是在抗病毒治疗广泛地区。研究人员发现,在3种不同突变被描述为干扰替诺福韦易感性,然而从慢性乙肝患者分离的病毒中只发现了其中1种(A194T),而另外2种是在体外产生的(P177G和F249A)。
虽然能够在不同基因型的几个序列中发现A194T突变,但在本研究中的7000多个序列中,没有发现P177G和F249A突变。因此,它们不太可能构成临床相关的变异,德国研究人员推测,这些突变造成的乙肝病毒适应度损失超过了替诺福韦耐药性的优势。更有趣的观察是关于BCP/前核心区,几乎所有乙肝病毒基因型G序列都包括几个突变(C1653、T1753C、A1762T、G1764A和G1896A),这些突变与e抗原阴性、增强爆发性肝炎和或肝细胞癌风险有关。
虽然基因型G缺乏e抗原表达得到了很好描述,但肝细胞癌和爆发性肝炎风险,并没有那么明显联系,而且可能很难阐明。因为基因型G多见于基因型A的合并感染。综合来看,德国研究人员认为,未来的这个方向研究应调查这些突变频率的真实性,以及是否增加爆发性肝炎或肝癌风险(2020年11月23日 科学杂志《Viruses》 通过分析公开的测序数据发现临床相关乙型肝炎病毒变异的全球发生率)。