期刊:《Virulence》
影响因子:5.
派森诺与医院的张艳梅老师课题组合作,在微生物学与免疫学领域的《Virulence》发表新研究成果!在本研究中,从临床上分离得到若干个幽门螺杆菌,对这些菌株进行高通量测序,确定了幽门螺杆菌的特定遗传特征和与特定临床结果相关的遗传特异性,并确定这些基因的功能,这些数据拓宽了对幽门螺杆菌的多样性及其与特定胃疾病关系的认识。
研究背景
幽门螺杆菌(H.pylori)感染是严重胃炎相关疾病的重要危险因素,包括消化性溃疡、胃黏膜相关淋巴组织淋巴瘤、胃癌。世界上有40%以上的人口长期感染H.pylori,其中发达国家的比例为35%,发展中国家的比例超过50%。然而,感染患者的临床结果差异显著,10-15%的携带者发展为H.pylori相关疾病。最近的研究表明,明显的H.pylori基因组变异导致了H.pylori胃定殖在不同个体中的不均匀致病性。
通过对7个保守基因(atpA、efp、mutY、ppa、trpC、ureI和yphC)的序列分析,研究了幽门螺杆菌的种群结构。该结构目前根据地理关联和独特的遗传特征分为7个种群类型:hp-europe、hp-EastAsia、hp-Africa1、hp-Africa2、hpAsia2、hp-NEAfrica和hp-Sahul。H.pylori的不同种群结构被认为反映了这些分离菌的传播途径,这些分离菌与特定人群的历史迁移和重新定居有关,不同的分布可能是H.pylori胃定殖临床后果的地区差异的原因。H.pylori的致病机制复杂,其中最重要的包括特异性*力基因、基因岛和CRISPR的结构与表达相关。在本研究中,探讨了不同临床结果的个体H.pylori的基因组特征,包括慢性浅表性胃炎(CSG)、慢性萎缩性胃炎(CAG)、消化性溃疡(GU)和胃癌(GC),确定了H.pylori的特定遗传特征和与特定临床结果相关的遗传异质性,并在可能的情况下确定了这些基因的功能。
研究材料与方法
1.实验材料:从上海胃疾病患者的胃活检中分离得到株幽门螺杆菌,其中慢性萎缩性胃炎(CAG)=66、慢性浅表性胃炎(CSG)=19、胃癌(GC)=1、胃溃疡(GU)=26。
2.测序平台:IlluminaMiseq
3.分析内容:细菌框架图、MLST分析及MLST进化树、基因家族分析、基因岛预测、CRISPR预测、*力基因和耐药基因分析等等。
研究结果
上海幽门螺杆菌的基因组特征和群体结构分析
对株上海H.pylori分离株进行高通量测序,发现其基因组大小在1.52-1.69Mb之间,平均GC含量为38.7%,每个基因组含有-个基因;每个基因组均有36个tRNA和2个rRNA。为了进一步验证测序数据具有代表性,并具有足够的广度来代表东亚地区H.pylori的遗传多样性,从NCBI上找到不同地理区域的株H.pylori与本次测序的3株H.pylori进行MLST分析并构建MLST进化树,结果发现92.9%的上海H.pylori分离株与亚洲的分离株聚集在一起,其覆盖了该地区之前报道的全部变异。另外有6.3%的分离株与欧洲变异株聚集在一起,0.9%与亚洲其他地区分离株聚集在一起。
图1:MLST进化树
基因家族分析
为了进一步研究H.pylori的遗传多样性与临床结果的关系,故进行了基因家族分析。此次分析使用了株H.pylori分离株+10株NCBI上的参考基因组,进而确定哪些基因是核心基因,哪些基因可归类为临床结果相关基因。结果发现这些群体总共由个基因组成,其中有个基因家族(个基因)属于核心基因组;个基因属于特有基因,这些基因可能和临床结果有一定的关联性。
图2:基因家族分析
对这个基因进行COG注释,结果发现有个基因可以被注释到,注释到的基因与基本生命活动相关,包括J类(翻译、核糖体结构和生物发生)、E类(氨基酸运输和代谢)和M类(细胞膜/包膜生物发生)等功能相关。对各组特有基因进行注释发现,CSG组15个特有基因中有8个和DNA复制、重组和修复相关;CAG组98个特有基因中有35个在COG注释的各类功能中里均能注释到;GU组的17个特有基因中有3个可能与功能不明的COG相关;GC组的79个特有基因中,有59个基因能被COG注释到,其中以无机离子和代谢为主要功能。值得注意的是,GU/GC的特有基因中也注释到了较多的无机离子和代谢相关基因。
图3:核心基因组COG注释
表1:每个特有基因COG注释
特有基因中*力基因的分布情况
为了研究H.pylori携带的特有*力基因的发生是否和临床结果相关,通过VFDB数据库分析了四组中个*力相关基因的状态:结果发现有株菌株中检测到了cagPAI,其中只有12株检测到完整的cagPAI,且全部包含26个主基因,其余个株菌仅携带部分cagPAI;其中CAG中携带完整cagPAI的菌株占66.7%(8/12),CSG中携带完整cagPAI的菌株占25.0%(3/12),GU中携带完整cagPAI的菌株占8.3%(1/12)。Victors数据库还检测到了其他20个*力基因,其中有18个基因存在于所有株中。对4组的基因进行统计学差异分析,结果发现有16个*力基因包括4个cagPAI基因和12个其他*力相关基因是有显著的统计学差异的;与其他所有临床组相比,GC组这16个*力基因的阳性检出率一致高于或低于其他临床组。
表2:临床统计结果总有统计学差异的基因
*力相关基因的拷贝数情况
为了进一步探讨个*力相关基因拷贝数与临床结果之间的关系,我们分析了个H.pylori中这些基因拷贝数的变异,仅在参与鞭毛蛋白修饰的基因pseB中检测到4个拷贝。在株和14株菌株中分别检测到3个拷贝,其中flgG编码鞭毛蛋白,babB/hopT编码OMPbabB作为黏附素。三个基因(fliQ、flaG和fly)在不同组的分离株中显示出显著不同的拷贝数。值得注意的是,GC组在这三个拷贝数方面总是显著的,相对于其余的所有分离株,这三个拷贝数倾向于代表过多或不足。fliQ在GC组中的存在显著低于其他各组,其拷贝数在不同组中也存在显著差异。虽然flaG和fly的存在在不同的临床结局组之间没有显著差异,但它们的平均拷贝数在GC组中有统计学意义上的降低。因此,GC组与三个*力相关基因拷贝数的最大离散度相关。
图4:在四个临床结果组中,三个*性相关基因具有显著不同的拷贝数
不同的临床结局组中基因岛分析
GIs有助于基因的横向转移和细菌进化,因此,分析了株H.pylori中GIs的存在情况。本次分析共识别出个可能的GIs,它们的长度从到71,bp不等。几乎所有菌株(/,98.4%)均具有可能的GIs。四组患者的GI发生率均较高,但无显著差异。最常见的三个GIs是HPGI-1(45.9%,56/)、HPGI-2(12.3%,15/)和HPGI-3(10.7%,13/)。HPGI-11在15个菌株中检测到,HPGI-12在4个,HPGI-13在1个,HPGI-14在5个,H.pylori中最常见的可能是GIs的基因含有更多功能未知的基因。这些基因可能编码假定蛋白,也可能被归类为基因组DNA。在四个临床结局组中,每种GI的存在没有差异。
图5:H.pylori菌株中最常见的三种假定的GIs进行结构分析
在不同的临床结局组中检测到CRISPRs
鉴于H.pyloriCRISPRs在胃肠道发病机制中的作用未知,本文研究了这四组菌株中CRISPRs的发生情况。GC组、GU组、CAG组、CSG组分别检测到45.5%(5/11)、80.8%(21/26)、48.5%(32/66)和42.1%(8/19)的CRISPRs,四组间CRISPIR频率差异有统计学意义。此次分析共检测到79种不同类型的直接重复序列(DR),长度为23-50bp;其中17种DR被多次检测到,值得注意的是,17个重复DR中有15个总是对应于特定的间隔;有趣的是,CRISPRs在不同的分离株中要么完全相同,要么完全不同,同一分离株的CRISPRs序列不完全相同;在所有的H.pylori分离株中均未发现Cas基因。
图6:H.pylori菌株中CRISPRs的分布
MLST分析
MLST将株H.pylori分离株分为88株STs,优势STs为ST和ST,分别占分离株的13.4%和6.3%,不同组间ST分布差异无统计学意义。因此,H.pylori的STs是分散的,与疾病背景无关。
研究结论
1.人群分析显示92.9%的上海H.pylori分离株聚集在东亚群;
2.在所有基因组中检测到的个基因,有个基因构成了核心基因组,而在单个疾病组中检测到个独特的基因;消化性溃疡和胃癌组的特有基因大部分注释到了无机离子转运和代谢功能基因簇;
3.在4个疾病组中检测到16个*力基因,其检出率有统计学差异;
4.在4个疾病组中发现个CRISPR,其发生率有显著差异;
5.共鉴定出个可能的基因岛,其中有3个在10%以上的菌株中单独发现;基因组岛包括几个代谢相关基因和许多功能未知的基因;
6.株上海分离的H.pylori共检出88种序列类型;
综上所述,本研究在绘制特定的基因组特征和它们的功能,以确定诱发H.pylori特异性胃紊乱所需的因子研究上提供了一个重要的里程碑。