中华预防医学杂志    2020年03期 霍乱弧菌O1血清群El Tor产毒株重组特征分析    PDF     文章点击量:66    
中华预防医学杂志2020年03期
中华医学会主办。
0

文章信息

李臻鹏 逄波 卢昕 阚飙
LiZhenpeng,PangBo,LuXin,KanBiao
霍乱弧菌O1血清群El Tor产毒株重组特征分析
Genomic recombination of the vibrio cholerae serogroup O1 El Tor pandemic strains
中华预防医学杂志, 2020,54(3)
http://dx.doi.org/10.3760/cma.j.issn.0253-9624.2020.03.011
引用本文:

文章历史

投稿日期: 2019-12-18
上一篇:2013—2017年广州市住院儿童呼吸道合胞病毒流行特征及分子生物学分析
下一篇:中国人群优先筛查癌种分析:基于卫生经济学证据的系统评价
霍乱弧菌O1血清群El Tor产毒株重组特征分析
李臻鹏 逄波 卢昕 阚飙     
李臻鹏 中国疾病预防控制中心传染病预防控制所 传染病预防控制国家重点实验室,北京 102206
逄波 中国疾病预防控制中心传染病预防控制所 传染病预防控制国家重点实验室,北京 102206
卢昕 中国疾病预防控制中心传染病预防控制所 传染病预防控制国家重点实验室,北京 102206
阚飙 中国疾病预防控制中心传染病预防控制所 传染病预防控制国家重点实验室,北京 102206
摘要: 目的  分析霍乱弧菌O1血清群El Tor产毒株基因组的重组特征。方法  在美国国立生物技术信息中心数据库中,选取分离时间从1937—2015年的292株霍乱弧菌O1血清群El Tor菌株完成图序列或草图序列,以菌株N16961的基因组序列为参照,使用snippy软件获得菌株的全基因组比对信息,利用ClonalFrameML软件对数据进行重组分析,比较大小染色体间重组数目及重组区域总长度的差异,以及不同分离地区菌株的基因组重组片段数目和总长度的差异。使用KOBAS分析工具对重组热点基因进行基因本体富集分析。结果  292株霍乱弧菌菌株中,发生基因重组163株(55.8%);其中,归一化处理的小染色体重组片段数目MP25P75)为4.7×10-6(9.3×10-7,2.0×10-5),大于大染色体[2.4×10-6(3.4×10-7,5.7×10-6)](P<0.001);小染色体重组区域占小染色体长度的比例MP25P75)7.1%×10-5(3.7%×10-6,4.8%×10-4),大于大染色体[2.2%×10-5(2.4%×10-6,8.4%×10-5)](P<0.001)。分离自非洲、亚洲、欧洲、北美洲和南美洲的菌株重组片段数目MP25P75)分别为23(1.0,33.0)、1.0(0.0,34.0)、6.0(2.0,13.0)、0.0(0.0,1.0)和29.5(6.8,56.8)(P<0.001);分离自各大洲的菌株重组区域总长度MP25P75)分别为233.0(4.0,461.0)、11.0(0.0,695.5)、56.0(4.0,111.0)、0.0(0.0,9.0)和347.5(132.8,1 323.5)bp(P<0.001)。富集分析结果显示,62个重组热点编码基因的功能主要集中在趋化、趋性、对外界刺激的反应、受体活性和分子转导活性。结论  霍乱弧菌El Tor大小染色体的重组片段数目及区域长度存在差别,不同大洲菌株重组片段数目及重组区域总长度不同。
关键词 :弧菌,霍乱;基因组;染色体;基因重组
Genomic recombination of the vibrio cholerae serogroup O1 El Tor pandemic strains
LiZhenpeng,PangBo,LuXin,KanBiao     
State Key Laboratory for Infectious Disease Prevention and Control/National Institute for Communicable Disease Control and Prevention, Chinese Center for Disease Control and Prevention, Beijing 102206, China
Corresponding author: Kan Biao, Email: kanbiao@icdc.cn
Abstract:Objective  To analyze the genomic recombination of the vibrio cholerae serogroup O1 El Tor pandemic strains.Methods  A total of 292 complete or draft genome sequences of Vibrio cholerae O1 serogroup El Tor strains isolated from 1937 to 2015 were selected from National Biotechnology Information Center database. The genome alignment of strains was computed by snippy software by using N16961 as reference sequence. Then ClonalFrameML software was used to do the recombinant analysis. The wilcox.test function in agricolae package was used to compare the number recombinant segments and the total length of recombinant regions between small and large chromosomes. The kruskal function was used to compare the number recombinant segments and the total length of recombinant regions among different isolation continents. The KOBAS tool was used to do the gene ontology enrichment analysis of recombinant hotspot genes.Results  Of all 292 strains of Vibrio cholerae, 163 strains (55.8%) were recombined. The median of normalized recombinant segment number of small chromosome was 4.7×10-6 (9.3×10-7, 2.0×10-5), which was significantly larger than that of large chromosome [2.4×10-6 (3.4×10-7, 5.7×10-6)] (P<0.001). The median (P25,P75) of recombinant segment number of strains isolated from Africa, Asia, Europe, North America and South America were 23(1.0,33.0), 1.0(0.0,34.0), 6.0(2.0,13.0), 0.0(0.0,1.0) and 29.5(6.8,56.8), respectively, and the difference was statistically significant (P<0.001). The median (P25,P75) of total length of recombinant regions of strains isolated from Africa, Asia, Europe, North America and South America were 233.0(4.0, 461.0), 11.0(0.0, 695.5), 56.0(4.0,111.0), 0.0(0.0,9.0) and 347.5(132.8,1 323.5) bp, respectively, and the difference was statistically significant (P<0.001). Gene ontology Enrichment analysis showed that the functions of 62 recombinant hotspot genes were mainly enrichment in chemotaxis, taxis, response to external stimulus, receptor activity and molecular transducer activity.Conclustion  In this study, we found that there were significant differences in the number of recombinant fragments and the length of recombinant regions between large and small chromosomes of Vibrio cholerae El Tor. We also found significant differences in the number of recombinant fragments and the total length of recombinant regions among different continents.
Key words :Vibrio cholerae;Genome;Chromosomes;Gene recombination
全文

霍乱弧菌作为引起霍乱的病原体可引起人类严重腹泻,按照合成O抗原种类的不同,可将其分为多种血清群,迄今为止已发现有200多个血清群[1]。其中O1和O139群是引起人类疾病的主要血清群。已有研究发现基因重组是霍乱弧菌环境株种群进化的重要驱动力,有72%的环境株存在重组事件[2]。一项来自莫桑比克的对75个霍乱弧菌临床株的研究证实了局部地区流行过程中重组的存在[3],另外,有研究显示霍乱弧菌流行株在获得流行潜能过程中经历了广泛的重组事件[4]。目前霍乱弧菌的研究多集中在菌株之间的进化关系,而缺乏对全基因组水平重组的精细解析,本研究主要选取霍乱弧菌O1血清群El Tor生物型产毒株来分析其与参考基因组共有的基因组的重组特征。

资料与方法  

1.资料:  在美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)数据库中,选取分离时间从1937—2015年的292株霍乱弧菌O1血清群El Tor菌株完成图序列或草图序列进行分析,经BLAST软件鉴定所有菌株均含有霍乱毒素基因ctxAB,其中284株属于L2分支,即第7次大流行菌株,6株属于其他分支,即非大流行菌株。

2.重组分析:  以菌株N16961的基因组序列[5]为参考,使用snippy软件分析获得292株菌株的全基因组比对信息及单核苷酸多态性(single nucleotide polymorphism,SNP),其中,snippy软件既能接受未组装的测序片段也能接受草图序列直接作为输入,通过每一个菌株的草图序列与菌株N16961进行比对获得变异相关信息,最后将所有菌株的信息进行综合,获得核心SNP及基于N16961的全基因组比对信息。再使用ClonalFrameML软件对获得的所有菌株的全基因组比对数据进行重组分析,获得重组区域的信息[6]。最后,将存在于重组区域的编码基因提取出来,统计存在基因重组的菌株数量,从而找到重组热点编码基因,其中,将出现在3个及以上菌株中的重组的基因定义为重组热点基因。

3.统计学分析:  使用基于R 2.3软件包进行统计学分析,大小染色体间重组数目、重组区域总长度、重组区域占染色体长度的比例以及不同分离地区(非洲、亚洲、欧洲、北美洲和南美洲)菌株的基因组重组片段数目不符合正态分布,均采用MP25P75)表示,同时采用agricolae软件包里的wilcox.test函数进行秩和检验,比较大小染色体间的差异;由于有1株菌株分离地区不详,另外分离自大洋洲的菌株只有1株,样本量过低,影响分析结果,故此部分分析排除这2株菌株,有效样本量为290株,采用kruskal函数进行非参数方差分析,比较不同分离地区(非洲、亚洲、欧洲、北美洲和南美洲)菌株的基因组重组片段数目、总长度的差异。采用LSD方法进行不同地区间两两比较。双侧检验,检验水准α=0.05。由于大小染色体长度差别较大,本研究在比较大小染色体重组片段数目及总长度时考虑了大小染色体长度的差别,所以采用重组片段数目及总长度除以大小染色体的长度的方法对两者进行了归一化处理。

4.基因本体(gene ontology,GO)富集分析:  使用KOBAS在线分析工具对重组热点基因进行GO富集分析[7],将重组热点基因的蛋白质序列输入KOBAS分析工具中,以N16961菌株的基因组为参考,使用GO数据库进行富集分析。选取矫正后P≤0.2的条目为显著的生物学过程。

结果  

1.霍乱弧菌全基因组水平的重组分析:  292株霍乱弧菌菌株中,发生基因重组的菌株为163株(55.8%);每株基因组上包含重组片段数目为13.0(2.0,39.5)。每株菌重组区域的长度为18.0(6.0,36.0)bp。存在基因重组的163株菌株中,每个菌株重组区域总长度为176.0(18.5,833.0)bp。另外,L2分支存在重组菌株的平均重组片段数目和重组区域总长度分别为13(2,39)和174.0(18.0,793.5)bp,非L2分支菌株分别为301.0(27.0,681.0)和13 071.50(646.75,89 768.00)bp。

2.霍乱弧菌大小染色体重组差异分析:  每个菌株大小染色体总体重组片段数目差异无统计学意义(Z=13 843.00,P=0.510),进而对大小染色体重组片段数目进行归一化处理后再进行比较,结果显示归一化处理的小染色体重组片段数目为4.7×10-6(9.3×10-7,2.0×10-5),大于大染色体[2.4×10-6(3.4×10-7,5.7×10-6)],差异有统计学意义(Z=17 048.00,P<0.001)。大小染色体各自重组区域长度的差异无统计学意义(Z=12 324.00,P=0.258);进一步计算大小染色体各自重组区域占各自染色体长度的比例,结果显示,小染色体重组区域占小染色体长度的比例为7.1%×10-5(3.7%×10-6,4.8%×10-4),大于大染色体[2.2%×10-5(2.4%×10-6,8.4%×10-5)],差异有统计学意义(Z=10 086.00,P<0.001)。

3.重组与菌株分离地区的关联:  分离自非洲、亚洲、欧洲、北美洲和南美洲的菌株重组片段数目为23(1.0,33.0)、1.0(0.0,34.0)、6.0(2.0,13.0)、0.0(0.0,1.0)和29.5(6.8,56.8),差异有统计学意义(H=60.21,P<0.001);两两比较结果显示,北美洲分离株的重组片段数目分别与亚洲、非洲、欧洲和南美洲分离株相比,差异均有统计学意义(P值均<0.001),而亚洲分离株重组片段数目均低于非洲和南美洲(P值均<0.05)。分离自各州的菌株重组区域总长度分别为233.0(4.0,461.0)、11.0(0.0,695.5)、56.0(4.0,111.0)、0.0(0.0,9.0)和347.5 (132.8,1 323.5)bp,差异有统计学意义(H=58.27,P<0.001);两两比较结果显示,北美洲分离株重组片段的总长度分别与非洲、亚洲、欧洲和南美洲的分离株相比,差异均有统计学意义(P值均<0.001),而亚洲分离株重组片段总长度低于南美洲(P<0.05)。

4.重组基因的功能特征分析:  共1 059个基因发生重组,占到参照菌株基因组基因数目的29.8%(1 059/3 554)。本研究一共得到62个重组热点基因(表1),经过功能富集分析,这些重组热点编码基因的功能主要集中在趋化、趋性、对外界刺激的反应、受体活性和分子转导活性(表2)。

表1霍乱弧菌O1群El Tor生物型流行菌株重组热点基因列表
表2霍乱孤菌62个重组热点基因基于基因本体的生物学过程富集分析

讨论  本研究发现,55.8%的菌株存在基因重组,说明重组仍是流行的El Tor产毒株在群体水平进化的重要驱动力。绝大多数菌株基因组的重组片段数目在80以下,但少数菌株具有异常多的重组片段数目,以及具有异常大的重组片段的总长度,因此有必要对这种高频重组株菌的传播情况进行重点监控。霍乱弧菌有大小两个染色体,其中小染色体被推测是被古老的弧菌捕获的大质粒,并且自身存在一个基因捕获系统[5],本研究发现霍乱弧菌小染色体比大染色体有着更高的重组频率,可能是由于各自染色体的遗传背景决定的,说明小染色体在霍乱弧菌El Tor产毒株进化中可能受到更强的进化选择,这对于研究霍乱弧菌两个染色体的生物学发生、以及遗传进化特征上也提供了有意义的研究依据,即需要特别关注小染色体的来源、演化、以及其存在的比大染色体更高频重组的意义。
        在重组基因数目上,非洲和南美洲分离组较多。实际上从19世纪80年代霍乱发生率较低,并仅限在亚洲和非洲,到90年代霍乱在非洲和南非洲有两次大的暴发,数十年来非洲和南美洲霍乱病例数占全球发病数明显高于亚洲和北美洲,有更大范围和长时间的扩散流行[8],因此可能导致了更多的基因重组现象。北美洲分离株的重组片段数目及总长度较低,可能与其偶尔的霍乱输入有关,霍乱弧菌的多样性有限。
        重组热点基因是进化方向的反应,病原菌对新生境的适应很大程度是由重组介导的[9],本研究也发现霍乱弧菌的频繁重组基因中涉及多种与菌株适应性相关的功能,包括趋化、趋性、对外界刺激的反应等。其中重组最频繁的基因是六型分泌系统的vgrG1基因,六型分泌系统相关基因的水平基因转移已经在实验室条件下被证实,并且被认为是在其生存环境内复杂菌群的生存竞争中、有利于霍乱弧菌菌株的适应性[10]。因此,分析得到的这些频繁重组基因,有必要通过实验鉴定这些重组基因对霍乱弧菌适应性的影响,并且在未来在霍乱弧菌的监测和研究工作中重点关注这些基因的变化情况。
        总之,本研究鉴定了O1群El Tor型霍乱弧菌产毒菌株的重组特点,整体上发现共有基因组中曾经的重组证据,另外,发现不同菌株中存在的热点基因,也为将来分析这些基因赋予霍乱弧菌生存能力的作用提供了靶点。

参考文献
[1]YamaiS, OkitsuT, ShimadaT, et al. Distribution of serogroups of Vibrio cholerae non-O1 non-O139 with specific reference to their ability to produce cholera toxin, and addition of novel serogroups[J]. Kansenshogaku Zasshi, 1997,71(10):1037-1045. DOI: 10.11150/kansenshogakuzasshi1970.71.1037.
[2]KeymerDP, BoehmAB. Recombination shapes the structure of an environmental Vibrio cholerae population[J]. Appl Environ Microbiol, 2011,77(2):537-544. DOI: 10.1128/AEM.02062-10.
[3]GarrineM, MandomandoI, VubilD, et al. Minimal genetic change in Vibrio cholerae in Mozambique over time: multilocus variable number tandem repeat analysis and whole genome sequencing[J]. PLoS Negl Trop Dis, 2017,11(6):e0005671. DOI: 10.1371/journal.pntd.0005671.
[4]FengL, ReevesPR, LanR, et al. A recalibrated molecular clock and independent origins for the cholera pandemic clones[J]. PLoS One, 2008,3(12):e4053. DOI: 10.1371/journal.pone.0004053.
[5]HeidelbergJF, EisenJA, NelsonWC, et al. DNA sequence of both chromosomes of the cholera pathogen Vibrio cholerae[J]. Nature, 2000,406(6795):477-483. DOI: 10.1038/35020000.
[6]DidelotX, WilsonDJ. ClonalFrameML: efficient inference of recombination in whole bacterial genomes[J]. PLoS Comput Biol, 2015,11(2):e1004041. DOI: 10.1371/journal.pcbi.1004041.
[7]XieC, MaoX, HuangJ, et al. KOBAS 2.0: a web server for annotation and identification of enriched pathways and diseases[J]. Nucleic Acids Res, 2011,39(Web Server issue):W316-322. DOI: 10.1093/nar/gkr483.
[8]LamC, OctaviaS, ReevesP, et al. Evolution of seventh cholera pandemic and origin of 1991 epidemic, Latin America[J]. Emerg Infect Dis, 2010,16(7):1130-1132. DOI: 10.3201/eid1607.100131.
[9]HuD, LiuB, FengL, et al. Origins of the current seventh cholera pandemic[J]. Proc Natl Acad Sci U S A, 2016,113(48): E7730-E7739. DOI: 10.1073/pnas.1608732113.
[10]ThomasJ, WatveSS, RatcliffWC, et al. Horizontal gene transfer of functional type VI killing genes by natural transformation [EB/OL].[2020-01-05]. https://sci-hub.tw/10.1128/mbio.00654-17.