中华预防医学杂志    2020年05期 杭州市首例新型冠状病毒肺炎病例病毒全基因组序列测定及分析    PDF     文章点击量:129    
中华预防医学杂志2020年05期
中华医学会主办。
0

文章信息

俞骅 王旭初 李钧 钱昕 于新芬 孙昼 陈珺芳 考庆君 汪皓秋 潘劲草
YuHua,WangXuchu,LiJun,QianXin,YuXinfen,SunZhou,ChenJunfang,KaoQingjun,WangHaoqiu,PanJingcao
杭州市首例新型冠状病毒肺炎病例病毒全基因组序列测定及分析
Genomic analysis of a 2019-novel coronavirus (2019-nCoV) strain in the first COVID-19 patient found in Hangzhou
中华预防医学杂志, 2020,54(5)
http://dx.doi.org/10.3760/cma.j.cn112150-20200217-00128
引用本文:

文章历史

投稿日期: 2020-02-17
上一篇:新型冠状病毒隐性感染者的发现和管理
下一篇:甘肃省首起新型冠状病毒肺炎家庭聚集性疫情分析
杭州市首例新型冠状病毒肺炎病例病毒全基因组序列测定及分析
俞骅 王旭初 李钧 钱昕 于新芬 孙昼 陈珺芳 考庆君 汪皓秋 潘劲草     
俞骅 杭州市疾病预防控制中心卫生检验中心 310021
王旭初 杭州市疾病预防控制中心卫生检验中心 310021
李钧 杭州市疾病预防控制中心卫生检验中心 310021
钱昕 杭州市疾病预防控制中心卫生检验中心 310021
于新芬 杭州市疾病预防控制中心卫生检验中心 310021
孙昼 杭州市疾病预防控制中心卫生检验中心 310021
陈珺芳 杭州市疾病预防控制中心卫生检验中心 310021
考庆君 杭州市疾病预防控制中心卫生检验中心 310021
汪皓秋 杭州市疾病预防控制中心卫生检验中心 310021
潘劲草 杭州市疾病预防控制中心卫生检验中心 310021
摘要: 目的  分析杭州市首例感染新型冠状病毒(2019-nCoV)病例病毒全基因组序列特征。方法  采集杭州市首例新型冠状病毒肺炎病例咽拭子和深咳痰液呼吸道标本,对标本进行病毒核酸提取和实时逆转录PCR检测,对病毒进行高通量基因组测序;从美国国立生物技术信息中心GenBank数据库中获取29条(分别来自武汉、深圳、日本、美国、澳大利亚和芬兰)2019-nCoV基因组序列和其他物种来源的30条β冠状病毒基因组进行系统发育分析。对15株武汉地区毒株基因组以突变位点进行分组,鉴定其他地区相同和特异性突变位点。结果  获得29 833 bp长度的杭州首例感染2019-nCoV病例病毒的基因组序列,覆盖病毒编码区全长。系统发育分析表明,该病毒与云南蝙蝠中分离到的严重急性呼吸综合征样冠状病毒RaTG13株最为接近,相似性为96.11%;相较其他基因,E基因间相似性最高(99.56%),而编码病毒表面刺突蛋白的S基因间相似性最低(92.87%)。与来自武汉、深圳、日本、美国、澳大利亚和芬兰的29株2019-nCoV基因组序列进行比对,相似性均大于99.9%,但在一些毒株中也发现了一些单位点核苷酸多态性。结论  杭州首例感染2019-nCoV病例病毒基因组序列和来自国内外疫情早期病毒基因组高度近源。
关键词 :基因组;新型冠状病毒;新型冠状病毒肺炎
Genomic analysis of a 2019-novel coronavirus (2019-nCoV) strain in the first COVID-19 patient found in Hangzhou
YuHua,WangXuchu,LiJun,QianXin,YuXinfen,SunZhou,ChenJunfang,KaoQingjun,WangHaoqiu,PanJingcao     
Hangzhou Center for Disease Prevention and Control, Health Inspection Center, Hangzhou 310021, China
Corresponding author: Pan Jingcao, Email: jingcaopan@sina.com
Abstract:Objective  To understand the viral genomic characteristics of a 2019-novel coronavirus (2019-nCoV) strain in the first COVID-19 patient found in Hangzhou, China.Methods  Viral RNA was extracted in throat swab and sputum sample of the patient and was performed real-time reverse transcription PCR detection and obtained viral genome by high-throughput sequencing method. Phylogenetic analysis was conducted using 29 2019-nCoV genomes and 30 β-coronavirus genomes deposited in NCBI GenBank. Fifteen genomes from Wuhan were grouped by mutation sites and others were identified by Wuhan's or specific mutation sites.Results  A 29 833 bp length genome of the first 2019-nCoV strain in Hangzhou was obtained, covering full length of the coding regions of coronavirus. Phylogenetic analysis showed that the genome was closest to the genome of a bat SARS-like coronavirus strain RaTG13 with an identity of 96.11% (28 666/29 826). Among the genes between two genomes, E genes were highly conserved (99.56%), while S genes had lowest identity (92.87%). The genome sequence similarities among 29 strains from China (Hangzhou, Wuhan, and Shenzhen), Japan, USA, and Finland, were all more than 99.9%; however, some single nucleotide polymorphisms were identified in some strains.Conclusion  The genome of Hangzhou 2019-nCoV strain was very close to the genomes of strains from other cities in China and overseas collected at early epidemic phase. The 2019-nCoV genome sequencing method used in this paper provides an useful tool for monitoring variation of viral genes.
Key words :Genome;2019-nCoV;COVID-19
全文

2019年12月底新型冠状病毒(2019-novel coronavirus,2019-nCoV)在武汉引起了肺炎的暴发流行并向全国扩散[1,2,3]。截至2020年3月9日24时,根据国家卫生健康委员会官方网站数据[4],31个省(自治区、直辖市)和新疆生产建设兵团共报告80 754例确诊病例。冠状病毒为有包膜的单股正链RNA病毒,冠状病毒(coronavirus,CoV)科下分为α-CoV、β-CoV、γ-CoV和δ-CoV等4个属,包括2019-nCoV、严重急性呼吸综合征冠状病毒(severe acute respiratory syndrome associated coronavirus,SARS-CoV)和中东呼吸综合征冠状病毒(Middle East respiratory syndrome associated coronavirus,MERS-CoV)在内,已知有7种冠状病毒可引起人类疾病[5]。2020年1月19日杭州报告了首起来自武汉的输入性2019-nCoV感染病例,为了解该病例病毒基因组特征和开展病原溯源,本研究应用二代测序技术对该病例标本进行了病毒全基因组序列测定、组装并进行了分析,现报告如下。

材料与方法  

1.样本来源:  病例为男性,32岁,已婚,杭州滨江区某公司职员,家庭住址杭州江干区。2020年1月14—16日病例赴武汉出差,同行同事和接触过的武汉分公司同事中无发热病例,否认与其他发热病例、农贸市场、禽类和野生动物接触史。1月16日18时在汉口火车站逗留1 h左右后返杭;1月18日感头痛和乏力,自测体温37.8 ℃;1月19日去浙江大学附属第一医院发热门诊就诊,接诊医生考虑有感染2019-nCoV的可能,遂将其单间隔离治疗,并采集咽拭子和深咳痰液呼吸道标本进行2019-nCoV病毒核酸检测。

2.病毒核酸提取和实时逆转录PCR检测:  采用病毒核酸提取试剂盒(Qiagen RNeasy Mini Kit,德国Qiagen公司,货号:74104)提取200 μl样本的总RNA。采用荧光逆转录PCR 2019-nCov ORF1ab/N基因双重核酸检测试剂盒(上海辉睿公司,VR-II-120)检测样本,反应体系和程序参照试剂盒说明书在QuantStudio 5 Real-Time PCR System (Thermo Fisher Scientific Inc.,美国)上运行。

3.病毒基因组序列测定:  应用随机引物逆转录方法,使用cDNA合成试剂盒(Invitrogen ? SuperScript ? Ⅲ First-Strand Synthesis SuperMix,美国Thermo Fisher Scientific Inc.,货号:18080-400)生成cDNA第一链。根据ARTIC Network公布的实验方案合成扩增引物,详见文末附件。采用多重PCR扩增试剂盒(Qiagen Multiplex PCR Kit,德国Qiagen公司,货号:206143)进行多重PCR扩增。PCR反应程序为95 ℃ 15 min;94 ℃ 30 s,58 ℃ 90 s,72 ℃ 45 s扩增35个循环;72 ℃ 10 min。PCR产物采用核酸磁株纯化试剂盒(AMPure XP Beads,美国Beckman Coulter公司,货号:A63880)等比例纯化回收。文库构建采用Nextera XT DNA Library Preparation Kit试剂盒(美国Illumina公司,货号:FC-131-1024),采用Miseq Reagent Kits v2 300cycles试剂盒(美国Illumina公司,货号:MS-102-2002)在Illumina Miseq平台上进行高通量测序。测序数据使用Trimmomatic[6]去除接头和低质量序列后,以2019-nCoV Wuhan-Hu-1基因组序列[美国国立生物技术信息中心(National Center for Biotechnology Information,NCBI)登录号MN908947.3[7]]为参考基因组,采用BWA[8]进行序列比对,用Samtools[9]和Bcftools[10]统计属于2019-nCoV的短序列(reads)的比对结果,并根据参考基因组获得一致性序列。使用Spades[11]进行de novo组装,获得的拼接序列(scaffolds)进行序列比对,根据比对结果验证序列是否存在结构性变异。

4.病毒基因组序列分析:  搜索NCBI GenBank数据库,获得武汉(15株)、深圳(2株)、日本(1株)、美国(9株)、澳大利亚(1株)和芬兰(1株)等国家和地区2019-nCoV基因组序列共29条,以及本研究中杭州1条;选择其他物种来源的β冠状病毒基因组序列共30条,所有毒株信息见附件1。使用Mafft[12]对上述50条2019-nCoV基因组进行多重序列比对,使用RAxML[13]构建最大似然法进化树(GTR+G模型,bootstrap=1 000),使用ggtree[14]绘制进化树。根据多重序列比对的结果,以15株武汉的2019-nCoV基因组的特异性单核苷酸多态性(single nucleotide polymorphism,SNP)位点进行分组,将其他15株2019-nCoV以是否携带武汉地区毒株的SNP位点分组,并标注其SNP位点。

结果  

1.实时逆转录PCR检测:  病例样本经2019-nCoV RNA检测为阳性,orf1ab和N基因的Ct值分别为26.5和27.0。以该样本中提取的RNA为后续基因组测序的起始模板。

2.基因组测序基本数据:  高通量测序结果共获得短序列数8.51 M,其中Q30以上数据95.6%,属于2019-nCoV序列的短序列达4.72 M,占比55.43%。基因组平均深度为5 037 x,扩增子区域的基因组覆盖度100.0%(图1),通过基因组序列比对的方法获得29 833 bp长度的2019-nCoV基因组一致性序列,未发现结构性变异。该一致性序列作为杭州首例2019-nCoV感染病例病毒株BetaCoV/Hangzhou/HZ-1/2020(以下简称HZ-1株)基因组序列,已存入NCBI GenBank数据库,登录号为MT039873.1。

图1杭州首例新型冠状病毒肺炎病例病毒基因组覆盖度和深度示意图

3.病毒基因组系统发育分析:  如图2所示,30株2019-nCoV基因组水平上高度近源,相似性> 99.9%,与云南、舟山蝙蝠中分离到的SARS样冠状病毒(RaTG13株[15]和Bat-SL-CoVZC45株)较为接近,形成1个聚类;HZ-1株和RaTG13株基因组核苷酸序列相似性为96.11%。SARS-CoV和蝙蝠等动物来源的其他冠状病毒形成另一个聚类,HZ-1株和其中1株SARS-CoV HKU-39849株的核苷酸序列相似性为79.33%。HZ-1株与RaTG13株、Bat-SL-CoVZC45株、HKU-39849株各基因的核苷酸相似度见表1,E基因间相似性最高(93.51%~ 99.56%),而S基因间相似性最低(73.23%~92.87%)。

表1杭州首例新型冠状病毒肺炎病例毒株与其他冠状病毒基因的核苷酸相似度
图260株冠状病毒株基因组进化树

4.2019-nCoV SNP:  如图3所示,30株2019-nCoV之间共有35个SNP位点的差异。15株武汉毒株根据SNP位点差异可以分成9个类型,其中以Wuhan-Hu-1株(MN908947.3)核苷酸序列为代表的有7株,其他8株各形成1个类型,共15个SNP。杭州和芬兰毒株序列与Wuhan-Hu-1株一致。8782和28144位点的T/C、C/T突变连锁存在于我国武汉(LR757995.1)和深圳(MN938384.1、MN975262.1),以及美国(MN985325.1、MN994467.1、MN997409.1、MT020880.1、MT020881.1)的毒株中。8782位点的突变为同义突变,28144位点的突变为非同义突变(酪氨酸->组氨酸)。

图330株新型冠状病毒SNP位点分析示意图

讨论  本研究所选主要为疫情早期毒株,30株2019-nCoV基因组有35个SNP位点表明该病毒在短时期内开始向全球扩散,易随传播及流行发生基因变异。随着疫情发展,病毒是否会发生突变或重组,需要持续监测。从基因组序列系统发育分析来看,提示2019-nCoV可能来源于蝙蝠的β-CoV。进一步分析各基因的相似性,E基因具有较保守的进化速率,而S基因间具有较高的进化速率。S基因编码刺突蛋白,负责吸附宿主受体,可能与宿主适应有关,因此推测病毒自蝙蝠跳转到人之间,应该有过一种或数种中间宿主转换。基因组SNP表明疫情早期国内外毒株在28144位点的差异形成2种SNP类型,一种是武汉、杭州和美国地区的毒株,在28144位点是C;另一种是武汉、深圳和美国的毒株,在28144位点是T。这一位点突变可为毒株溯源和传播能力进行进一步研究提供依据。
        对临床样本进行病原微生物基因组测序,获得完整高质量病原序列的核心在于非目标序列的去除,尤其是人源序列的去除。除了样本过滤、离心等方法去除细胞等干扰,目前常用的增加目标序列方法有探针捕获人源序列并加以去除、设计特意/通用的病原探针进行捕获、设计覆盖全基因组的特异性引物富集等。通过多重PCR增加目标基因组序列,再采用扩增子高通量测序方法获得全长基因组,是测定已知病毒基因组序列的一种简单有效的方法。本研究根据ARTIC Network公布的实验方案通过98组引物生成400~700 bp长度扩增子DNA后,使用Nextera XT方法构建基因组文库可以获得良好的序列分布。在本研究中,去除引物端的短序列可比对到参考基因组的达55.43%,在不同实验试剂条件中甚至可以获得80%以上的目标片段序列,其效率远高于一般宏基因组测序约1%~20%的目标reads数。但此方法扩增子之间的丰度差异较大,在23277~23415区域出现超过1 m深度的高覆盖,在6869~7041区域和29687~29835区域的深度低于100 x。因此对于Ct>32的样本建议增加测序深度或优化引物浓度以获得全长基因组。
        综上所述,杭州首例新型冠状病毒感染病例2019-nCoV基因组序列和来自国内外疫情早期冠状病毒基因组比较高度近源,本研究成功应用的基因组测序方法为今后进一步监测病毒基因变异提供了一个可行的方案。

参考文献
[1]ZhuN, ZhangD, WangW, et al. A Novel Coronavirus from Patients with Pneumonia in China, 2019[J]. N Engl J Med, 2020,382(8):727-733. DOI: 10.1056/NEJMoa2001017.
[2]HuangC, WangY, LiX, et al. Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China[J]. Lancet, 2020, 395(10223): 497-506. DOI: 10.1016/S0140-6736(20)30183-5.
[3]田怀玉 . 2019-nCoV:来自冠状病毒的新挑战[J].中华预防医学杂志, 2020, 54(3): 233-236. DOI: 10.3760/cma.j.issn.0253-9624.2020.0001.
[4]中华人民共和国国家卫生健康委员会卫生应急办公室. 截至3月9日24时新型冠状病毒肺炎疫情最新情况[EB/OL]. [2020-03-04]. http://www.nhc.gov.cn/xcs/yqtb/202003/948a03ad76f54d3583a018785efd7be9.shtml.
[5]ChanJF, KokKH, ZhuZ, et al. Genomic characterization of the 2019 novel human-pathogenic coronavirus isolated from a patient with atypical pneumonia after visiting Wuhan[J]. Emerg Microbes Infect, 2020, 9(1): 221-236. DOI: 10.1080/22221751.2020.1719902.
[6]BolgerAM, LohseM, UsadelB. Trimmomatic: a flexible trimmer for Illumina sequence data[J]. Bioinformatics, 2014, 30(15): 2114-2120. DOI: 10.1093/bioinformatics/btu170.
[7]WuF, ZhaoS, YuB, et al. A new coronavirus associated with human respiratory disease in China[J]. Nature, 2020. DOI: 10.1038/s41586-020-2008-3.
[8]LiH . Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM[J]. Genomics, 2013.
[9]LiH, HandsakerB, WysokerA, et al. The Sequence Alignment/Map format and SAMtools[J]. Bioinformatics, 2009, 25(16): 2078-2079. DOI: 10.1093/bioinformatics/btp352.
[10]NarasimhanV, DanecekP, ScallyA, et al. BCFtools/RoH: a hidden Markov model approach for detecting autozygosity from next-generation sequencing data[J]. Bioinformatics, 2016, 32(11): 1749-1751. DOI: 10.1093/bioinformatics/btw044.
[11]BankevichA, NurkS, AntipovD, et al. SPAdes: a new genome assembly algorithm and its applications to single-cell sequencing[J]. J Comput Biol, 2012, 19(5): 455-477. DOI: 10.1089/cmb.2012.0021.
[12]KatohK, StandleyDM. MAFFT multiple sequence alignment software version 7: improvements in performance and usability[J]. Mol Biol Evol, 2013, 30(4): 772-780. DOI: 10.1093/molbev/mst010.
[13]StamatakisA. RAxML version 8: a tool for phylogenetic analysis and post-analysis of large phylogenies[J]. Bioinformatics, 2014, 30(9): 1312-1313. DOI: 10.1093/bioinformatics/btu033.
[14]YuG, LamTT, ZhuH, et al. Two methods for mapping and visualizing associated data on phylogeny using ggtree[J]. Mol Biol Evol, 2018, 35(12): 3041-3043. DOI: 10.1093/molbev/msy194.
[15]ZhouP, YangXL, WangXG, et al. A pneumonia outbreak associated with a new coronavirus of probable bat origin[J]. Nature, 2020. DOI: 10.1038/s41586-020-2012-7.