中华预防医学杂志    2014年06期 高通量测序平台用于一起疑似经性传播HIV的溯源调查    PDF     文章点击量:4026    
中华预防医学杂志2014年06期
中华医学会主办。
0

文章信息

赵琦 时丽丽 蒋岩 温玉洁 潘品良 张桂云 邱茂锋
高通量测序平台用于一起疑似经性传播HIV的溯源调查
中华预防医学杂志, 2014,48(6)
引用本文:

文章历史

投稿日期:
上一篇:艾滋病抗病毒治疗死亡患者的生存时间及相关因素分析
下一篇:中国农村6~11岁小学生忽视评价常模的研制
高通量测序平台用于一起疑似经性传播HIV的溯源调查
赵琦 时丽丽 蒋岩 温玉洁 潘品良 张桂云 邱茂锋     
摘要: 目的建立分析HIV准种的Miseq高通量测序(简称Miseq测序)技术,并尝试用于一起疑似经性传播HIV的溯源调查。方法采集疑似有传播关系的2例HIV感染者(编号P1、P2)血液样本,并以同一城市与他们无直接传播关系的2例HIV感染者(编号P3、P4)为对照。提取血浆中RNA,逆转录后进行HIV基因亚型分析和Miseq测序。根据测序结果分析样本中HIV的准种分布,比较使用优势准种数目由少到多(5、20、100、500、全部)时所得的基因离散率及系统进化树。结果4份样本中HIV的基因亚型相同,均为HIV1重组亚型(CRF)01_AE。采用Miseq测序,每份样本获得23 788~37 397条有效核酸序列,代表1 229~1 412个独特准种。P2与P1间的平均基因离散率(35%~45%)远小于与对照样本间(103%~196%,P<001)。系统进化树结果显示,P1和P2的准种聚集在一起,而P3和P4的各自单独聚为一簇;当所用的优势准种数目为20或更多时,P1对P2存在并系关系,提示HIV的传播方向是从P1到P2。结论Miseq测序在HIV感染溯源调查中可以推断传播关系和传播方向,其操作较简便、检测成本较低,具有较高的实用价值。
关键词 :HIV;分子流行病学;疾病传播;新一代测序技术;准种
    
Abstract:ObjectiveAn approach for analysis of HIV quasispecies using Miseq highthroughput sequencing platform (hereinafter referred to as Miseq platform) was established and applied to contact tracing for a possible case of HIV sexual transmission MethodsFour plasma specimens were collected from 2 HIV infections (P1 and P2) suspected to be involved in the sexual transmission and 2 local HIV infections as controls (P3 and P4) The RNAs were extracted from the specimens and then reversetranscribed into cDNA After HIV subtyping, Miseq platform was performed to detect and sequence the HIV quasispecies (352 bp) in each specimen The frequency of quasispecies was counted and ranked Intrapersonal and interpersonal genetic distance and phylogenetic tree were calculated by using the top 5, 20, 100, 500, and all quasispecies, respectively ResultsThe subtypes of HIV from all 4 specimens were CRF01_AE 23 788 to 37 397 cleaned sequences representing 1 229 to 1 412 unique HIV quasispecies were obtained from these specimens by using Miseq platform The average genetic distance (35%45%) between quasispecies from specimens P2 and P1 was significantly lower than that (103%196%) between quasispecies from P2 and the controls (P3 or P4) Phylogenetic tree analysis indicated that sequences from specimens P1 and P2 clustered together while sequences from P3 and P4 exhibited completely independent clusters When the top 20 or more quasispecies from each specimen were analyzed, sequences from P1 showed a paraphyletic relationship with those from P2, which may indicated that the direction of HIV transmission was from P1 to P2 ConclusionWith the feature of convenient and economic operation, Miseq platform has high practical value in contact tracing of possible HIV transmission
Key words :HIV;Molecular epidemiology;Disease transmission;New generation sequencing technology;Quasispecies
全文

传统的HIV暴露后感染溯源主要依赖于流行病学调查和文件记录,发生职业暴露后,在暴露当时、暴露后4周、8周、12周、6个月(特殊情况下1年)定期检测HIV抗体,以监测暴露人是否发生HIV抗体阳转[1]。然而,在特殊情况下,HIV抗体阳转的证据不足以认定HIV职业暴露后感染,比如暴露人在暴露前已感染HIV但处于检测窗口期,或暴露后随访期内又发生了可能感染HIV的其他高危行为,这就需要进一步做分子流行病学检测,包括病毒基因亚型和准种分析。
国外报道用于HIV暴露后感染溯源的实验室技术主要有PCR产物直接测序法[2]、PCR产物克隆测序法[35],其中后者报道较多,它可以在准种水平分析暴露源和暴露人体内HIV毒株间的关系。在国内,时丽丽等[6]将PCR产物克隆测序法成功地用于一起疑似输血传播HIV案例的调查。该方法的不足之处是需要进行克隆操作,比较繁琐。美国Illumina公司近年开发的Miseq高通量测序平台(简称Miseq测序)能够将PCR产物简单处理后直接进行测序,1次反应获得大量的核酸序列信息,已应用于流感病毒的全基因组测序、丙型肝炎病毒的耐药突变检测等研究中[78]。本研究建立了分析HIV准种的Miseq测序技术,并尝试用于一起疑似经性传播HIV案例的调查,为今后HIV职业暴露后感染的认定提供技术参考。
对象与方法
1对象:4例居住在同一城市、尚未接受抗病毒治疗的HIV感染者(编号P1~P4)。流行病学调查显示:P1,男,有6年的多性伴性行为史,HIV感染途径被认定为异性传播;P2,女,与 P1同居3年,无其他高危行为史,推测P2感染的HIV来自P1;P3和P4均为静脉注射吸毒者,他们与P1和P2之间没有直接的传播关系(表1)。在知情同意的前提下,分别采集4例HIV感染者的全血样本(用乙二胺四乙酸二钾抗凝剂抗凝),分离血浆并保存在-80 ℃备用。本研究获得中国CDC性病艾滋病预防控制中心伦理委员会审核通过。
2 RNA提取及逆转录:使用QIAamp Viral RNA Mini试剂盒(德国Qiagen公司)提取血浆样本中的RNA。使用Superscript III FirstStrand Synthesis System试剂盒(美国Invitrogen公司)逆转录合成cDNA。按照试剂盒说明书操作,其中逆转录步骤采用随机引物。
3 HIV基因亚型分析:选取HIV1包膜蛋白(env)基因区(在HXB2参考株序列中的核苷酸位置为7 002~7 668)、衣壳蛋白(gag)基因区(781~1 861)和聚合酶(pol)基因区(2 266~3 304)3个片段用于HIV基因亚型分析。PCR扩增引物序列及反应条件参考文献[911],采用TaKaRa Ex Taq试剂盒(大连宝生物公司)。PCR产物送测序公司纯化、测序。使用Chromas Pro 15软件进行序列拼接、校对。
4 Miseq测序:目的片段为HIV1 env基因区(在HXB2参考株序列中的核苷酸位置为7 169~7 520,长度352 bp)。实验步骤如下:(1)套式PCR扩增目的片段,采用TaKaRa Ex Taq试剂盒。一轮PCR引物序列及反应条件参考文献[12]。二轮反应体系(50 μl)为:5 μl 10倍Ex Taq缓冲液(不含Mg2+),4 μl 25 mmol/L MgCl2,4 μl 25 mmol/L脱氧核苷三磷酸(dNTP)混合液,5 μl一轮PCR产物,1 μl Ex Taq,4 μl 5 μmol/L上游引物(5′ATAAGKATAGGACCAGGACAA3′,7 148~7 168),4 μl 5 μmol/L下游引物(5′xxxxxxATGGGAGGR GCATACATTGCT3′,7 547~7 521,其中“xxxxxx”表示6个碱基,因样本而异,用于测序时区分每份样本),焦碳酸二乙酯(DEPC)处理的水补至总体积50 μl。第二轮PCR引物的设计参考中国HIV1流行株env基因保守区,覆盖重组亚型(CRF)01_AE、CRF 07_BC和CRF 08_BC。PCR反应条件如下:94 ℃ 2 min;94 ℃ 30 s,57 ℃ 30 s,72 ℃ 30 s,30个循环;72 ℃ 7 min。(2)PCR产物送测序公司进行胶回收纯化、构建DNA文库、使用Miseq平台测序,读长配置为2×250bp(即双向测序,每个方向读长图24份样本中HIV准种序列系统进化树
表2样本间平均基因离散率(%)
样本编号A组P2P3P4B组P2P3P4C组P2P3P4D组P2P3P4E组P2P3P4P142101181451121844410518635941803596187P2-116182-124189-116189-103189-104196P3--147--149--149--139--142注:A、B、C、D、E组分别选取最优势的前5、20、100、500条及全部准种序列进行分析为250 bp,共500 bp)。(3)数据初步处理方法参考文献[13],剔除不合格序列,分别统计每份样本中每条独特序列的出现频率,再剔除出现频率为1或2的序列。
5序列分析:(1)HIV基因亚型分析:从美国洛斯阿拉莫斯国家实验室HIV序列数据库(http://wwwhivlanlgov)下载HIV1基因亚型参考株,与待分型序列一起使用Bioedit软件比对。使用MEGA 522软件构建邻接法系统进化树(neighborjoining tree),采用JukesCantor替代模型,自展(bootstrap)值为1 000次。(2)Miseq测序结果分析:使用MEGA 522软件,采用JukesCantor替代模型计算基因离散率,系统进化树构建方法同上。
6统计学分析:使用SPSS 190软件进行统计学分析,两组间基因离散率的比较使用曼惠特尼(MannWhitney)U检验,检验水准为005。
结果
1 HIV基因亚型:HIV1 env区、pol区、gag区系统进化树分析都显示4份样本中HIV的基因亚型相同,均为HIV1 CRF 01_AE。在基因亚型水平上不能对4份样本中的毒株进一步区分,不能排除P2所感染的HIV来自P1的可能性。
2 HIV准种分布:对Miseq测序结果进行初步数据处理,4份样本分别获得的有效序列数为23 788~37 397条(平均29 045条)。剔除重复序列后,最终4份样本分别获得1 236~1 412条(平均1 314条)独特准种的序列(表1)。统计各样本中每条准种序列出现的频率并由高到低依次排序,频率最高(最优势)的前20条准种序列占HIV准种群总序列数的比例都超过40%,其中3份样本(P1、P2、P3)中超过60%(图1)。

图14份样本中最优势的前20条准种序列占整个HIV准种群总序列数的比例
3基因离散率:4份样本中HIV的样本内基因离散率计算结果见表1。针对每份样本,分别选取最优势的前5、20、100、500条及全部准种序列(依次标为A、B、C、D、E组)进行分析,样本间基因离散率见表2。当取最优势的前5条准种序列时(即A组),P2与P1间平均基因离散率为42%,低于P2与P3(116%)、P2与P4(182%)间的平均基因离散率,差异都有统计学意义(P<001);而除P2以外的其他样本间平均基因离散率都在10%以上。当取最优势的前20、100、500条或者全部准种序列时,所得结果相似,都支持P2和P1之间存在传播关系的流行病学调查结果。
4 系统进化树:同样按上述方法分为5组,分别构建系统进化树(图2)。组A的结果显示,P1和P2的准种聚集在一起,P3和P4的准种各自聚为一簇;P1与P2的准种间呈并列关系,不能提示传播方向。组B的系统进化树与组A相似,不同之处是P1的部分准种包裹着P2的全部准种,即P1对P2存在并系关系(paraphyletic relationship)[14],提示HIV传播的方向是从P1到P2;纳入分析的准种数越多(即由组B到组E),这种并系关系越加明显。
讨论
HIV变异性高,感染人体后会分化成一系列高度相关但又有一定差异的准种群[15],有直接传播关系的个体间HIV准种的基因相似性较高。在HIV感染溯源调查中,当HIV感染者与疑似传染源体内的病毒属于相同的亚型、无法排除传播关系时,基于HIV基因高可变区的准种分析结果可以提供更精细的实验室证据。本研究建立了针对HIV1 env基因区的Miseq测序技术,并尝试用于一起疑似经性传播HIV案例的调查。结果每份样本平均获得了1 314条 HIV准种序列,展示了样本中HIV准种的多样性和分布情况;P2与P1间的平均基因离散率(35%~45%)远小于与对照样本间(103%~196%,P<001),支持P2与P1之间存在传播关系的流行病学调查结果;系统进化树显示,P1和P2的准种聚集在一起,当所分析的优势准种数目为20或更多时,P1对P2存在并系关系,提示HIV的传播方向是从P1到P2,进一步验证了P2与P1之间存在传播关系。
多项研究表明,大部分HIV感染来自传染源的单个或少数HIV准种[1618]。源病毒毒株在感染者体内迅速分化成有一定差异的准种群,而这些准种群与传染源体内源病毒株所属的准种群之间的亲缘性要高于传染源体内其他一些准种群间的亲缘性。即传染源的部分准种序列与感染者的全部准种序列间存在并系关系,在系统进化树上直观地显示为包裹关系,若在发生传播后较短时间内采样检测,则可以判定传播方向[14, 19]。本研究发现,当只分析前5条优势准种序列时,系统进化树显示P1与P2的之间不存在并系关系;当分析前20条优势准种序列时,发现P1部分准种序列对P2准种序列存在并系关系,提示两者间的传播方向为从P1至P2;纳入分析的准种序列越多,这种并系关系越加明显。至于并系关系的检出可以持续到发生传播后多久采样以及如何确定计算所需的优势准种数,有待今后积累更多的数据。无疑,Miseq测序所能提供的大量准种序列信息为此提供了极大的空间。
Miseq测序的不足是测序长度有限(目前为500 bp)。为保证测序质量,并考虑到HIV1 env区基因的序列特点,本研究所用的有效序列长度为352 bp,而笔者所在的课题组早先建立的PCR产物克隆法所用目的片段长度为667 bp[6]。本研究结果表明,Miseq的测序深度可以弥补其在测序长度上的不足,能够满足HIV感染溯源调查的需要。由于该方法操作较简便,检测成本较低,在HIV感染溯源调查中具有较高的实用价值。
志谢感谢参加流行病学现场调查的专家和工作人员

参考文献
[1]中国疾病预防控制中心. 全国艾滋病检测技术规范(2009年修订版)[S]. 北京:中国疾病预防控制中心,2009: 4549.
[2]Cho YK, Jung Y, Lee JS, et al. Molecular evidence of HIV1 transmission in 20 Korean individuals with haemophilia: phylogenetic analysis of the vif gene[J]. Haemophilia, 2012, 18(2): 291299.
[3]SalazarGonzalez JF, Bailes E, Pham KT, et al. Deciphering human immunodeficiency virus type 1 transmission and early envelope diversification by singlegenome amplification and sequencing[J]. J Virol, 2008, 82(8): 39523970.
[4]Rieder P, Joos B, von Wyl V, et al. HIV1 transmission after cessation of early antiretroviral therapy among men having sex with men[J]. AIDS, 2010, 24(8): 11771183.
[5]Ou CY, Ciesielski CA, Myers G, et al.Molecular epidemiology of HIV transmission in a dental practice[J]. Science, 1992, 256(5060):11651171.
[6]时丽丽, 赵琦, 蒋岩, 等. 一起疑似输血传播HIV的分子流行病学研究[J]. 中华预防医学杂志, 2013, 47(5): 427430.
[7]Rutvisuttinunt W, Chinnawirotpisan P, Simasathien S, et al. Simultaneous and complete genome sequencing of influenza A and B with high coverage by Illumina MiSeq Platform[J]. J Virol Methods, 2013, 193(2): 394404.
[8]Dietz J, Schelhorn SE, Fitting D, et al. Deep Sequencing Reveals Mutagenic Effects of Ribavirin during Monotherapy of Hepatitis C Virus Genotype 1Infected Patients[J]. Journal of Virology, 2013, 87(11): 61726181.
[9]辛若雷, 冯毅, 程春林, 等. 适用于中国HIV1分型的gag基因引物及其应用[J]. 中华医学杂志, 2009, 89(13): 876880.
[10]Zhou Z, Wagar N, DeVos JR, et al. Optimization of a low cost and broadly sensitive genotyping assay for HIV1 drug resistance surveillance and monitoring in resourcelimited settings[J]. PloS One, 2011, 6(11): e28184.
[11]Leitner T, Escanilla D, Franzén C, et al. Accurate reconstruction of a known HIV1 transmission history by phylogenetic tree analysis[J]. Proc Natl Acad Sci U S A, 1996, 93(20): 1086410869.
[12]梁浩,罗皓,邵一鸣,等. 广西HIV1重组毒株env区快速基因分型方法的建立[J]. 中华实验和临床病毒学杂志,2006, 20(3): 282284. 
[13]Hedskog C, Mild M, Jernberg J, et al. Dynamics of HIV1 quasispecies during antiviral treatment dissected using ultradeep pyrosequencing[J]. PLoS One, 2010, 5(7): e11345.
[14]Metzker ML, Mindell DP, Liu XM, et al. Molecular evidence of HIV1 transmission in a criminal case[J]. Proc Nat Acad Sci U S A, 2002, 99(22): 1429214297.
[15]Boutwell CL, Rolland MM, Herbeck JT, et al. Viral evolution and escape during acute HIV1 infection[J]. J Infect Dis, 2010, 202 Suppl 2: S309314.
[16]Keele BF, Giorgi EE, SalazarGonzalez JF, et al. Identification and characterization of transmitted and early founder virus envelopes in primary HIV1 infection[J]. Proc Nat Acad Sci U S A, 2008, 105(21): 75527557.
[17]Haaland RE, Hawkins PA, SalazarGonzalez J, et al. Inflammatory genital infections mitigate a severe genetic bottleneck in heterosexual transmission of subtype A and C HIV1[J]. PLoS Pathog, 2009, 5(1): e1000274.
[18]Abrahams MR, Anderson JA, Giorgi EE, et al. Quantitating the multiplicity of infection with human immunodeficiency virus type 1 subtype C reveals a nonpoisson distribution of transmitted variants[J]. J Virol, 2009, 83(8): 35563567.
[19]Scaduto DI, Brown JM, Haaland WC, et al. Source identification in two criminal cases using phylogenetic analysis of HIV1 DNA sequences[J]. Proc Nat Acad Sci U S A, 2010, 107(50): 2124221247.