您好,欢迎来到佳博论文网!

利用Ion Torren测序平台和生物信息学分析几株细菌和病毒基因组

论文摘要

病毒,一种特殊的生命体,具有严格的活细胞寄生的生存方式,可寄生在人、动植物、昆虫、真菌和细菌等细胞中而引起感染。75%的人类传染病由病毒引起。病毒的一个增殖周期包括:通过识别宿主细胞表面受体而进入宿主或将遗传物质注入宿主(噬菌体)、以自身核酸为模板合成子代遗传物质,子代蛋白的转录、子代病毒颗粒的包装、从宿主体内释放、新的宿主细胞的再感染。噬菌体,作为细菌病毒,其复制周期与病毒类似。dsDNA噬菌体基因组利用末端重复序列进行环化,从而通过滚环复制方式(rolling circle replication)复制出许多多联体DNA(concatemeric DNA),以该DNA为底物,包装酶对其进行识别和切割,进而产生子代基因组DNA,包装进头部蛋白(prohead),最终得到子代病毒颗粒。在这个过程中,复制和组装对噬菌体和病毒至关重要。因此,该过程的研究对病毒学的发展具有关键作用。复制和组装与病毒基因组的末端序列密切相关,复制过程需要通过末端进行环化,从而起始复制,包装通过切割产生子代DNA的末端,从而决定下一代的复制,因此,对病毒基因组末端的研究至关重要。而传统的末端研究方法需大量人力和时间,且易丢失细节。因此,迫切需要寻找一种通量高、准确度高及快速的末端分析方法。虹彩病毒(iridovirus),双链环状DNA病毒,属于虹彩病毒科。被其感染的个体在受到斜射光照射时,会呈现出紫色或者蓝色的彩虹,而得名。属于虹彩病毒科的虹彩病毒属和绿虹彩病毒属为无脊椎动物虹彩病毒IIVs,主要感染昆虫。IIVs对昆虫可导致亚致死以及诱导细胞凋亡。同时,其也可用于杀虫剂。目前,对该病毒的功能及其与宿主的相互作用等研究较少;其次, Genbank上只有4珠IIVs的全基因组序列,因此,迫切需要对更多IIVs进行全基因测序,从而为该病毒科的遗传研究及各方面的功能研究提供指导。炭疽杆菌,是全球传播的严重的人畜共患病――炭疽病的病原体。同时,也是恐怖主义和生物武器的病原体。1993年日本炭疽杆菌气溶胶袭击事件和2001年美国炭疽杆菌信件事件,都为快速准确的分型方法的产生提供了挑战。需要一种分型方法来区分一次疫情是由炭疽杆菌的自然爆发或是恐怖主义对微生物的故意释放,从而对不同紧急事件进行不同的处理。然而,炭疽杆菌具有非常高的种间基因组同源性,以及非常低的多样性,即使经历了20至40代的“感染-死亡-感染”循环后,其基因组的遗传组成几乎保持不变,因此分型非常困难。目前具有两种有效的分型方法,单碱基多态性(SNP:single nucleotidepolymorphism)和多位点可变数目串联重复序列分析(MLVA:multiple locusvariable number tandem repeat analysis),这两种方法具有较高的分辨率,大大的增强了炭疽杆菌株间的辨别。但SNP具有偏向性(bias)且在很接近的株间存在较少,MLVA方法分析结果不稳定,不同的实验室得到结果具有较大差异,因此,迫切需要寻找一种分辨率更高,更准备的炭疽分型方法以及炭疽溯源方法,来处理炭疽引起的严重的事件如传染病和恐怖事件。摩氏摩根菌为革兰氏阴性厌氧菌,是肠杆菌科摩根菌属唯一菌种,可对多种β-内酰胺类型的抗生素呈现固有耐药,是可引起严重感染的条件致病菌,常引起院内感染,包括泌尿道感染和术后感染及多种炎症。国内外报道该菌感染的发病率逐年增多。其已经成为医院里获得性感染的常见致病菌之一。高通量测序技术(HTS,high-throughput sequencing)具有通量高、准确性高、快速等特点,且成本越来越低。因此,已经被广泛运用到了生物研究的各个领域,例如,对有参考序列的物种的重测序(resequencing)、对无参考序列的基因组的从头测序、为探测未知病毒对特定长度的小RNA的测序、为探测基因的表达量对转录组进行测序。目前主流高通量测序平台包括Illumina的Miseq和Hiseq2000、Roche454及Life technology的Ion Torrent。Illumina公司的测序仪准确度高,通量大,因而被使用最多,但其运行时间较长、读长较短。454虽具有较长读长,但成本却很高。Ion Torrent测序平台具有速度快和成本低的特点,可被用来对病毒和细菌进行全基因组测序。我们通过对噬菌体和病毒基因组高通量测序结果的分析,确定了测序结果中存在的高频序列(HFS)是病毒基因组末端序列。采用本实验室建立的生物信息学分析方法,我们利用HFS数据:i)可以同时获得病毒全基因组和末端序列;ii)建立了一个判定每个病毒基因组末端类型和包装机制的标准;iii)鉴定额外的关于病毒基因组末端序列的细节特征,如末端重复、次要末端及多个末端等;iv)T4类噬菌体的基因组被末端酶切割时是以一种序列倾向性的方法进行而非完全随机,修正了之前的相关报道;v)N4类噬菌体具有独特的末端特征,即左侧均一,右侧具有2组不同的异质性末端。利用这个技术,我们首次鉴定出了金黄色葡萄球菌噬菌体基因组左侧末端均一,而右侧末端随机的特性。另外,我们也提出了病毒基因组重复序列长度的计算公式。我们的结果简化了传统末端分析的流程。理论上,这个方法可进一步用到植物和动物病毒基因组末端研究,以及其他小的基因组。本文第一章的研究展示了一个快捷的、有效的末端分析方法,这将为病毒复制、包装、末端酶功能、转录调控以及宿主和病毒代谢的研究提供有力支持。虹彩病毒AMIV分离自2012年从云南收集的蚊子研磨匀浆。将匀浆加入C3/36细胞系进行培养,并观察细胞病变CPE,盲传三代后仍能观察到CPE,因而确定为阳性分离结果。而后进行扩大培养,浓缩和纯化后提取基因组,进行shotgun和matepair高通量测序,通过生物信息学分析,i)获得全基因组序列;ii)经BLAST分析鉴定为虹彩病毒;iii)经过比较基因组分析,发现其与已知的虹彩病毒序列非常不同;iv)经过分子进化分析发现其为新的虹彩病毒基因型;v)利用透射电镜发现其为标准的二十面体结构,具有直径为180nm的蛋白外壳,为有包膜病毒,vi)利用荧光显微镜获得了详细的CPE过程,即9小时便可致细胞病变,36小时可让全部细胞裂解,提示该病毒可作为病虫害的杀虫剂,vii)通过生物信息学分析发现AMIV基因组上,存在末端冗余序列(TR),约基因组的10%,TR序列保证了每个病毒颗粒从亲代DNA那儿至少获得一个拷贝的每个基因,在进化上具有优势,viii)对AMIV快速复制机制进行分析,发现了保守的与宿主DNA复制或转录有关的bro-like基因,且具有12个拷贝,文献报道具有快速复制能力的囊泡病毒具有多个拷贝的bro-like基因,因此这提示其可能与AMIV快速复制相关;另外,通过对AMIV基因组进行功能注释,一共发现54个功能已知的基因,这其中与复制相关的基因就有20个,约占功能已知基因的40%,这保证基DNA复制高效进行,这可能是该病毒快速复制的另一个原因。2012年8月,辽宁省爆发了炭疽疫情,该疫情致7人和上百头牛感染,一株从死牛身上分离到的毒株han和当地所用疫苗株vac,动物实验结果显示,二者对小鼠毒性都很低,因此有人怀疑本次疫情是由炭疽疫苗株引起。为验证该假设,我们对两株炭疽杆菌进行了高通量测序。利用高通量测序,我们对这两株细菌进行了关键位点SNP(canonical SNP)分型,结果显示,毒株han和疫苗株vac是完全不同的两株细菌。利用MLVA分型发现han株与已报道的中国本土株聚为一类,但同时,又具有其独自的进化分支,故为一株新发的中国本土株。另外,我们还提出了具有比传统分型方法更高分辨率的基于序列的MLVA(sequence-based MLVA)分型方法,利用该方法验证了han株为自然爆发株而非恐怖分子所为。最后,本研究还对与han株一起分离得到的摩氏摩根菌Mm进行了全基因组测序,结合shotgun和mate-pair测序,经从头(De Novo)组装,最终获得了Mm的全基因组序列,成为NCBI上第二株摩氏摩根菌的全基因组序列,也是来自中国大陆的第一株摩氏摩根菌全基因组序列。另外,还对该菌全基因组进行了功能注释,最终找到了432个与病原相关的基因,为该菌株致病机制等的研究奠定了基础。