海量植物基因组测序数据提取细胞器全基因组方法研究任务书

 2022-02-22 19:33:42

1. 1. 毕业设计(论文)的内容、要求、设计方案、规划等

随着生物信息学的迅速发展,越来越多的实验数据需要利用计算机去处理分析。在高等植物细胞内除了起主要遗传作用的细胞核染色体携带遗传信息外,还有两个具有半自主遗传体系的细胞器-线粒体和叶绿体携带相关的遗传信息,并且这些叶绿体或者线粒体基因组具有很多特性,使其在系统发育研究中引用广泛。本软件将基因组测序获得的454数据通过组装获得较大的contig序列,通过从newbler的组装结果 (主要是454ContigGraph.txt)判断contig之间的连接关系最终得到较为完整的细胞器(主要是线粒体、叶绿体)基因组,为下一步研究基因之间的相对关系,植物之间的进化关系以及与系统发育研究等相关的课题的提供重要的信息资源。主要功能: 完整的细胞器基因组序列(叶绿体和线粒体)对于植物生态与进化研究提供了大量有价值的信息资源。随着高通量测序技术的进步,鸟枪法已成为获取完整基因序列的通用方式,同样在细胞器基因组装配中必不可少。然而,目前由于许多细胞核DNA与细胞器DNA相关数据的混合加之细胞器基因组装配技术存在冗杂、耗时等缺点,细胞器基因组装配效率普遍低下。本软件是一款高效快速的从植物混合测序的数据中(核基因组、线粒体基因组、叶绿体基因组DNA混合测序的数据)组装出细胞器(叶绿体、线粒体)的基因组装配软件。组装出的叶绿体基因组大小一般几十kb到一百多kb,线粒体基因组大小一般几百kb。技术特点:首先从植物混合测序的454数据(reads)(核基因组、线粒体基因组、叶绿体基因组DNA混合测序的数据)使用newbler装配获得contig数据。利用已经测序的细胞器基因组作为reference,从454数据中挑选出与该细胞器相关的contig进行组装。开始选出一个contig作为seed,然后用bb.454contignet这个脚本,从newbler组装的结果中(主要是454ContigGraph.txt)找出与seed相连的contig,然后将那些与原始seed相连的contig进一步作为seed,递归地找下去。由于每个细胞中核基因组、叶绿体基因组、线粒体基因组的拷贝数各不相同,基于454reads组装(使用newbler进行组装)得到的contig覆盖度也各不相同。该方法的优势在于可以利用覆盖度信息对来自核基因组、叶绿体基因组、线粒体基因组进行大致区分,然后去掉明显属于核基因组上的contig分支,以及其他从覆盖度上能明显区分不属于该细胞器基因组的分支,经过几轮不断修正得到完整的线粒体contig连接图。

开学前2周,完成植物基因测序系统的安装,以及模拟器的操作,并借阅相关数据挖掘书籍,和指定参考文献的阅读工作。 第3周到第8周,完成基因组测序数据的分析与数据挖掘。 第9周到第12周,开始撰写论文,并经常与指导教师联系,进行论文的排版和描述修改。 第13周到第15周,准备PPT与预答辩工作,做好答辩准备。

2. 参考文献(不低于12篇)

1.刘振波, DNA测序技术比较. 生物学通报, 2012. 47(7): p. 14-17.

2.孙明辉, 基于第二代测序技术的小片段组装系统[硕]. 2011, 吉林大学.

3.孙晓斐, 基因组序列de novo拼接系统的设计与实现[硕]. 2014, 哈尔滨工业大学.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。