1. 毕业设计(论文)主要内容:
下一代测序(Next Generation Sequencing,NGS)技术的发展极大地促进了基因组分析、遗传病诊断、食品安全等领域的研究。NGS数据的增长速度远远超过了存储成本降低和网络带宽增加的速度,存储和传输NGS数据面临巨大挑战。有效的NGS数据压缩技术被广泛用于解决该“大数据”问题。NGS数据格式FASTQ是基于文本的生物序列(通常是核苷酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,其目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。
对于高通量DNA测序技术发展产生的DNA测序数据量猛增,数据压缩技术是解决存储和传输高通量DNA序列数据问题的重要方法之一。针对FASTQ格式文件,目前常用的压缩工具有很多,压缩结果各有优缺点。我们研究的目标是综合考虑各种压缩工具的文件处理算法,设计更优的FASTQ文件压缩算法,并开发出高效的FASTQ文件传输工具。
2. 毕业设计(论文)主要任务及要求
设计任务:
1、 FASTQ格式文件压缩算法设计与实现;
2、 C/S架构的FASTQ文件传输工具设计与实现;
3. 毕业设计(论文)完成任务的计划与安排
2017/1/14-2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;
2017/2/23-2017/4/30:系统架构,程序设计与开发、系统测试与完善;
2017/5/1-2017/5/25:撰写及修改毕业论文;
4. 主要参考文献
[1] S. Pathak,S. Rajasekaran, LFQC: A lossless compression algorithm for FASTQ files. Bioinformatics,2015,1-6
[2] Asnani,H. et al. (2012) Lossy compression of quality values via rate distortion theory.
[3] Bonfield,J.K. and Mahoney,M.V. (2013) Compression of Fastq and sam format sequencing data. PLoS One, 8, e59190.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。