FASTQ格式文件压缩研究任务书

 2021-08-23 20:57:50

1. 毕业设计(论文)主要内容:

下一代测序(Next Generation Sequencing,NGS)技术的发展极大地促进了基因组分析、遗传病诊断、食品安全等领域的研究。NGS数据的增长速度远远超过了存储成本降低和网络带宽增加的速度,存储和传输NGS数据面临巨大挑战。有效的NGS数据压缩技术被广泛用于解决该“大数据”问题。NGS数据格式FASTQ是基于文本的生物序列(通常是核苷酸序列)和其测序质量信息的标准格式。其序列以及质量信息都是使用一个ASCII字符标示,最初由Sanger开发,其目的是将FASTA序列与质量数据放到一起,目前已经成为高通量测序结果的事实标准。

对于高通量DNA测序技术发展产生的DNA测序数据量猛增,数据压缩技术是解决存储和传输高通量DNA序列数据问题的重要方法之一。针对FASTQ格式文件,目前常用的压缩工具有很多,压缩结果各有优缺点。我们研究的目标是综合考虑各种压缩工具的文件处理算法,设计更优的FASTQ文件压缩算法,并开发出高效的FASTQ文件传输工具。

2. 毕业设计(论文)主要任务及要求

设计任务:

1、 FASTQ格式文件压缩算法设计与实现;

2、 C/S架构的FASTQ文件传输工具设计与实现;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

3. 毕业设计(论文)完成任务的计划与安排

2017/1/14-2017/2/22:确定选题,查阅文献,外文翻译和撰写开题报告;

2017/2/23-2017/4/30:系统架构,程序设计与开发、系统测试与完善;

2017/5/1-2017/5/25:撰写及修改毕业论文;

剩余内容已隐藏,您需要先支付后才能查看该篇文章全部内容!

4. 主要参考文献

[1] S. Pathak,S. Rajasekaran, LFQC: A lossless compression algorithm for FASTQ files. Bioinformatics,2015,1-6

[2] Asnani,H. et al. (2012) Lossy compression of quality values via rate distortion theory.

[3] Bonfield,J.K. and Mahoney,M.V. (2013) Compression of Fastq and sam format sequencing data. PLoS One, 8, e59190.

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。