1. 毕业设计(论文)主要目标:
应用所学统计学知识,理论联系实际,对基因纵向数据进行深入分析与聚类,包括:
(1)对传统的聚类方法进行总结,并指出其处理函数型数据的困难和缺陷;
(2)介绍并比较各种函数型数据聚类方法,如K-center,P-spline等方法,重点分析理论和效率差异;
2. 毕业设计(论文)主要内容:
随着基因芯片技术的广泛应用,产生了海量的基因表达数据。聚类分析能将功能相关的基因按表达谱的相似程度归纳成功能表达类别,是目前基因表达数据分析的主要技术之一。本文首先对传统的聚类方法进行总结,指出传统方法在处理函数型数据上的困难和缺陷。然后介绍并比较各种函数型数据的聚类方法,如K-center,P-spline等方法,重点分析理论和效率差异。接着进行数据应用,选取其中一些聚类方法,如K-center,LMMS,将其运用于酵母基因表达数据中,根据模拟结果来比较不同聚类方法的差异性。最后总结几种聚类方法应用于基因表达数据的差异性能规律。
3. 主要参考文献
[1] Chiou, JM, Li, PL. Functional clustering and identifying substructures of longitudinal data [J]. Journal of Royal Statistical Society, Statistical Methodology(Series B), 2007, 69(4): 679-699.
[2] Coffey, N, Hinde, J, Holian, E. Clustering longitudinal profiles using P-splines and mixed effects models applied to time-course gene expression data [J]. Computational Statistics Data Analysis, 2014, 71: 14-29.
[3] Straube, J, Gorse, AD, PROOF Centre of Excellence Team, Huang, BE, L Cao, LA. A linear mixed model spline framework for analysing time course ‘omics’ data [J]. PLoS one, 2015, 10(8): e0134540.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。