1. 毕业设计(论文)主要目标:
近年来,随着科技的迅速发展,越来越多的海量数据出现在人们的身边,而如何处理这些数据,使得我们能从这些数据中快速有效的找到有用的信息是目前研究的重点。然而传统的统计方法对于超高维的数据来说已不适用,本文将在已有的超高维特征筛选方法的基础上提出一种新的解决超高维数据特征筛选的方法:似然比卡方统计特征筛选方法(LR-SIS)。本次论文有以下几个目标:
1.提出LR-SIS方法,对其构成与思想做详细介绍,同时证明其理论性质;
2.通过论文的撰写,能够有效的查找、翻译、利用国内外有用的文献,学会正确地概括问题、分析问题和解决问题。
2. 毕业设计(论文)主要内容:
随着网络与通信技术的飞速发展,人们在实际生活工作过程中通常会遇到各种海量数据问题,这些大型数据除了复杂无结构之外,另一重要的特点是维数较高,这种数据通常被称为高维数据。面对这样一个庞大的数据库,如何从中快速、有效地找寻到有价值的信息,是现代统计学的一大挑战。为了解决“维数灾难”问题,本文想要提出新的解决超高维特征筛选的方法。本文拟分为4个部分研究新的方法:
1.针对目前超高维数据特征筛选的现状,总结已有的超高维特征筛选方法,并详细介绍卡方统计特征筛选方法(PC-SIS),针对PC-SIS方法的缺陷提出一种新的超高维数据特征筛选方法似然比卡方统计特征筛选方法(LR-SIS);
2.讨论LR-SIS方法的理论特性,尤其对于Fan和Lv在2008年提出的确定性筛选性质,本文将证明LR-SIS方法具有确定性筛选性质;
3. 主要参考文献
1.Huang Danyang,Li Runze and Wang Hansheng. Feature Screening for Ultrahigh Dimensional Categorical Data With Applications. Journal of Business Economic Statistics. 2014, Vol.32, No.2, 237-244.
2.Ni Lyu and Fang Fang . Entropy-based model-free feature screening for ultrahigh-dimensional multiclass classification .Journal of Nonparametric Statistics ,2016
3.Wang,H. Forward Regression for Ultra-High Dimensional Variable Screening.Journal of the American Statistical Association.2009,104,1512-15244.Fan,J., Feng,Y. and Song,R. Nonparametric independence screening in space ultra-high-dimensional additive models. J.Am.Statist.Assoc.2011,106,544-57.
以上是毕业论文任务书,课题毕业论文、开题报告、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。