超高维数据统计模型变量筛选方法 内容简介
随着现代科技的高速发展,海量数据随处可见,特别是生物工程、航空航天、人工智能以及电子商务等方面。海量数据的特点是维数较大,数据的维数以样本的指数阶增加即所谓的超高维数据。本书研究内容包括:(1)对于超高维数据分位数回归变系数模型,利用样条近似方法提出了排列边际回归系数的变量筛选方法;(2)使用经验似然方法研究了可加模型的变量筛选问题;(3)利用核回归方法估计条件期望损失研究了非参回归模型的变量筛选问题,提出一般模型的变量选择方法;(4)在广义线性模型框架下,探讨了顺序Lasso变量选择问题,提出了顺序Lasso迭代选择方法;(5)对于超高维数据, 抢先发售研究了GINI相关系数变量选择问题,所提到方法不受异常值点的影响,具有很好的稳健性,为超高维数据提供了一个简单、稳健和有效的变量选择方法。
|