R语言前向逐步回归详解R语言实现前向逐步回归(前向选择模型)

gaomeihong1993 2021-08-11 我要评论

想了解详解R语言实现前向逐步回归(前向选择模型)的相关内容吗，gaomeihong1993在本文为您仔细讲解R语言前向逐步回归的相关知识和一些Code实例，欢迎阅读和指正，我们先划重点：R语言,前向逐步回归,R语言,前向选择模型，下面大家一起来学习吧。

前向逐步回归原理

前向逐步回归的过程是：遍历属性的一列子集，选择使模型效果最好的那一列属性。接着寻找与其组合效果最好的第二列属性，而不是遍历所有的两列子集。以此类推，每次遍历时，子集都包含上一次遍历得到的最优子集。这样，每次遍历都会选择一个新的属性添加到特征集合中，直至特征集合中特征个数不能再增加。

导入数据，将数据集抽取70%作为训练集，剩下30%作为测试集。特征与标签分开存放。

R语言的实现如下图：

在这里插入图片描述

train和test中存储的数据情况如下：

在这里插入图片描述

R语言的实现如下图：

在这里插入图片描述

通过for循环，从属性的一个子集开始进行遍历。第一次遍历时，该子集为空。每一个属性被加入子集后，通过线性回归来拟合模型，并计算在测试集上的误差，每次遍历选择得到误差最小的一列加入输出特征集合中。最终得到输出特征集合的关联索引和属性名称。

R语言的实现如下图：

在这里插入图片描述

分别画出RMSE与属性个数之间的关系，前向逐步预测算法对数据预测对错误直方图，和真实标签与预测标签散点图。R实现如下：

在这里插入图片描述