如何准备预测分析的R回归中的数据 - 虚拟变量

视频: 15年深度学习资深工程师：如何通过深度学习（Deep Learning)，预测美股？ 2025

您必须将数据转换为算法可用于构建预测分析模型的表单。要做到这一点，你必须花一些时间来了解数据和了解数据的结构。输入函数来查找数据的结构。该命令及其输出如下所示： >> str（autos）'data。框架“：398 obs。 9个变量：$ V1：num 18 15 18 16 17 15 14 14 14 15 … $ V2：int 8 8 8 8 8 8 8 8 8 … $ V3：num 307 350 318 304 302 429 454 440 455 390 … $ V4：chr“130. 0”“165.0”“150. 0”“150. 0”… $ V5：num 3504 3693 3436 3433 3449 … $ V6：num 12 11. 5 11 12 10. 5 10 9 8 5 10 8. 5 … $ V7：诠释70 70 70 70 70 70 70 70 70 70 … $ V8：诠释1 1 1 1 1 1 1 1 1 1 … $ V9：因子w / 305水平“amc ambassador brougham” ，…：

50 37 232 15 162 142 55 224 242 2 …

通过查看结构，可以看出有一些数据准备和清理工作要做。以下是所需任务的列表：

<！ --1 - >

重命名列名称。

这不是严格必要的，但对于这个例子来说，最好使用你能理解和记住的列名。

将V4（
horsepower ）的数据类型更改为数字数据类型。 在这个例子中，马力是连续的数值，而不是字符数据类型。

处理缺失的值。
这里马力有六个缺失值。
将具有离散值的属性更改为因子。在这里，气缸，型号年份和原点具有离散值。
放弃V9（

车名
）属性。 汽车名称不会增加您创建的模型的价值。如果没有给出origin属性，则可以从car name属性派生出原点。 <！

colnames（autos）< -
c（“mpg”，“cylinders”，“displacement”，“horsepower”， “weight”，“acceleration”，“modelYear”，“origin”，

“carName”）

接下来，用以下代码将数据类型的马力改为数字： >> autos $ horsepower <如。数字（汽车$马力）

该程序将抱怨，因为不是所有的马力值是字符串表示的数字。有一些缺失的价值观被表示为“？ “性格。现在很好，因为R转换每个实例？进入NA。

处理连续变量缺失值的常用方法是用整个列的平均值替换每个缺失值。下面这行代码就是这样的： >> autos $ horsepower [is。na（汽车$马力）] < - 平均值（汽车$马力，na。rm = TRUE）

有na的重要。 rm-TRUE在平均函数中。它告诉函数不要在其计算中使用空值的列。没有它，函数将返回。

接下来，将离散值的属性更改为因子。三个属性被确定为离散的。以下三行代码更改属性。 >> autos $ origin autos $ modelYear autos $ cylinders < - factor（autos $ cylinders）

最后，用这行代码从数据框中删除属性： >> autos $ carName < - nULL < 此时，您已完成建模过程的数据准备。以下是数据准备过程之后的结构视图： >> str（autos）'data。框架“：398 obs。 8个变量：$ mpg：num 18 15 18 16 17 15 14 14 14 15 … $ cylinder：因子w / 5级别“3”，“4”，“5”，“6”，…：

5 5 5 5 5 5 5 5 5 5 … $排水量：数量307 350 318 304 302 429 454 440 455 390 … $马力：数量130 165 150 150 140 198 220 215 225 190 … $重量：数量3504 3693 3436 3433 3449 … $加速度：数字12 11. 5 11 12 10. 5 10 9 8. 5 10 8. 5 … $ modelYear：具有13个等级“70”，“71”，“72”，…：

的因子1 1 1 1 1 1 1 1 1 1 … $原点：因子w / 3级别“1”，“2”，“3”：

1 1 1 1 1 1 1 1 1 1 …

如何准备预测分析的R回归中的数据 - 虚拟变量

视频: 15年深度学习资深工程师：如何通过深度学习（Deep Learning)，预测美股？ 2025

编辑的选择

如何在Dreamweaver中创建HTML站点地图 - 虚拟人物

如何创建一个单一的图像CSS3背景 - 傻瓜

如何在CSS3中创建可排序接口 - 傻瓜

编辑的选择

尼康D5000数码相机布局 - 傻瓜

GoPro相机可以做什么？ - 傻瓜

使用现有的电影为您的GoPro电影 - 傻瓜

编辑的选择

中创建新图像如何在Photoshop CS6中创建新图像 - 傻瓜

如何在Photoshop CS6中创建新图层 - 虚拟人物

如何在Photoshop CS6中创建云 - 虚拟人物

编辑的选择

如何自定义Adobe Illustrator制作信息图形 - 傻瓜

如何在Tableau中创建计算字段 - 虚拟人物

如何在将工作簿发布到工作簿之后编辑对发布的Tableau工作簿的访问权限 - 傻瓜

如何在Tableau中编辑数据源 - 傻瓜

编辑的选择

如何安装LinkedIn Outlook工具栏 - 傻瓜

如何管理LinkedIn收到的推荐信 - 傻瓜

如何加入LinkedIn群组 - 虚拟人群

如何通过LinkedIn推广您的业务

热门类别

视频: 15年深度学习资深工程师： 如何通过深度学习（Deep Learning)，预测美股？ 2025

编辑的选择

编辑的选择

编辑的选择

编辑的选择

编辑的选择

热门类别

视频: 15年深度学习资深工程师：如何通过深度学习（Deep Learning)，预测美股？ 2025