个人理财 如何准备预测分析的R回归中的数据 - 虚拟变量

如何准备预测分析的R回归中的数据 - 虚拟变量

视频: 15年深度学习资深工程师: 如何通过深度学习(Deep Learning),预测美股? 2025

视频: 15年深度学习资深工程师: 如何通过深度学习(Deep Learning),预测美股? 2025
Anonim

您必须将数据转换为算法可用于构建预测分析模型的表单。要做到这一点,你必须花一些时间来了解数据和了解数据的结构。输入函数来查找数据的结构。该命令及其输出如下所示: >> str(autos)'data。框架“:398 obs。 9个变量:$ V1:num 18 15 18 16 17 15 14 14 14 15 … $ V2:int 8 8 8 8 8 8 8 8 8 … $ V3:num 307 350 318 304 302 429 454 440 455 390 … $ V4:chr“130. 0”“165.0”“150. 0”“150. 0”… $ V5:num 3504 3693 3436 3433 3449 … $ V6:num 12 11. 5 11 12 10. 5 10 9 8 5 10 8. 5 … $ V7:诠释70 70 70 70 70 70 70 70 70 70 … $ V8:诠释1 1 1 1 1 1 1 1 1 1 … $ V9:因子w / 305水平“amc ambassador brougham” ,…:

50 37 232 15 162 142 55 224 242 2 … 

通过查看结构,可以看出有一些数据准备和清理工作要做。以下是所需任务的列表:

<! --1 - >

重命名列名称。
  • 这不是严格必要的,但对于这个例子来说,最好使用你能理解和记住的列名。

    将V4(

  • horsepower )的数据类型更改为 数字 数据类型。 在这个例子中,马力是连续的数值,而不是字符数据类型。

    处理缺失的值。

  • 这里马力有六个缺失值。

    将具有离散值的属性更改为因子。在这里,气缸,型号年份和原点具有离散值。

  • 放弃V9(

    车名

  • )属性。 汽车名称不会增加您创建的模型的价值。如果没有给出origin属性,则可以从car name属性派生出原点。 <!

    colnames(autos)< -

    c(“mpg”,“cylinders”,“displacement”,“horsepower”, “weight”,“acceleration”,“modelYear”,“origin”,

“carName”)

接下来,用以下代码将数据类型的马力改为数字: >> autos $ horsepower <如。数字(汽车$马力)

该程序将抱怨,因为不是所有的马力值是字符串表示的数字。有一些缺失的价值观被表示为“? “性格。现在很好,因为R转换每个实例?进入NA。

处理连续变量缺失值的常用方法是用整个列的平均值替换每个缺失值。下面这行代码就是这样的: >> autos $ horsepower [is。na(汽车$马力)] < - 平均值(汽车$马力,na。rm = TRUE)

有na的重要。 rm-TRUE在平均函数中。它告诉函数不要在其计算中使用空值的列。没有它,函数将返回。

接下来,将离散值的属性更改为因子。三个属性被确定为离散的。以下三行代码更改属性。 >> autos $ origin autos $ modelYear autos $ cylinders < - factor(autos $ cylinders)

最后,用这行代码从数据框中删除属性: >> autos $ carName < - nULL < 此时,您已完成建模过程的数据准备。以下是数据准备过程之后的结构视图: >> str(autos)'data。框架“:398 obs。 8个变量:$ mpg:num 18 15 18 16 17 15 14 14 14 15 … $ cylinder:因子w / 5级别“3”,“4”,“5”,“6”,…:

5 5 5 5 5 5 5 5 5 5 … $排水量:数量307 350 318 304 302 429 454 440 455 390 … $马力:数量130 165 150 150 140 198 220 215 225 190 … $重量:数量3504 3693 3436 3433 3449 … $加速度:数字12 11. 5 11 12 10. 5 10 9 8. 5 10 8. 5 … $ modelYear:具有13个等级“70”,“71”,“72”,…:

的因子1 1 1 1 1 1 1 1 1 1 … $原点:因子w / 3级别“1”,“2”,“3”:

1 1 1 1 1 1 1 1 1 1 …

如何准备预测分析的R回归中的数据 - 虚拟变量

编辑的选择

如何在Dreamweaver中创建HTML站点地图 - 虚拟人物

如何在Dreamweaver中创建HTML站点地图 - 虚拟人物

创建视觉站点地图,您可以创建网站上所有页面的图表,包括通过导航和子导航的主要页面的互联性。然后,您可以使用这些信息来帮助收集和定义网站内容,并在生成模型时用作指导。

如何创建一个单一的图像CSS3背景 - 傻瓜

如何创建一个单一的图像CSS3背景 - 傻瓜

最简单,最兼容的方式创建一个CSS3的背景,至少有一点点漂亮是使用单个图像。正确的图像说了很多关于您的网站,并提供页面之间的连续性。因为这种方法是标准的,所以你会看到它在很多网站上使用。所有你真正需要的...

如何在CSS3中创建可排序接口 - 傻瓜

如何在CSS3中创建可排序接口 - 傻瓜

电脑要做的,你想要你的CSS3编码来创造这种情况。例如,一台计算机可以按字母顺序将项目比人类可以更快,特别是当列表很长时。但是,排序并不总是合乎逻辑的。您可能希望用户排序...

编辑的选择

尼康D5000数码相机布局 - 傻瓜

尼康D5000数码相机布局 - 傻瓜

这里是一个方便的指针,拨号,按钮和其他外部控制尼康D5000上。 (此数码相机上显示的镜头是与D5000套件一起出售的Nikkor 18-55mm AF-S VR(减震)型号;其他镜头可能不同,标有星号的相机控制具有多种功能。 ...

GoPro相机可以做什么? - 傻瓜

GoPro相机可以做什么? - 傻瓜

GoPro相机可以做什么?这里有一个更相关的问题:你想要做什么?提出这个问题更像是问自己关于自己的愿望和渴望的独特的录像。当你确定你想要捕捉什么时,你所要做的就是将相机连接到...

使用现有的电影为您的GoPro电影 - 傻瓜

使用现有的电影为您的GoPro电影 - 傻瓜

如果你不想创建你自己的GoPro电影照明,你可以尝试使用现有的灯光。以下是在电影中使用可用光源的一些提示。使用白炽灯泡可以使用白炽灯泡来点亮你的电影,但是它们的效果取决于...

编辑的选择

中创建新图像如何在Photoshop CS6中创建新图像 - 傻瓜

中创建新图像如何在Photoshop CS6中创建新图像 - 傻瓜

在Photoshop CS6中从头开始创建一个新的图像。请按照以下步骤使用“新建”功能创建新图像:选择“文件”→“新建”。或者按Ctrl + N(Mac上的Command + N)。输入新文件的名称。如果您不指定名称,Photoshop会为您创建一个名称。 ...

如何在Photoshop CS6中创建新图层 - 虚拟人物

如何在Photoshop CS6中创建新图层 - 虚拟人物

有多种方法可以使用和创建Adobe Photoshop Creative Suite 6中的图层。这些不同的技术可以让您根据您的需求量身定制流程。在打开的图像中创建新的空白图层:单击“图层”面板底部的“创建新图层”图标。您也可以...

如何在Photoshop CS6中创建云 - 虚拟人物

如何在Photoshop CS6中创建云 - 虚拟人物

Photoshop CS6中的云过滤器可以鼓起一片满天的只需点击鼠标即可从头开始。此过滤器使用来自前景和背景颜色的随机值创建云。事实上,大多数Photoshop老手使用这个过滤器太多,他们的图像中有一个惊人的云数量。 ...