个人理财 如何在SVM监督式学习模型中运行训练数据 - 假人

如何在SVM监督式学习模型中运行训练数据 - 假人

Anonim

在将支持向量机(SVM)分类器加载到预测分析的加载数据之前,您必须将完整的数据集分成一个训练集,测试集。

幸运的是,scikit-learn已经实现了一个函数,可以帮助您轻松地分割整个数据集。 train_test_split函数将一个数据集和一个百分比值作为输入。百分比值用于确定测试集的大小。该函数返回两个数据集:测试数据集(具有指定的大小)和训练数据集(使用其余数据)。

<! - 1 - >

通常,可以将大约70-80%的数据用作训练集,并将剩余的数据用作测试集。但Iris数据集非常小(只有150个实例),因此您可以将90%的数据集用于训练模型,并使用另外10%的数据作为测试数据,以查看您的预测模型将如何执行。

键入以下代码拆分数据集: >>>> from sklearn import cross_validation >>> X_train,X_test,y_train,y_test = cross_validation。 train_test_split(iris.data,iris.target,test_size = 0。10,random_state = 111)第一行将交叉验证库导入到会话中。第二行从样本的10%创建测试集。

<! - 2 - >

x_train将包含135个观察值及其特征。 y_train将包含135个与135个观察值相同顺序的标签。

x_test将包含15个(或10%)观察值及其特征。

y_test将包含15个标签,其顺序与15个观察值相同。

以下代码验证分割是您所期望的:

>>>> X_train。形状(135,4)>>> y_train。形状(135,)>>> X_test。形状(15,4)>>> y_test。形状(15,)

从输出可以看到,在训练集中有135个观察值,其中有4个特征和135个标签。该测试集有15个观察点,具有4个特征和15个标签。

预测分析领域的许多初学者忘记分割数据集 - 这给项目带来了严重的设计缺陷。如果全部150个实例作为训练数据加载到机器中,那么将不会留下用于测试模型的不可见数据。那么你不得不重新使用一些训练实例来测试预测模型。你会发现,在这种情况下,模型总是预测正确的类 - 因为你使用的是与训练模型相同的精确数据。模型之前已经看到了这种模式;只要重复看到的内容就没有问题了。一个工作的预测模型需要预测尚未发现的数据。

当有一个SVM分类器,一个训练数据集和一个测试数据集的实例时,就可以用训练数据训练模型了。在解释器中键入以下代码将完成: >>>> svmClassifier。 fit(X_train,y_train)
这行代码创建一个工作模型来进行预测。具体来说,一个预测模型将预测什么类别的虹膜新的未标记的数据集属于。 svmClassifier实例将有几个方法可以调用来做各种事情。

例如,在调用fit方法之后,调用最有用的方法是预测方法。这就是您要提供新数据的方法;作为回报,它预测结果。

如何在SVM监督式学习模型中运行训练数据 - 假人

编辑的选择

在Flash中使用活动文本 - 虚拟人物

在Flash中使用活动文本 - 虚拟人物

静态文本完成工作,为您提供信息网站访问者。但是Flash可以用文本来做更多的事情。有时候,你不希望自己的文本是文本,而是喜欢一堆可以弯曲,扭曲,移动,或者不能混合的独立字母形状。 Flash的分离命令...

移动网站质量保证测试 - 傻瓜

移动网站质量保证测试 - 傻瓜

在为IPhone推出新网站之前, iPad,始终在iPhone或iPad上全面测试其设计和功能,确保网站的外观和工作方式与您的想法完全相同。使用模拟器不能替代完成物理设备上的最终检查表。 As ...

QuarkXPress 5基本任务的快捷方式 - 虚拟人物

QuarkXPress 5基本任务的快捷方式 - 虚拟人物

QuarkXPress 5具有数吨和数吨的快捷方式。你大概不会记住他们中的大多数,但是你一定会发现自己一直在使用一两个。这里有一些有用的视图,调色板和对象选择任务的快捷键。 QuarkXPress查看快捷方式操作Mac Windows 100%命令+ 1 Ctrl + 1在窗口中装入Command + 0 Ctrl + 0 200%...

编辑的选择

如何将尼康D5300照片下载到计算机 - 傻瓜

如何将尼康D5300照片下载到计算机 - 傻瓜

你的尼康D5300,你可能会想用他们的照片编辑软件。您可以用两种方法将照相机中的照片和电影文件移到电脑上:通过USB电缆将照相机连接到电脑。您需要的电缆是随附的。

如何在播放期间放大尼康D7100照片 - 虚拟人物

如何在播放期间放大尼康D7100照片 - 虚拟人物

您的尼康D7100,如左图所示,您可以放大它,如右图所示。但是,您只能放大静止照片。此功能不适用于电影。以下是如何使用放大功能:放大。按Qual按钮。您可以...

如何在尼康D7100上播放时隐藏照片 - 虚拟人物

如何在尼康D7100上播放时隐藏照片 - 虚拟人物

可以使用隐藏图像选项在尼康D7100的播放菜单上隐藏一些照片,同时在播放过程中显示其他照片。假设你拍了100张照片--50次在商务会议上,50次在野外会议后。您想向您的老板展示您和您的同事的照片...

编辑的选择

IBS受害者如何制作草莓和奶油燕麦 - 假人

IBS受害者如何制作草莓和奶油燕麦 - 假人

您可以享用燕麦片如果你患有IBS。当快燕麦烹饪时,切碎草莓和香蕉(IBS主食),并从冰箱中取出椰奶。一旦这样做,燕麦片通常是准备倒。你可以添加不同的水果,甚至坚果作为你的...

如何为IBS患者制作绿鸡蛋烘焙者 - 假人

如何为IBS患者制作绿鸡蛋烘焙者 - 假人

使用自由放养的鸡,因为它们是谷物喂养,没有生长激素和抗生素,因此,IBS的肚子更健康。用任何鸡肉菜肴,一定要煮好你使用的任何一种鸡肉。当你对这道菜更加熟悉的时候,你可能会发现你并不需要...