个人理财 如何以非结构化文件格式发送数据

如何以非结构化文件格式发送数据

视频: Microsoft Azure OpenDev—June 2017 2025

视频: Microsoft Azure OpenDev—June 2017 2025
Anonim

非结构化数据文件由一系列位组成。该文件不会以任何方式将这些位彼此分开。你不能简单地查看文件,看到任何结构,因为没有任何可见的东西。非结构化文件格式依靠文件用户来了解如何解释数据。例如,图像文件的每个像素可以由三个32位字段组成。知道每个字段是32位是由你决定的。文件开始处的标题可能会提供关于解释文件的线索,但即使如此,您也需要知道如何与文件进行交互。

<! - 1 - >

这个例子展示了如何将图片作为非结构化文件进行处理。示例图像是来自公共领域的公共领域。维基媒体。有机要处理图像,您需要访问scikit-image库,这是用于图像处理的免费算法集合。这是一个这个库的教程。

第一项任务是能够使用以下代码在屏幕上显示图像。 (这段代码可能需要一点时间才能运行,当繁忙指示器从IPython Notebook标签中消失时,图像就准备好了。)

<! - 2 - >

from skimage。 io从skimage导入imread

。从matplotlib转换import resize

import pyplot as plt

import matplotlib。 cm = 999“example_file =(”http:// upload.wikimedia.org/“+

”wikipedia / commons / 7 / 7d / Dog_face.png“) image image = imread(example_file,as_grey =真)

PLT。 imshow(image,cmap = cm。gray)

PLT。 show()

代码首先导入一些库。然后它创建一个字符串,指向示例文件在线,并将其放置在

example_file

中。该字符串是

imread() 方法调用的一部分, as_grey 被设置为 True as_grey 参数告诉Python将彩色图像变成灰度。任何已经在灰度的图像仍然是这样。 现在您已经加载了一个图像,现在是时候渲染它(准备好在屏幕上显示了), imshow() 函数执行渲染并使用灰度色图,

> show() 功能实际上为您显示 图像 在您渲染并显示图像后,图像显示在屏幕上 完成查看后关闭图像。 ( In [*]:

项中的星号告诉您代码仍在运行,您不能继续下一步。)关闭图像的行为结束了代码段。现在有一个记忆中的图像,你可能想了解更多关于它。当您运行以下代码时,您会发现图像类型和大小:

print(“数据类型:%s,形状:%s”% (类型(图像),图像形状)) 这个调用的输出告诉你图像类型是一个

numpy。 ndarray

,图像大小为90像素×90像素。图像实际上是一个像素数组,你可以通过各种方式进行操作。例如,如果要剪裁图像,可以使用以下代码来操作图像数组:

image2 = image [5:70,0:70] plt。 imshow(image2,cmap = cm。gray) plt。显示()

numpy的。在

图像2

中的ndarray 小于 图像 中的图像,因此输出也较小。典型的结果如下所示。裁剪图像的目的是使其具有特定的尺寸。这两个图像必须是相同的大小,您可以分析它们。裁剪是确保图像尺寸正确分析的一种方法。裁剪图像使其更小。 另一种可用于更改图像大小的方法是调整其大小。以下代码将图像的大小调整为特定大小以进行分析: image3 = resize(image2,(30,30),mode =“nearest”) plt。 (image3,cmap = cm。gray)

print(“数据类型:%s,形状:%s”%

(type(image3),image3。shape))

print()

函数会告诉您图像现在大小为30像素x 30像素。您可以将它与具有相同尺寸的任何图像进行比较。

将所有图像放在合适的尺寸后,您需要将其压平。数据集行始终是单个维度,而不是两个维度。该图像目前是30像素×30像素的数组,因此您无法将其作为数据集的一部分。以下代码将

image3

变平,以使其成为存储在 image_row 中的900个元素的数组:

image_row = image3。 flatten() print(“data type:%s,shape:%s”% (type(image_row),image_row。shape)) 注意类型仍然是一个 numpy。 ndarray

。您可以将此数组添加到数据集,然后使用数据集进行分析。如预期的那样,大小是900个元素。

如何以非结构化文件格式发送数据

编辑的选择

10个惊人的Python编程资源 - 傻瓜

10个惊人的Python编程资源 - 傻瓜

您可能对Python编程有很好的开始,需要额外的资源。这里有十个令人惊叹的编程资源,您可以使用它来改善您的开发体验。在线使用Python文档使用Python的一个重要部分就是了解Python中的可用内容...

如何在Python中创建类定义

如何在Python中创建类定义

类不需要特别复杂。实际上,您可以在Python中创建容器和一个类元素,并将其称为一个类。当然,最终得到的类不会有太多的工作,但是你可以实例化它(告诉Python用你的类作为蓝图来构建一个对象),并使用它来处理它...

如何在Python中访问列表 - 傻瓜

如何在Python中访问列表 - 傻瓜

使用Python创建列表后,要访问信息它包含。一个对象不是特别有用,如果你至少不能访问它所包含的信息。以下步骤描述了如何做到这一点。

编辑的选择

如何在Excel 2013中复制自定义样式 - 傻瓜

如何在Excel 2013中复制自定义样式 - 傻瓜

Excel 2013可以轻松复制自定义单元样式您已经将其作为一个工作簿的一部分保存到您当前正在处理的工作簿中。要将自定义样式从一个工作簿复制到另一个工作簿,请按照下列步骤:

如何使用填充柄复制Excel公式 - 虚拟人

如何使用填充柄复制Excel公式 - 虚拟人

您将喜欢填充柄在Excel中。填充句柄是一个快速的方法,只需单击一下鼠标,即可将单元格的内容复制到其他单元格。活动单元格的边界右下方总是有一个小方框。那是填充句柄。当你...

如何比较Excel 2013中的多个工作表 - Excel 2013中的虚拟人数

如何比较Excel 2013中的多个工作表 - Excel 2013中的虚拟人数

,可以拆分单个工作簿到工作表窗口中,然后排列窗口,以便您可以查看屏幕上每个工作表的不同部分。要打开要在不同窗口中比较的工作表,只需插入新的工作簿窗口,然后选择工作表即可...

编辑的选择

监视WebLogic Server - 虚拟机

监视WebLogic Server - 虚拟机

监视服务器是每个WebLogic Server管理员必须处理的重要任务。您将监视您的服务器是否启动以及服务器负载。通过监视,您可以快速查看WebLogic Server不同部分如何执行的概述。通过WebLogic Server,您可以监视以下区域:CORBA ...

测量用于机器学习的矢量之间的相似性 - 虚拟

测量用于机器学习的矢量之间的相似性 - 虚拟

把他们当作一个媒介。以下信息描述了如何测量矢量之间的相似性以执行诸如计算用于学习目的的矢量之间的距离等任务。理解相似性在矢量形式中,您可以在...中看到每个变量。

前10名MATLAB的使用MATLAB

前10名MATLAB的使用MATLAB

MATLAB被许多不同的人使用当谈到数学产品时,可能不一定会想到。事实上,数学的使用方式很多人都没有考虑。工程新的解决方案许多工程学科依靠各种数学来确保...