个人理财 把你的大数据放在一起 - 傻瓜

把你的大数据放在一起 - 傻瓜

目录:

视频: 【胡说#151】YouTube内容创业:如何在视频中正确请求订阅/转发/点赞?别把你的观众当傻瓜! 2025

视频: 【胡说#151】YouTube内容创业:如何在视频中正确请求订阅/转发/点赞?别把你的观众当傻瓜! 2025
Anonim

您如何知道如何将所有数据放在一起?通过一个大数据项目,您想要对结构化和非结构化数据进行什么操作,可以说明为什么您可以选择一项技术而不是另一项技术。它也决定了理解入站数据结构以将这些数据放在正确位置的必要性。

管理大数据的不同数据类型

您需要考虑大数据的一些特征以及您可能希望用于处理每个数据的数据管理系统的类型。

<! - 1 - >

将数据类型集成到大数据环境中

大数据的另一个重要方面是,您通常不需要拥有将要使用的所有数据。很多例子都说明了这一点。您可能会利用社交媒体数据,来自第三方行业统计的数据,甚至是来自卫星的数据。只要想想社交媒体,你就会明白。

<! - 2 - >

经常需要整合不同的来源。这些数据可能来自内部和外部的所有内部系统,也可能来自外部。这些数据中的大部分可能以前都是孤立的。数据不需要实时来找你。你可能会有很多,它本质上是不同的。这仍然可以作为一个大数据问题。当然,你也可能面临一个场景,你看到大量的数据,高速运行,而且本质上是完全不同的。

重点在于,如果将各种数据源作为一组断开连接的信息处理,您将无法获得业务价值。

您需要的组件包括连接器和元数据。

连接器

您希望有一些连接器使您能够从各种大数据源中提取数据。也许你想要一个Twitter连接器或Facebook的。也许你需要从你的数据仓库中集成一个远离你的前提的大数据源,以便你可以一起分析这两个数据源。

元数据

集成所有这些数据的关键组件是元数据。

元数据 是用于描述如何查找,访问和使用公司的数据(和软件)组件的定义,映射和其他特征。元数据的一个例子是关于账号的数据。这可能包括号码,说明,数据类型,姓名,地址,电话号码和隐私级别。元数据可用于帮助您组织数据存储并处理新的和不断变化的数据源。尽管元数据的概念并不新鲜,但在大数据背景下正在发生变化和演变。在传统的元数据世界中,有一个提供所有数据源的单一视图的目录是很重要的。 但是当你不控制所有这些数据源时,这个目录必须有所不同。您可能需要一个分析工具来帮助您了解底层的元数据。

把你的大数据放在一起 - 傻瓜

编辑的选择

记录您的思科网络配置与CDP - 傻瓜

记录您的思科网络配置与CDP - 傻瓜

记录思科网络配置有时没有思科发现协议)可能需要花费数小时在布线室跟踪电缆和记录端口。在某些情况下,配线室是一个真正的老鼠的电缆巢,并且可能需要几个小时的导航才能找出哪些交换机连接到哪个交换机,哪些路由器,...

以太网通道诊断信息收集 - 虚拟

以太网通道诊断信息收集 - 虚拟

诊断思科网络中的以太网通道问题,您首先必须能够收集您的交换机及其配置。为了执行这个任务,你一如既往地依靠Show和debug命令。首先,简要介绍一下show命令的内容。 Switch1> enable Switch1#configure terminal Switch2#show EtherChannel ...

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL)允许您允许拒绝来自特定IP地址的流量到特定的目标IP地址和端口。它还允许您指定不同类型的流量,如ICMP,TCP,UDP等。不用说,它非常细化,可以使您非常具体。如果...

编辑的选择

电子项目计划步骤1:设想您的电子项目 - 傻瓜

电子项目计划步骤1:设想您的电子项目 - 傻瓜

设计和建立你的电子项目的细节,你应该退后一步,看看大局。首先,你需要确保你有一个坚实的想法为您的项目。你为什么要建立它?它会做什么,谁来使用它,为什么? ...

电子项目计划步骤4:构建您的电路 - 傻瓜

电子项目计划步骤4:构建您的电路 - 傻瓜

而且你对它的操作感到满意,你可以建立一个永久版本的电路。虽然有几种方法可以做到这一点,但最常见的是在印刷电路板(也称为PCB)上构建电路。请注意,在PCB上组装电路...

电子项目计划步骤3:原型电路 - 假人

电子项目计划步骤3:原型电路 - 假人

永久的电路板,你会想确保它的工作。最简单的方法就是在无焊面包板上构建电路。无焊料面包板可以让您快速组装电路元件而不需要焊接任何东西。相反,您只需将其裸露在外...

编辑的选择

如何替换R中的文本 - 虚拟变量

如何替换R中的文本 - 虚拟变量

R中的sub()函数在文本模式,并用替换文本替换此模式。你使用sub()来替代文本文本,并使用其表兄gsub()来替换所有出现的模式。 (gsub()中的g表示全局。)假设你有句子He ...

中如何成功地遵循命名惯例在R - 傻瓜

中如何成功地遵循命名惯例在R - 傻瓜

R是非常自由的,对象和功能。这个自由是一个很大的祝福,同时也是一个很大的负担。没有人不得不遵循严格的规则,所以在R中编程的人基本上可以按照自己的意愿去做。如何选择一个正确的名字...

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

再次使用前面显示的Source()命令将其加载到控制台中。现在你看...什么也没有。 R并不让你知道它已经加载了这个函数,但它已经在工作空间中了,你可以检查一下...