个人理财 如何设置大数据架构基础 - 虚拟变量

如何设置大数据架构基础 - 虚拟变量

目录:

视频: 丘成桐对人工智能、大数据、量子计算的权威点评 2025

视频: 丘成桐对人工智能、大数据、量子计算的权威点评 2025
Anonim

如果您希望获得大数据的成功,奠定坚实的架构基础至关重要。除了支持功能要求外,支持所需的性能也很重要。您的需求将取决于您所支持的分析的性质。你将需要适量的计算能力和速度。

您的架构还必须具有适量的冗余,以免受到意外延迟和停机时间的影响。

<! - 1 - >

首先问自己以下问题:

  • 您的组织今天和将来需要管理多少数据?

  • 您的组织多长时间需要实时或接近实时地管理数据?

  • 您的组织承担多少风险?您的行业是否受到严格的安全性,合规性和治理要求?

  • 速度对于管理数据的需求有多重要?

  • 数据有多确切或精确?

大数据的接口和提要

为了理解现实世界中的大数据如何工作,首先了解接口和提要的必要性。事实上,让大数据变得更大的是,它依赖于从很多来源获取大量数据。

<!因此,开放的应用程序编程接口(API)将成为任何大数据架构的核心。另外,请记住,接口存在于每个层次和堆栈的每一层之间。没有整合服务,大数据就不可能发生。冗余大数据物理基础设施

支持物理基础设施是大数据架构的操作和可扩展性的基础。事实上,如果没有强大的物理基础设施,大数据可能不会成为如此重要的趋势。为了支持意外或不可预测的数据量,大数据的物理基础设施必须与传统数据的物理基础设施不同。物理基础设施基于分布式计算模型。这意味着数据可能被物理地存储在许多不同的位置,并且可以通过网络,使用分布式文件系统以及各种大数据分析工具和应用程序来链接在一起。冗余是重要的,因为你正在处理来自这么多不同来源的大量数据。冗余有多种形式。如果您的公司已经创建了私有云,您将希望在私有环境中构建冗余,以便可以扩展以支持不断变化的工作负载。

如果贵公司想要控制内部IT增长,则可能会使用外部云服务来增加其内部资源。在某些情况下,这种冗余可能以软件即服务(SaaS)产品的形式出现,允许公司将复杂的数据分析作为服务。 SaaS方法提供了更低的成本,更快的启动速度以及底层技术的无缝发展。

大数据安全基础设施

对企业来说越重要的大数据分析,保护这些数据就越重要。例如,如果您是一家医疗保健公司,您可能希望使用大数据应用程序来确定人口统计变化或患者需求变化。这些有关您的选民的数据需要得到保护,以满足合规要求并保护患者的隐私。

您需要考虑允许哪些人查看数据,以及在什么情况下允许他们这样做。您需要能够验证用户的身份以及保护患者的身份。

可操作的大数据源

重要的是要了解必须包含所有数据来源,才能让您全面了解业务情况,并了解数据如何影响业务运营方式。随着世界的变化,重要的是要了解运营数据现在必须包含更广泛的数据源,包括非结构化数据源,例如各种形式的社交媒体数据。您可以在大数据世界找到新兴的数据管理方法,包括文档,图形,列和地理空间数据库体系结构。这些统称为

NoSQL,

或不只是SQL数据库。实质上,您需要将数据架构映射到事务类型。

这样做有助于确保

正确的

数据在您需要时可用。您还需要支持复杂的非结构化内容的数据体系结构。您需要在处理大数据的方法中包含关系数据库和非关系数据库。还需要包括内容管理系统等非结构化数据源,以便您能够接近360度的业务视图。 所有这些操作数据源都有几个共同的特征: 它们代表记录系统,用于跟踪企业的实时日常操作所需的关键数据。

它们会根据业务单位内部和网络上发生的交易而不断更新。对于这些来源提供业务的准确表示,他们必须混合结构化和非结构化数据。 这些系统还必须能够进行扩展,以便在一致的基础上支持数千个用户。这些可能包括交易电子商务系统,客户关系管理系统或呼叫中心应用程序。

如何设置大数据架构基础 - 虚拟变量

编辑的选择

记录您的思科网络配置与CDP - 傻瓜

记录您的思科网络配置与CDP - 傻瓜

记录思科网络配置有时没有思科发现协议)可能需要花费数小时在布线室跟踪电缆和记录端口。在某些情况下,配线室是一个真正的老鼠的电缆巢,并且可能需要几个小时的导航才能找出哪些交换机连接到哪个交换机,哪些路由器,...

以太网通道诊断信息收集 - 虚拟

以太网通道诊断信息收集 - 虚拟

诊断思科网络中的以太网通道问题,您首先必须能够收集您的交换机及其配置。为了执行这个任务,你一如既往地依靠Show和debug命令。首先,简要介绍一下show命令的内容。 Switch1> enable Switch1#configure terminal Switch2#show EtherChannel ...

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL) - 虚拟

扩展访问控制列表(ACL)允许您允许拒绝来自特定IP地址的流量到特定的目标IP地址和端口。它还允许您指定不同类型的流量,如ICMP,TCP,UDP等。不用说,它非常细化,可以使您非常具体。如果...

编辑的选择

电子项目计划步骤1:设想您的电子项目 - 傻瓜

电子项目计划步骤1:设想您的电子项目 - 傻瓜

设计和建立你的电子项目的细节,你应该退后一步,看看大局。首先,你需要确保你有一个坚实的想法为您的项目。你为什么要建立它?它会做什么,谁来使用它,为什么? ...

电子项目计划步骤4:构建您的电路 - 傻瓜

电子项目计划步骤4:构建您的电路 - 傻瓜

而且你对它的操作感到满意,你可以建立一个永久版本的电路。虽然有几种方法可以做到这一点,但最常见的是在印刷电路板(也称为PCB)上构建电路。请注意,在PCB上组装电路...

电子项目计划步骤3:原型电路 - 假人

电子项目计划步骤3:原型电路 - 假人

永久的电路板,你会想确保它的工作。最简单的方法就是在无焊面包板上构建电路。无焊料面包板可以让您快速组装电路元件而不需要焊接任何东西。相反,您只需将其裸露在外...

编辑的选择

如何替换R中的文本 - 虚拟变量

如何替换R中的文本 - 虚拟变量

R中的sub()函数在文本模式,并用替换文本替换此模式。你使用sub()来替代文本文本,并使用其表兄gsub()来替换所有出现的模式。 (gsub()中的g表示全局。)假设你有句子He ...

中如何成功地遵循命名惯例在R - 傻瓜

中如何成功地遵循命名惯例在R - 傻瓜

R是非常自由的,对象和功能。这个自由是一个很大的祝福,同时也是一个很大的负担。没有人不得不遵循严格的规则,所以在R中编程的人基本上可以按照自己的意愿去做。如何选择一个正确的名字...

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

中使用函数在R中创建并转换脚本后,如何使用R - dummies中的函数

再次使用前面显示的Source()命令将其加载到控制台中。现在你看...什么也没有。 R并不让你知道它已经加载了这个函数,但它已经在工作空间中了,你可以检查一下...